第一篇:讓 Nutch 支援中文分詞 方法教學 Nutch 1.0 + IK-Analyzer 3.1.6 中文分詞庫
讓 Nutch 支援中文分詞 方法教學Nutch 1.0 + IK-Analyzer 3.1.6 中文分詞庫
1.前言
2.何謂中文分詞
3.方法
1.修改程式碼
2.重編 nutch
3.開始使用
4.完成1.選項:加入字典檔
2.資訊不正確或麻煩
前言
Nutch 1.0 + IK-Analyzer 3.1.6 中文分詞庫 的詳細方法? 本篇參考,並且修正與補充? 何謂中文分詞
中文自動分詞指的是使用計算機自動對中文文本進行詞語的切分,即像英文那樣使得中文句子中的詞之間有空格以標識。中文自動分詞被認為是中文自然語言處理中的一個最基本的環(huán)節(jié)。
簡單來說,以“今天天氣真好”這段字而言,若搜尋“氣真”沒有中文分詞的結果為:1筆 => 今天天氣真好
? 有中文分詞:0筆(因為詞庫為今天、天天、天氣、真、真好、好)? 下面的例子即為,透過完成括充中文分詞(ik-analyzer)之後的nutch搜尋引擎,對“國家高速網(wǎng)路中心”的首頁(http://004km.cn.tw/tw/)作資料爬取,並以此為搜尋資料庫。
搜尋“中心”兩字 有74筆資料,但搜尋單一一個“心”字只有 4筆資料;反觀若是沒有經(jīng)過中文分詞,則單搜尋“心”必定比搜尋“中心”的資料更多
1.搜尋 中心 這個字串
2.單搜尋 心 這個字
3.搜尋 “冀此” 或單獨 “冀” 都沒有資料
ps : 搜尋“希冀”才會有資料
方法
?
你下載nutch-1.0 並解壓縮的資料如:$nutch-1.0/夾目錄位址,也是用來重編nutch的/home/user/nutch-1.0/資料夾原有的nutch資料夾,接著會被擴充$my_nutch_dir/opt/nutchez/nutch/ika中文詞庫
原本被用來放nutch網(wǎng)頁(在tomcat$my_tomcat_dir/opt/nutchez/tomcat內)的資料夾
修改程式碼
? 安裝必要工具(java 已經(jīng)安裝)
sudo apt-get install javacc unrar ant
? 修改NutchAnalysis.jj 約130行左右的程式碼(原本為:| cd $nutch-1.0/ vim src/java/org/apache/nutch/analysis/NutchAnalysis.jj | 用編譯器 javacc 編譯出七個java檔 ? CharStream.javaNutchAnalysisTokenManager.java TokenMgrError.java ? NutchAnalysisConstants.javaParseException.java ? NutchAnalysis.javaToken.java cd $nutch-1.0/src/java/org/apache/nutch/analysis ? javacc-OUTPUT_DIRECTORY=./ika/ NutchAnalysis.jj mv./ika/*./;rm-rf./ika/ ? 編譯剛編出來的.java vim $nutch-1.0/src/java/org/apache/nutch/analysis/NutchAnalysis.java ? 在第48行加入ParseException: public static Query parseQuery(String queryString, Configuration conf)throws IOException,ParseException 在第54行加入ParseException: ?throws IOException,ParseException { ? ? 下載 IKAnalyzer3.1.6GA.jar 解壓縮 o nutch 1.0 用的是 lucene 2.4.0 hadoop 0.19 o 因此ik分詞器最新僅能用 3.1.6ga(3.2.0GA 以上版本只支援 lucene 2.9以上版本) cd $nutch-1.0/ wget http://ik-analyzer.googlecode.com/files/IKAnalyzer3.1.6GA_AllInOne.rar mkdir ika unrar x./IKAnalyzer3.1.6GA_AllInOne.rar ika/ ? 分別放到以下三個資料夾 用來重新編譯nutch 用來給 nutch 進行 crawl時所匯 入函式庫$nutch-1.0/lib/$my_nutch_dir/lib/ 用來給網(wǎng)頁的搜尋介面使用的函$my_tomcat_dir/webapps/ROOT/WEB-INF/lib式庫 cp ika/IKAnalyzer3.1.6GA.jar lib/ cp $nutch-1.0/lib/IKAnalyzer3.1.6GA.jar $my_nutch_dir/lib/ cp $nutch-1.0/lib/IKAnalyzer3.1.6GA.jar $my_tomcat_dir/webapps/ROOT/WEB-INF/lib ? 修改 NutchDocumentAnalyzer.java 程式碼 cd $nutch-1.0/ vim src/java/org/apache/nutch/analysis/NutchDocumentAnalyzer.java 將 public TokenStream tokenStream(String fieldName, Reader reader){Analyzer analyzer; if(“anchor”.equals(fieldName)) analyzer = ANCHOR_ANALYZER; else analyzer = CONTENT_ANALYZER; return analyzer.tokenStream(fieldName, reader); } 修改成public TokenStream tokenStream(String fieldName, Reader reader){Analyzer analyzer = new org.wltea.analyzer.lucene.IKAnalyzer();return analyzer.tokenStream(fieldName, reader); } ? 修改 build.xml,在 cd $nutch-1.0/ vim build.xml 重編 nutch ? 重新編譯 nutch-1.0 ant ? 完成則多一個資料夾 build,o build/ 目錄裡面的 nutch-job-1.0.job 就是重編後的核心 ant jar;ant war ? 分別產(chǎn)生 build/nutch-xxx.jar 與 build/nutch-xxx.war 開始使用 ? 最後,將nutch-job-1.0.jar複製到我的nutchez資料夾內取代使用 o(下面的步驟小心的把原本的job作備份,也可以不用,改用新編 出來的直接取代) cd $nutch-1.0/ mv $my_nutch_dir/nutch-1.0.job $my_nutch_dir/nutch-1.0-ori.job cp build/nutch-1.0.job $my_nutch_dir/nutch-1.0-ika-waue-100715.job ln-sf $my_nutch_dir/nutch-1.0-ika-waue-100715.job $my_nutch_dir/nutch-1.0.job ? 把nutch-1.0.war(原本nutch附的即可),解壓縮後放在你的tomcat 目錄內(以下用 $my_tomcat_dir 代表我tomcat的實際目錄)的/webapps/ROOT/中,並且再把“IKAnalyzer3.1.6GA.jar”、新編的“nutch-1.0.jar” 放進 $my_tomcat_dir/webapps/ROOT/WEB-INF/lib 還有 $my_nutch_dir/lib/ 內 cd $nutch-1.0/ cp $nutch-1.0/build/ $my_nutch_dir/lib/ cd $my_tomcat_dir/webapps/ROOT/WEB-INF/lib cp $nutch-1.0/build/nutch-1.0.jar./ cp $nutch-1.0/lib/IKAnalyzer3.1.6GA.jar./ ? 最後用nutch 的 crawl 抓取網(wǎng)頁,搜索的結果就是按ik分過的中文詞完成? ? 爬取後的資料就會依照中文分詞來分。中文分詞之後的結果並不會比較多,反而更少。但是精簡過後的搜尋結果 才能提供更準確的搜尋內容。 選項:加入字典檔 將 nutch-*.job 的檔案,用zip 工具解開,並將以下兩個檔案放入nutch-*.job 中即可 ? ? ? ? ? ? IKAnalyzer.cfg.xml ? 國家高速 ? 國家高速網(wǎng)路 ? 國家高速網(wǎng)路與計算中心 資訊不正確或麻煩 接著將 build/classes 內的程式碼打包起來,建立nutch-1.0-ika.jar 函式庫(麻煩,根本不需要) ? cd $nutch-1.0/build/classes ? jar cvf nutch-1.0-ika.jar.? cp nutch-1.0-ika.jar /opt/nutchez/nutch/lib/ ? ? 即使用原始的nutch所crawl下來的資料,將 重編後的nutch-1.0.jar nutch-1.0.job IKAnalyzer3.1.6 正確放到你原本的nutch搜尋網(wǎng)頁中,重新啟動tomcat後,也可直接享用有分詞的結果(不正確) 將 IKAnalyzer3.1.6GA.jar 的 /org/wltea/analyzer/dic/ 資料夾內,放入你要得字典檔,可以參考同資料夾內的 main.dic(不正確,沒用)? Attachments (162.6 kB)added by waueago.?(13.7 kB)added by waueago.? Download in other formats: ? 同義詞庫 天昏地暗=暗無天日 竊笑=暗笑 陰影=暗影 切口=暗語 黑暗=暗中 邋遢=骯臟 抬頭=昂首 傲睨一世=昂首望天 高昂=昂揚 洼地=凹地 高低=凹凸 折磨=熬煎 鍛煉=熬煉 飛翔=翱翔 高傲=傲岸 狂妄=傲慢 渺視=傲睨 傲世輕物=傲睨萬物 傲睨萬物=傲睨一世 傲睨萬物=傲世輕物 睥睨=傲視 堅貞不屈=傲雪欺霜 驕兵必敗=傲卒多敗 驕兵必敗=傲卒多降 秘密=奧秘 秘密=奧密 玄妙=奧妙 悔恨=懊悔 煩惱=懊惱 悔恨=懊喪 四行孤軍=八百壯士 才高八斗=八斗之才 四面楚歌=八方受敵 八棍子撂不著=八竿子打不著 陳腔濫調=八股 稀奇古怪=八怪七喇 八竿子打不著=八棍子撂不著 不相上下=八兩半斤 五花八門=八門五花 八面玲瓏=八面見光 八面見光=八面玲瓏 四面楚歌=八面受敵 氣勢洶洶=八面威風 發(fā)草帖=八字帖 逢迎=巴結 渴望=巴望 翦綹=扒手 廢除=拔除 起錨=拔錨 適得其反=拔苗助長 選取=拔取 扶植=拔擢 猖=跋扈 進退失據(jù)=跋前疐后 動輒得咎=跋前躓后 后記=跋文 促膝談心=把臂而談 痛處=把柄 操縱=把持 切脈=把脈 看管=把守 戲弄=把玩簸弄 當心=把穩(wěn) 駕馭=把握 花招=把戲 歇工=罷工 而已=罷了 撤職=罷免 歇手=罷手 放手=罷休 蠻橫=霸道 機謀=霸術 攻克=霸占 呆子=白癡 白費=白搭 鶴發(fā)=白發(fā) 皓首蒼顏=白發(fā)蒼顏 龐眉皓發(fā)=白發(fā)銀須 白搭=白費 枉費心機=白費心血 口語=白話 光陰似箭=白駒過隙 石蠟=白臘 洋蠟=白蠟 白天=白日 白日升天=白日飛升 白日飛升=白日升天 空手=白手 自食其力=白手起家 老人=白叟 白晝=白天 白凈=白皙 滄海桑田=白云蒼狗 碧眼兒=白種人 白天=白晝 利劍=白 千般=百般 百發(fā)百中=百步穿楊 扶搖直上=百尺竿頭 有口難言=百辭莫辯 矢無虛發(fā)=百發(fā)百中 民生凋敝=百孔千瘡 合家=百口 寥寥無幾=百里挑一 千了百當=百了千當 鴨蛋雖密也有縫=百密一疏 大惑不解=百思不解 童言無忌=百無禁忌 黎民=百姓 視為心腹=百依百順 勢如破竹=百戰(zhàn)百勝 一往直前=百折不回 百折不回=百折不撓 左右=擺布 動搖=擺蕩 搭架子=擺架子 排列=擺列 部署=擺設 開脫=擺脫 腐敗=敗北 松弛=敗壞 傾家蕩產(chǎn)=敗盡家業(yè) 莠民=敗類 敗事=敗露 敗露=敗事 沒趣=敗興 劣行=敗行 換帖兄弟=拜把兄弟 離別=拜別 造訪=拜訪 求神拜鬼=拜鬼求神 訪問=拜候 參見=拜見 賀年=拜年 托付=拜托 訪候=拜望 拜望=拜謁 糾纏不清=扳纏不清 攀談=扳話 連累=扳連 交談=扳談 布鼓雷門=班門弄斧 凱旅=班師 盤游=般游 頒發(fā)=頒布 宣布=頒布發(fā)表 發(fā)表=頒發(fā) 花白=斑白 雀斑=斑點 美麗=斑斕 花紋=斑紋 搬家=搬場 挪動轉移=搬動 搬遷=搬家 挑釁=搬弄 挑撥離間=搬弄是非 搬家=搬遷 木屋=板屋 呆滯=板滯 邦畿=版圖 措施=辦法 孔方兄=阿堵物 福壽膏=阿芙蓉 那個=阿誰 姨媽=阿姨 諂諛=阿諛 攀龍趨鳳=阿諛奉承 攀龍趨鳳=阿諛奉迎 愁腸寸斷=哀腸百轉 悲悼=哀悼 懇求=哀告 悲啼=哀號 災民=哀鴻 百孔千瘡=哀鴻遍野 憫惻=哀憐 懇求=哀求 悲悼=哀傷 悲痛=哀思 悲傷=哀痛 順序=挨次 受餓=挨餓 靠攏=挨近和藹可親=藹然可親 求賢若渴=愛才如命 求賢若渴=愛才若命 一毛不拔=愛財如命 尊崇=愛崇 戀慕=愛戴 喜好=愛好 敬服=愛護 珍惜=愛護保重 戀慕=愛慕 寵姬=愛妾 戀愛=愛情 己饑己溺=愛人如己 敬服=愛惜 居安思危=安不忘危 漫步=安步 緩步徐行=安步當車 布置=安插 順產(chǎn)=安產(chǎn) 穩(wěn)固=安定 布置=安頓 安頓=安放 循分=安分 安守故常=安分守己 循規(guī)蹈矩=安分守紀 撫慰=安撫 寧靜=安好 克紹箕裘=安家立業(yè) 安定=安靖平靜=安靜平靜=安靜冷靜僻靜 安身立命=安居樂業(yè) 愉逸=安樂 安定=安謐 安息=安眠 安定=安寧 擺設=安排 寧靜=安全平安=安然平和=安然平靜平安無事=安然無事平安無事=安然無恙 固若金湯=安如盤石 固若金湯=安如泰山 十拿九穩(wěn)=安若泰山 安置=安設 立足=安身 安居樂業(yè)=安身立命 寧靜=安適 安分守己=安守故常 安樂=安泰 妥當=安妥 同甘共苦=安危與共 慰藉=安慰 牢固=安穩(wěn) 歇息=安息 安逸=安閑 寧靜=安詳平靜=安祥 歇息=安歇 放心=安心 清閑=安逸 扎營=安營 自暴自棄=安于現(xiàn)狀 何在=安在 埋葬=安葬 高枕無憂=安枕無憂 怎知=安知 布置=安置 安置=安裝 循規(guī)蹈矩=按部就班 順序=按次 照例=按例 推拿=按摩 抑制=按捺 定期=按期 定時=按時 刻舟求劍=按圖索驥 順次=按序 根據(jù)=按照 文案=案牘 檔冊=案卷 悄悄=暗暗 潛伏=暗藏 暗流=暗潮 昏暗=暗淡 慘淡=暗澹 冷戰(zhàn)=暗斗 陰溝=暗溝 謀害=暗害 燈號=暗號 燈號=暗記 冷箭=暗箭 含沙射影=暗箭傷人 私下=暗里 暗潮=暗流 辦妥=辦好 管理=辦理 服務=辦事 辦好=辦妥 豆剖瓜分=半壁江山 旗鼓相當=半斤八兩 片刻=半晌 對折=半數(shù) 中途=半途 功敗垂成=半途而廢 欲言又止=半吐半吞 不即不離=半推半就 將信將疑=半信半疑 子夜=半夜 東床=半子 伙計=伴計 朋友=伴侶 陪同=伴隨 隨同=伴同 飾演=扮演 化裝=扮裝 拌雜=拌合 拌合=拌雜 國脈=邦本 版圖=邦畿 國家榮譽=邦家之光 國交=邦交 光顧=幫襯 幫助=幫忙 幫忙=幫手 資助=幫助 捆綁=綁縛 署書=榜書 模范=榜樣 當中=傍邊 旁觀=傍觀 歪路=傍門 目中無人=傍若無人 薄暮=傍晚 篾片=傍友 包攬=包辦 容隱=包庇 心懷叵測=包藏禍心 包圍=包抄 保證=包管 包羅=包含 包容=包涵 包羅=包括 包辦=包攬 包括=包羅 應有盡有=包羅萬象 包涵=包容 困繞=包圍 包括=包孕 批駁=褒貶 寶物=寶貝 名貴=寶貴 大札=寶緘 浮圖=寶塔 寶貝=寶物 銅山=寶穴 堅苦卓絕=飽經(jīng)風霜 饜飫=飽食 警衛(wèi)=保鑣 收藏=保藏 連結=保持 生存=保存 掩護=保護 推薦=保舉 保存=保留 守舊=保守 守衛(wèi)=保衛(wèi) 調養(yǎng)=保養(yǎng) 包管=保證 營壘=堡壘 人為=報酬 報酬=報答 抨擊=報復 陳訴=報告 匯報=報告請示 應命=報命 道歉=報歉 得病=抱病 行俠仗義=抱不平固步自封=抱殘守缺 理想=抱負 懷愁=抱恨 抱歉=抱愧 歉仄=抱歉 抱冤=抱屈 捧頭=抱頭 狼狽而逃=抱頭鼠竄 抱屈=抱冤 訴苦=抱怨 遁世=豹隱 **=暴動 狂風=暴風 罪惡滔天=暴戾恣睢 袒露=暴露 原形畢露=暴露無遺 暴動=** 狠毒=暴虐 大發(fā)雷霆=暴跳如雷 歹徒=暴徒 急躁=暴躁 虐政=暴政 發(fā)作=爆發(fā) 爆竹=爆仗 爆仗=爆竹 鄙俚=卑鄙 卑躬屈膝=卑恭屈節(jié) 奴顏媚骨=卑躬屈膝 猥賤=卑賤 卑鄙=卑劣 鬼蜮伎倆=卑劣手段 奴視=卑視 草木皆兵=杯弓蛇影 人浮于事=杯水車薪 悲痛=悲哀 悲涼=悲慘 追悼=悲悼 灰心=悲觀 離合悲歡=悲歡離合 悲慘=悲涼 楚切=悲凄 悲傷=悲戚 悲啼=悲泣 傷心=悲傷 嘆傷=悲嘆 悲泣=悲啼 悲痛=悲慟 悲傷=悲痛 碑帖=碑本 碑本=碑帖 斗極=北斗 寒風=北風 勾欄=北里 存案=備案 破釜沉舟=背城借一 南轅北轍=背道而馳 后手=背工 配景=背景 反面=背面 叛逆=背叛 背約=背信 背信=背約 孤注一擲=背注一擲 受寵若驚=被寵若驚 受騙=被騙 當選=被選 奔忙=奔波 奔跑=奔馳 曠達=奔放 奔馳=奔跑 奔馳=奔騰 驅馳=奔走 跋山涉水=奔走風塵 當?shù)?本地 土產(chǎn)=本地貨 天職=本分 祖籍=本籍 同族=本家 正事主=本家兒 原來=本來 本事=本領 舍本逐末=本末倒置 本末倒置=本末顛倒 職能=本能機能 今年=本年 資本=本錢 即日=本日 實質=本色 自己=本身 本領=本事 正事主=本事兒 個人主義=本位主義 真相=本相 本旨=本心 天性=本性 個性難改=本性難移 本心=本意天良 來源根基=本原 本心=本旨 素質=本質 簿本=本子 笨蛋=笨伯 笨伯=笨蛋 傻里傻氣=笨頭笨腦 鳩拙=笨拙 瓦解=崩潰 傾圯=崩裂 迫近=逼近迫良為娼=逼良為娼 欺壓=逼迫 鋌而走險=逼上梁山 傳神=逼真 始祖=鼻祖 觸目皆是=比比皆是 比喻=比方 等到=比及 比力=比較 最近=比來 比較=比力 同等看待=比量齊觀 相比=比擬 連年=比年 比歲不登=比年不登 好比=比如 角逐=比賽 指手畫腳=比手劃腳 比年不登=比歲不登 交鋒=比武 夫唱婦隨=比翼雙飛 青天=彼蒼 相互=彼此 揮灑自如=筆底生花 賣文為活=筆耕墨耘 字跡=筆跡 條記=筆記 憑單=筆據(jù) 翰墨=筆墨 筆挺=筆直 鸞翔鳳翥=筆走龍蛇 管見=鄙見 卑鄙=鄙俚 吝嗇=鄙吝 猥瑣=鄙陋 唾棄=鄙棄 在下=鄙人 藐視=鄙視 卑鄙=鄙俗 俗不可耐=鄙俗不堪 粗言=鄙言 俗語=鄙諺 鄙視=鄙夷 愚見=鄙意 迫不得已=必不得已 肯定=必定 恭恭敬敬=必恭必敬 一定=必然 必須=必需 須要=必要 終究=畢竟 斷命=畢命 一舉而竟全功=畢其功于一役 終生一生沒世=畢生 結業(yè)=畢業(yè) 緘口=閉口 緘口結舌=閉口無言 杜門不出=閉門不出 關門落鎖=閉門塞竇 憑空捏造=閉門造車 解散=閉幕 花容月貌=閉月羞花 保護=庇護 蔭庇=庇蔭 寒家=敝宅 毛病=弊端 蔥蘢=碧綠 白種人=碧眼兒 避忌=避諱 逃難=避禍 避諱=避忌 制止=避免 遁跡=避難 躲債=避債 邊疆=邊陲 相貌=邊幅 界限=邊界 疆域=邊境 邊沿=邊緣 主筆=編緝 輯錄=編錄 紀年=編年 點竄=編削 體例=編制 編輯=編纂 入木三分=鞭辟入里 推動=鞭策 鞭笞=鞭撻 跌價=貶價 抑低=貶抑 便利=便當 燕服=便服 私函=便函 方便=便利 即是=便是 條子=便條 自制=便宜 釀成=變成 變更=變動 厘革=變革 變動=變更 變革=變化 變化無窮=變化多端 變化多端=變化無窮 幻化=變幻 變化多端=變幻莫測 變更=變換 背叛=變節(jié) 事故=變亂 失常=變態(tài) 各處=遍地 普遍=遍及 體無完膚=遍體鱗傷 剖白=辨白 鑒別=辨別 辯解=辯白 反駁=辯駁 談鋒=辯才 辯說=辯論 辯論=辯說 特出=彪炳 斥候=標兵 方向=標的目的 標志=標記 標記=標識表記標幟 題目=標題問題 別開生面=標新立異 口號=標語 標記=標志 漂亮=標致 尺度=標準 表明=表白 內外=表里 暴露=表露 楷模=表率 外貌=表面 評釋=表明 心情=表情 表現(xiàn)=表示 亮相=表態(tài) 體現(xiàn)=表現(xiàn) 演出=表演 表彰=表揚 表揚=表彰 別開生面=別出機杼 自出機杼=別出心裁 外傳=別傳 另外=別的 別名=別號 別開生面=別具一格 別出心裁=別開生面 分別=別離 又名=別名 野史=別史 一無長物=別無長物 剖辨=別析 醉翁之意=別有用心 新奇=別致 來賓=賓客 賓朋盈門=賓客盈門 三千珠履=賓客盈庭 賓朋盈門=賓朋迎門 賓朋迎門=賓朋盈門 擯棄=擯斥 驅逐=擯除 屏棄=擯棄 光風霽月=冰壺秋月 酷寒=冰冷 冷面=冰臉 冰冷=冰涼 龍腦=冰片 不染纖塵=冰清玉潔 水火不容=冰炭不洽 雪窖冰天=冰天雪地 叛亂=兵變 師出無名=兵出無名 軍多將廣=兵多將廣 兵書=兵法 打仗=兵戈 艨艟=兵艦 軍力=兵力 戎馬=兵馬 武器=兵器 戰(zhàn)士=兵士 兵法=兵書 佳兵不祥=兵兇戰(zhàn)危 虎帳=兵營 軍種=兵種 承襲=秉承 而且=并且 草衣木食=并日而食 獨一無二=并世無雙 霸占=并吞 垂死=病篤 禍國殃民=病國殃民 全愈=病愈 醫(yī)院=病院 貨郎鼓=撥浪鼓 盤弄=撥弄 顛簸=波動 波濤=波瀾 洶涌澎湃=波瀾壯闊 海浪=波浪 妨害=波折 褫奪=剝奪 否極必泰=剝極必復 聚斂=剝削 吸血蟲=剝削者 昆季=伯仲 駁倒=駁斥 駁斥=駁倒 非難=駁詰 靠岸=泊岸 停車=泊車 怫然作色=勃然變色 來路貨=舶來品 泛愛=博愛 贏得=博得 博學多聞=博古通今 展覽會=博覽會 廣博=博識 宏儒碩學=博學多才 博古通今=博學多聞 屠殺=搏斗 拚命=搏命 苦命=薄命 傍晚=薄暮 單薄=薄弱 軟弱=薄弱虛弱 菲酌=薄酌 賠償=補償 增補=補充 調停=補救 修繕=補葺 補貼=補助 修理=補綴 哺養(yǎng)=哺育 疑神疑鬼=捕風捉影 捕捉=捕獲 探員=捕快 網(wǎng)魚=捕魚 捕獲=捕捉 不安分=不安本分 不安本分=不安分 不守婦道=不安于室 不守婦道=不安于位 未便=不便 穩(wěn)定=不變 鄙人=不才 不理=不睬 意外=不測 不成才=不長進 不可=不成 不長進=不成才 不長進=不成材 有失體統(tǒng)=不成體統(tǒng) 不食人間煙火=不吃煙火食 從容不迫=不遲不疾 不辭勞怨=不辭勞苦 不辭勞苦=不辭勞怨 不搭嘴=不搭腔 不搭腔=不搭嘴 不合時宜=不達時宜 不搭腔=不答腔 不打不相識=不打不成相識 不打不相識=不打不成相與 不打不成相與=不打不相識 不但=不單 不光=不但 不妥=不當 不作數(shù)=不當準 天誅地滅=不得善終 茫無頭緒=不得要領 不停=不斷 精益求精=不斷改進 不合錯誤=不對 未幾=不多 不違農時=不奪農時 不貳=不二 鐵價=不二價 不二=不貳 不勝枚舉=不乏其人 非法=不法 非凡=不凡 沒關系=不妨 沒關系=不妨事 輕視=不放在眼里 難分軒輊=不分高下 不顧曲直=不分皁白 不夠=不敷 不順手=不伏手 不服水土=不伏水土 不平=不服 水土不服=不服水土 不應=不該 吞聲忍氣=不敢則聲 你死我活=不共戴天 道貌岸然=不茍言笑 不敷=不夠 未入流=不夠格 掉臂=不顧 不分皁白=不顧曲直 不拘小節(jié)=不顧外表 悍然不顧=不顧一切 不但=不光 不外=不過 小心翼翼=不寒而栗 欠好=不好 分歧=不合 不對=不合錯誤 不達時宜=不合時宜 反面=不和 半推半就=不即不離 不可勝數(shù)=不計其數(shù) 欠安=不佳 不露鋒芒=不見圭角 不斷=不竭 不但=不僅 風行一時=不脛而走 未幾=不久不多 不顧外表=不拘小節(jié) 未定=不決 不停=不絕 不易之論=不刊之論 不勝=不堪 不行=不可 多如牛毛=不可僂指算 不計其數(shù)=不可勝數(shù) 難以想象=不可思議 咄咄逼人=不可一世 不能=不克不及 不愿=不肯 煩懣=不快 不稂不莠=不郎不秀 不郎不秀=不稂不莠 坐享其成=不勞而獲 不睬=不理 倒霉=不利 不意=不料 不惜=不吝 不吝指教=不吝金玉 不吝珠玉=不吝指教 不吝指教=不吝珠玉 不留心=不留神 不留神=不留心 殺雞取卵=不留余地 不見圭角=不露鋒芒 不露鋒芒=不露圭角 不露聲色=不露神色 不露神色=不露聲色 穩(wěn)定=不亂 不正經(jīng)=不倫不類 豈論=不論 不落俗套=不落窠臼 不落窠臼=不落俗套 難免=不免 未免=不免難免 不約而合=不謀而合 不克不及=不能 不能勝數(shù)=不能盡數(shù) 不能盡數(shù)=不能勝數(shù) 欲罷不能=不能自休 不能自制=不能自已 不能自已=不能自制 不寧奈=不寧不奈 不寧耐=不寧不耐 不寧不奈=不寧奈 不寧不耐=不寧耐 數(shù)奇=不偶 中庸之道=不偏不倚 不屈=不平萍水相逢=不期而遇 生吞活剝=不求甚解 不平=不屈 奮不顧身=不屈不撓 否則=不然 冰清玉潔=不染纖塵 克日=不日 幸不辱命=不辱使命 不中聽=不入耳 不倫不類=不三不四 惠而不費=不傷脾胃 處境尷尬=不上不下 失慎=不慎 不堪=不勝 不乏其人=不勝枚舉 昏迷不醒=不省人事 時時=不時 不識時務=不識時變 不識時變=不識時務 不識之無=不識一丁 不識一丁=不識之無 不吃煙火食=不食人間煙火 不安于室=不守婦道 不伏手=不順手 非死即傷=不死即傷 不絕=不停 欠亨=不通 差別=不同 與眾不同=不同凡響 不當=不妥 不過=不外 有良心=不忘本 不奪農時=不違農時 不惟=不唯 不唯=不惟 不言而喻=不問可知 吊兒郎當=不務正業(yè) 不斷=不息 不吝=不惜平分秋色=不相上下 斷絕往來=不相聞問 不用=不消 不可=不行 不斷=不休 囚首垢面=不修邊幅 生而知之=不學而能 觀=不雅 不雅=不雅觀 不問可知=不言而喻 不厭求詳=不厭其詳 不厭其詳=不厭求詳 沒關系=不要緊 紛歧=不一 所在多有=不一而足 天經(jīng)地義=不移至理 盡心盡力=不遺余力第二篇:中文分詞 - 同義詞、近義詞詞庫2