第一篇:信息檢索論文
關(guān)于電子工業(yè)的信息檢索
任沖 電信學(xué)院 08電1W 08311116
摘要:信息(information)是事物屬性的再現(xiàn),信息不是事物本身,而是由事物發(fā)出的信息,指令,數(shù)據(jù)等所包含的內(nèi)容。在信息的海洋中選取符合重要的信息的過程,稱為檢索。廣義的信息檢索又稱為信息存儲(chǔ)與檢索(information storage and retrieval)。本文是一篇文獻(xiàn)檢索報(bào)告,通過課題電子信息工程、檢索工具的選擇、檢索詞、檢索過程及結(jié)果、文獻(xiàn)闡述、參考文獻(xiàn)等方面闡述信息文獻(xiàn)檢索技術(shù)的運(yùn)用。
關(guān)鍵詞:電子、工業(yè)、電子工業(yè)、信息檢索
中圖分類號(hào):F407.63 電子工業(yè)
文獻(xiàn)標(biāo)識(shí)碼:C
一、開題論述
電子工業(yè)是研制和生產(chǎn)電子設(shè)備及各種電子元件、器件、儀器、儀表的工業(yè)。是軍民結(jié)合型工業(yè)。由廣播電視設(shè)備、通信導(dǎo)航設(shè)備、雷達(dá)設(shè)備、電子計(jì)算機(jī)、電子元器件、電子儀器儀表和其他電子專用設(shè)備等生產(chǎn)行業(yè)組成。
電子工業(yè)是在電子科學(xué)技術(shù)發(fā)展和應(yīng)用的基礎(chǔ)上發(fā)展起來的。近年來,電子工業(yè)發(fā)展很快,由于生產(chǎn)技術(shù)的提高和加工工藝的改進(jìn),集成電路差不多每三年就更新一代;大規(guī)模集成電路和計(jì)算機(jī)的大量生產(chǎn)和使用,光纖通信、數(shù)字化通信、衛(wèi)星通信技術(shù)的興起,使電子工業(yè)成為一個(gè)迅速崛起的高技術(shù)產(chǎn)業(yè)。電子工業(yè)的發(fā)展及其產(chǎn)品的廣泛應(yīng)用,對(duì)軍事領(lǐng)域產(chǎn)生了深刻的影響:改進(jìn)了作戰(zhàn)指揮系統(tǒng)。第一次世界大戰(zhàn)以來,無線電通信成為軍事通信的基本手段,被稱作軍隊(duì)的“神經(jīng)”系統(tǒng)。利用電子技術(shù),通過由通信、雷達(dá)、計(jì)算機(jī)等電子設(shè)備組成的指揮自動(dòng)化系統(tǒng),改變了傳統(tǒng)的通信、偵察和情報(bào)處理手段,大大提高了軍隊(duì)指揮在現(xiàn)代戰(zhàn)爭條件下的效能。改進(jìn)了武器裝備系統(tǒng)。電子技術(shù)的發(fā)展和電子產(chǎn)品的應(yīng)用,大大提高了現(xiàn)代武器的威力和命中精度;電子器件成了現(xiàn)代武器裝備的重要組成部分,電子技術(shù)是導(dǎo)彈、軍事衛(wèi)星及其他高技術(shù)武器裝備制導(dǎo)和控制的核心,無論是戰(zhàn)略武器,還是戰(zhàn)術(shù)武器,其性能高低都同電子技術(shù)有密切關(guān)系。使電子戰(zhàn)發(fā)展成為獨(dú)立的作戰(zhàn)手段。電子偵察、電子干擾、電子摧毀等形式的電子對(duì)抗,在現(xiàn)代戰(zhàn)爭中越來越重要。
二、檢索工具的選擇
1.CNKI中國知網(wǎng)
CNKI(China national knowledge infrastructure),又稱為中國知網(wǎng),在CNKI的“中國知識(shí)資源總庫”中,已經(jīng)累計(jì)出版CNKI系列全文書庫22種,收錄有博士學(xué)位論文,碩士學(xué)位論文,會(huì)議議論,報(bào)紙文獻(xiàn),圖書,年鑒等,文獻(xiàn)信息總量約占中國現(xiàn)有文獻(xiàn)總量的45%;每年出版當(dāng)年產(chǎn)出的新文獻(xiàn)約占中國每年出版文獻(xiàn)總量的80%,已經(jīng)成為全球最大的中國文獻(xiàn)數(shù)據(jù)庫,內(nèi)容覆蓋自然科學(xué),工程技術(shù),人文與科學(xué)各種科學(xué)領(lǐng)域,全面集中放映了中國科技,經(jīng)濟(jì),政治,社會(huì),文化各方面的研究成果與發(fā)展動(dòng)態(tài)。該平臺(tái)利用知識(shí)管理與知識(shí)挖掘技術(shù),將文獻(xiàn)資源組織成內(nèi)容關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò),支持群體互動(dòng)的數(shù)字化學(xué)習(xí)與數(shù)字化研究,支持知識(shí)管理與知識(shí)服務(wù)。
2.萬方數(shù)據(jù)庫
萬方數(shù)據(jù)庫資源包括全文類信息資源,文摘題錄類信息資源及事實(shí)型動(dòng)態(tài)信息資源。全文資源包括會(huì)議論文全文,學(xué)位論文全文,法律法規(guī)權(quán)文,期刊論文全文。豐富權(quán)威ude全文信息資源為用戶提供了獲得大量一次文獻(xiàn)的機(jī)會(huì),也成文科研,教育,生產(chǎn)等不可多得的參考工具,其中,會(huì)議論文全文資源自1998年以來已經(jīng)收集了國家級(jí)學(xué)術(shù)會(huì)議論文50余萬篇,是最具權(quán)威的學(xué)術(shù)會(huì)議全文庫。覆蓋了自然科學(xué)、數(shù)理化、天文、地球、生物、醫(yī)藥、衛(wèi)生、工業(yè)技術(shù)、航空、環(huán)境、社會(huì)科學(xué)、人文地理等各學(xué)科領(lǐng)域。
3.維普中國科技期刊數(shù)據(jù)庫
中國科技期刊數(shù)據(jù)庫是我國最早發(fā)行的中文全文數(shù)據(jù)庫。迄今為止,該數(shù)據(jù)庫收錄中文期刊8000多種(加上改名前的期刊、停刊等實(shí)際上有15000多種),收錄期限追溯到1989年。該數(shù)據(jù)庫設(shè)置8個(gè)專輯:社會(huì)科學(xué)、經(jīng)濟(jì)管理、教育科學(xué)、圖書情報(bào)、自然科學(xué)、農(nóng)業(yè)科學(xué)、醫(yī)藥衛(wèi)生、工程技術(shù)和21個(gè)專題。
4.springer全文期刊
德國施普林格出版集團(tuán)全文期刊,涵蓋化學(xué)、計(jì)算機(jī)科學(xué)、經(jīng)濟(jì)學(xué)、環(huán)境科學(xué)、地球科學(xué)、法律、生命科學(xué)、數(shù)學(xué)、醫(yī)學(xué)、物理與天文學(xué)等學(xué)科近700種期刊,其中醫(yī)學(xué)179種。
5.百度搜索引擎
百度搜索是全球最大的中文搜索引擎,2000年1月由李彥宏、徐勇兩人創(chuàng)立于北京中關(guān)村,致力于向人們提供“簡單,可依賴”的信息獲取方式。“百度”二字源于中國宋朝詞人辛棄疾的《青玉案》詩句:“眾里尋他千百度”,象征著百度對(duì)中文信息檢索技術(shù)的執(zhí)著追求。
6.Google搜索引擎
Google(Google Inc.,NASDAQ:GOOG)是一家美國上市公司(公有股份公司),于1998年9月7日以私有股份公司的形式創(chuàng)立,以設(shè)計(jì)并管理一個(gè)互聯(lián)網(wǎng)搜索引擎。
三.檢索詞及檢索式
1、中文:電子,工業(yè),電子工業(yè)
2、英文:electron, industry, electronic industry
四.檢索過程及結(jié)果
對(duì)于電子工業(yè)的知識(shí)不是太了解,但是想如何很好的掌握電子工業(yè)的各方面情況。因此在百度和Google上搜索了一些關(guān)于電子工業(yè)的信息。但是信息混雜,而且學(xué)術(shù)價(jià)值比較低,所以又在CNKI中國知網(wǎng),萬方數(shù)據(jù)庫,springer全文期刊,維普中國科技期刊數(shù)據(jù)庫上找了關(guān)于電子工業(yè)的文獻(xiàn)期刊論文。
1.CNKI中國知網(wǎng)
先輸入:電子,檢索結(jié)果為:“共有記錄1071359條”。.輸入:工業(yè),檢索結(jié)果為:“共有記錄2007424條”。輸入:電子工業(yè),檢索結(jié)果為“31081”。
2.萬方數(shù)據(jù)庫
先輸入:電子,檢索結(jié)果為:“共找到1045026篇符合條件的論文”。輸入:工業(yè),檢索結(jié)果為:“共找到1439033篇符合條件的論文”。輸入:電子工業(yè),檢索結(jié)果為:“共找到110806篇符合條件的論文”。
3.維普中國科技期刊數(shù)據(jù)庫
先輸入:電子,檢索結(jié)果為:“找到約354995篇與電子的文章”。輸入:工業(yè),檢索結(jié)果為:“找到約466455篇與工業(yè)相關(guān)的文章”。輸入:電子工業(yè),檢索結(jié)果為:“找到約5115篇與電子工業(yè)的文章”。
4.springer全文期刊
先輸入:electron,檢索結(jié)果為:“search results for‘electron’of 396248
”。輸入:industry,檢索結(jié)果為:“ search results for ‘industry’ of 291688”。輸入:electronic industry,檢索結(jié)果為:“ earch results for ‘electronic industry’ of 72262 ”。
5.Google搜索
在google上輸入“電子”,結(jié)果顯示搜索出“獲得約 1180000000 條結(jié)果(用時(shí) 0.10 秒)”。輸入“工業(yè)”,結(jié)果顯示為“獲得約 577000000 條結(jié)果(用時(shí) 0.14 秒)”。輸入“電子工業(yè)”,結(jié)果顯示為“獲得約 30400000 條結(jié)果(用時(shí) 0.12 秒)”。從google搜索我們可以獲得各種各樣的關(guān)于市場分析的信息數(shù)千種。
6.百度搜索
在百度上輸入:電子,結(jié)果顯示出“找到相關(guān)網(wǎng)頁約100000000篇,用時(shí)0.060秒”。輸入:工作,結(jié)果顯示為“找到相關(guān)網(wǎng)頁約100000000篇,用時(shí)0.090秒”。輸入:電子工業(yè),結(jié)果顯示為“找到相關(guān)網(wǎng)頁約382000000篇,用時(shí)0.001秒”。
五、檢索分析
根據(jù)檢索各種結(jié)果可知,電子工業(yè)是研制和生產(chǎn)電子設(shè)備及各種電子元件、器件、儀器、儀表的工業(yè),是軍民結(jié)合型工業(yè)。由廣播電視設(shè)備、通信導(dǎo)航設(shè)備、雷達(dá)設(shè)備、電子計(jì)算機(jī)、電子元器件、電子儀器儀表和其他電子專用設(shè)備等生產(chǎn)行業(yè)組成。
六、信息檢索的意義
信息檢索的作用與意義主要體現(xiàn)在以下三方面。
(一)避免重復(fù)研究或走彎路
我們知道,科學(xué)技術(shù)的發(fā)展具有連續(xù)性和繼承性,閉門造車只會(huì)重復(fù)別人的勞動(dòng)或者走彎路。比如,我國某研究所用了約十年時(shí)間研制成功“以鎂代銀”新工藝,滿懷信心地去申請(qǐng)專利,可是美國某公司早在20世紀(jì)20年代末就已經(jīng)獲得了這項(xiàng)工藝的專利,而該專利的說明書就收藏在當(dāng)?shù)氐目萍夹畔⑺鵞7]??茖W(xué)研究最忌諱重復(fù),因?yàn)檫@是不必要的浪費(fèi)。在研究工作中,任何一個(gè)課題從選題、試驗(yàn)直到出成果,每一個(gè)環(huán)節(jié)都離不開信息。研究人員在選題開始就必須進(jìn)行信息檢索,了解別人在該項(xiàng)目上已經(jīng)做了哪些工作,哪些工作目前正在做,誰在做,進(jìn)展情況如何等。這樣,用戶就可以在他人研究的基礎(chǔ)上進(jìn)行再創(chuàng)造,從而避免重復(fù)研究,少走或不走彎路。
(二)節(jié)省研究人員的時(shí)間
科學(xué)技術(shù)的迅猛發(fā)展加速了信息的增長,加重了信息用戶搜集信息的負(fù)擔(dān)。許多研究人員在承接某個(gè)課題之后,也意識(shí)到應(yīng)該查找資料,但是他們以為整天泡在圖書館“普查”一次信息就是信息檢索,結(jié)果浪費(fèi)了許多時(shí)間,而有價(jià)值的信息沒有查到幾篇,查全率非常低。信息檢索是研究工作的基礎(chǔ)和必要環(huán)節(jié),成功的信息檢索無疑會(huì)節(jié)省研究人員的大量時(shí)間,使其能用更多的時(shí)間和精力進(jìn)行科學(xué)研究。
(三)是獲取新知識(shí)的捷徑 在改革開放的今天,傳統(tǒng)教育培養(yǎng)的知識(shí)型人才已滿足不了改革環(huán)境下市場經(jīng)濟(jì)的需求,新形勢要求培養(yǎng)的是能力型和創(chuàng)造型人才,具備這些能力的人才首先需要具備自學(xué)能力和獨(dú)立的研究能力。大學(xué)生在校期間,已經(jīng)掌握了一定的基礎(chǔ)知識(shí)和專業(yè)知識(shí)。但是,“授之以魚”只能讓其享用一時(shí)。如果掌握了信息檢索的方法便可以無師自通,找到一條吸收和利用大量新知識(shí)的捷徑,把大家引導(dǎo)到更廣闊的知識(shí)領(lǐng)域中去,對(duì)未知世界進(jìn)行探索。是謂“教人以漁”,才能終身受用無窮。
德國柏林圖書館門前有這樣一段話:“這里是知識(shí)的寶庫,你若掌握了它的鑰匙,這里的全部知識(shí)都是屬于你的?!边@里所說的“鑰匙”即是指信息檢索的方法。
信息檢索是獲取知識(shí)、信息的基本手段。如何有效、快速、準(zhǔn)確地在信息海洋中找到人們所需要的信息,使之成為重要資源,已是信息時(shí)代人們的重要需求,因而,信息檢索技術(shù)在信息社會(huì)中將發(fā)揮越來越重要的作用。主要體現(xiàn)在以下幾個(gè)方面:
1.能夠全面地掌握有關(guān)的必要信息,增強(qiáng)決策的科學(xué)性
掌握一定量的必要信息,是進(jìn)行研究、搞好工作的首要條件,也是進(jìn)行正確決策必不可少的前提條件??茖W(xué)的決策,源于對(duì)信息資料的充分了解與認(rèn)識(shí),信息檢索是國家、部門、單位和個(gè)人等決策者獲取信息的重要途徑。因此,信息檢索會(huì)使國家、部門、單位和個(gè)人的決策建立在科學(xué)基礎(chǔ)之上,大大增加了決策的科學(xué)性,減少了決策的盲目性。
2.提高信息利用的效率,縮短獲取信息的時(shí)間
信息檢索可以使用戶在短時(shí)間內(nèi)獲取有需求緊密相關(guān)的信息,使用戶有更多的時(shí)間去完成更重要的工作,從而大大提高了工作效率。
3.有利于信息用戶獲取所需的全部信息
信息檢索工作往往依存于一個(gè)或多個(gè)很大的信息庫,信息庫中存儲(chǔ)著很全面的各種信息。通過信息檢索工作,一次就可查獲信息用戶所需要的全部信息。
4.提高信息素質(zhì)和科研工作的成功率
所謂信息素質(zhì),是指獲取信息的強(qiáng)烈意識(shí),掌握信息檢索的技術(shù)和方法,擁有信息的鑒別利用的能力。信息素質(zhì)的提高,可增強(qiáng)信息意識(shí),熟悉檢索技巧,有利于科學(xué)研究工作的順利開展,同時(shí)可提高科研工作的成功率。
5.促進(jìn)社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展
社會(huì)的進(jìn)步和經(jīng)濟(jì)的發(fā)展,推動(dòng)了信息的產(chǎn)生、流通和使用;反過來,信息的生產(chǎn):、流通和使用方式的變革,又將促進(jìn)社會(huì)和經(jīng)濟(jì)的進(jìn)一步發(fā)展。
七、對(duì)本門課的看法、建議、收獲、體會(huì)
科技信息檢索這門課是一門很實(shí)用的課程,通過對(duì)信息檢索的學(xué)習(xí),讓我們了解如何通過正確的方式獲得自己所需要的信息。更了解到怎樣選擇正確的檢索詞來構(gòu)成檢索策略進(jìn)行檢索。在實(shí)際中我們可能會(huì)根據(jù)一個(gè)檢索詞就能檢索出許多信息,但是為了能檢索出更有效的信息,我們需要根據(jù)更精確地或者是較多的檢索詞,去檢索我們所需要的信息。信息檢索的學(xué)習(xí)提高了我們獲得信息的效率。這些都為我們?cè)谝院蟮墓ぷ髦?,研究中起了很大的作用?/p>
八、感謝詞
感謝韓君老師對(duì)我的諄諄教誨,教會(huì)了我信息檢索的方法,這對(duì)我將來的學(xué)習(xí)工作生活將產(chǎn)生深遠(yuǎn)的影響。
參考文獻(xiàn):
[1]徐天秀.信息檢索.北京:科學(xué)出版社,2006
[2]葛敬民.信息檢索新編教程.青島:青島海洋大學(xué)出版社,2000
[3]陳雅芝.信息檢索.北京:清華大學(xué)出版社,2006
[4]王樹亮.現(xiàn)代信息檢索教程.北京:中央編譯出版社,2008
[5]鄧要武.科技信息檢索.北京:北方交通大學(xué)出版社,2001
第二篇:信息檢索論文
應(yīng)用化學(xué)
化學(xué)與化工信息檢索論文
題目:造紙污水處理技術(shù)現(xiàn)狀及進(jìn)展
學(xué)生姓名------學(xué)號(hào)--------專業(yè)應(yīng)用化學(xué)指導(dǎo)教師----
2010年12月 25日
造紙污水處理技術(shù)現(xiàn)狀及進(jìn)展
摘要:本文在查閱相關(guān)資料的基礎(chǔ)上,介紹了國內(nèi)外的造紙廢水處理的常用方法,并對(duì)各種方法進(jìn)行了評(píng)價(jià)和分析,綜述了造紙廢水處理研究的現(xiàn)狀和進(jìn)展。
關(guān)鍵詞:造紙;廢水處理;治理技術(shù)
隨著造紙工業(yè)的迅速發(fā)展,造紙工業(yè)廢水已經(jīng)成為水環(huán)境的重要污染源之一。在造紙過程中,除纖維素和部分半纖維素之外的大量有機(jī)物要進(jìn)入廢水中,并且即使經(jīng)過充分的廢液回收利用,也還是或多或少地會(huì)有一些纖維素和半纖維素流失進(jìn)入廢水中。含有大量有機(jī)物的造紙廢水排入水體,對(duì)水體會(huì)造成不同程度的污染。同時(shí)造紙過程中通常還需要加入一些必要的化學(xué)藥劑和化學(xué)助劑,這些物質(zhì)流失進(jìn)入水體中更是加重了水體污染[1]。造紙工業(yè)的漂白工段通常是采用含氯化合物漂白,導(dǎo)致排出的漂白廢水中含有大量的氯化有機(jī)物,其中的氯苯酚、氯化脂肪酸、氯化樹脂酸、dioxin等有毒且難以處理的氯化有 機(jī)物,對(duì)環(huán)境中的生物具有強(qiáng)烈的毒害、致畸、致多發(fā)性腦神經(jīng)病變作用[2],因此如何有效地去除造紙廢 水中的含氯有機(jī)物已經(jīng)成為廢水處理的一大難題。本文在查閱大量文獻(xiàn)資料的基礎(chǔ)上主要介紹國內(nèi)外處理造紙廢水的方法和新技術(shù),并就國內(nèi)外治理造紙廢水的現(xiàn)狀和未來的發(fā)展前景加以評(píng)述。
1概況
據(jù)經(jīng)貿(mào)委粗略估計(jì),目前我國大小造紙廠約有近萬家。造紙工業(yè)總的特點(diǎn)是:使用原料種類多、生產(chǎn)工藝類型多、中小企業(yè)多、技術(shù)裝備落后者多。調(diào)查統(tǒng)計(jì)表明,造紙工業(yè)廢水年排放總量達(dá)17億t,占工業(yè)廢 水總排放量的10以上。造 紙工業(yè)廢水主要包括黑液或紅液(蒸煮制漿廢水)、中段廢水(制漿洗滌、篩選、漂白廢水)、造紙 白水(抄紙廢水)三大類,其中蒸煮黑液的環(huán)境污染最為嚴(yán)重,占整個(gè)造紙工業(yè)污染的90%。制漿廢水 BOD、COD、SS、pH、色度、濁度等均嚴(yán)重超標(biāo);中段廢水成分與制漿廢水相近,但濃度低,富含漂白工段產(chǎn)生的對(duì)環(huán)境危害最大的有機(jī)氯化物;抄紙廢水中主要含有細(xì)小纖維、填料(高嶺土等)和膠料(松香等),BOD值較低。造紙工業(yè)廢水的治理是國內(nèi)外造紙行業(yè)亟待解決的難題[3]。
2治理方法
2.1物理化學(xué)法
物理化學(xué)法是通過物理或者化學(xué)反應(yīng)的作用來達(dá)到去除廢水中的污染物的目的,主
要有以下方法:
2.1.1臭氧法
臭氧氧化技術(shù)已問世多年,近年來,由于低成本的臭氧發(fā)生裝置和臭氧處理裝置的出現(xiàn)而重新成為研究熱點(diǎn)。臭氧(O3)是一種強(qiáng)氧化劑,O3作為兩性離子,能選擇性地分解發(fā)色基團(tuán)。安郁琴[4]將經(jīng)過化學(xué)混凝處理后和經(jīng)過化學(xué)混凝過濾吸附處理后的麥革漿黑液利用臭氧法處理,處理 20分鐘后脫色率可以達(dá)到 82.1%,但 CODCr去除率僅 15.8%,BOD5去除率為24.8%,F(xiàn)f1此可見,臭氧脫色效果顯著,但對(duì) CODCr和 BOD5的去除效果不明顯。臭氧在水中的溶解度較低,如何更有效地使臭氧溶解于水中從而提高其利用率已經(jīng)成為該技術(shù)研究的熱點(diǎn)。使用臭氧法也會(huì)產(chǎn)生其它副產(chǎn)物,其中最受關(guān)注的是羰基化合物中的醛類,比如甲醛、乙醛,這些物質(zhì)具有急性毒性和慢性毒性,并具有一定的致畸、致癌、致突性。
2.1.2光催化氧化
光催化氧化技術(shù)是近年來比較活躍的研究領(lǐng)域,光催化氧化技術(shù)是在光化學(xué)氧化技術(shù)的基礎(chǔ)上發(fā)展起來的。張志軍等[5]利用中壓汞燈作光源,研究了氯代二苯并一對(duì)一二啞英(CDDS、包括DCCD、PcDD和OCDD)在 TiO2催化下的光解反應(yīng),在室溫下,4h內(nèi)DCCD、PCDD和OCDD分別降解87.2%、84.6%和91.2%。M.Cristina Yeber等
[6]將 TiO2、Zno同定在玻璃上,對(duì)漂白廢水進(jìn)行了光催化氯化處理,處理 120min后,廢水的色度可完全去除,總酚含量減少了85%,TOC減少了50%,處理后殘留有機(jī)物的急性毒性和AOX比處理前大為減少,高分子化合物幾乎全部降解。
2.1.3混凝法
混凝法是目前國內(nèi)外重點(diǎn)研究的方向之一,該法適應(yīng)性強(qiáng)、基建投資低、管理簡單,是水處理常用的方法,在造紙行業(yè)的廢水處理中使用普遍。造紙廢水中由于含有大量纖維和化學(xué)藥劑,所以一般在處理造紙廢水時(shí)首先要用混凝法除去這些物質(zhì)。張學(xué)洪、解慶林[9]等利用聚合氯化鋁處理廣西某造紙廠的造紙終端廢水(CODcf=400mg/L),處理后可以達(dá)到國家污水排放標(biāo)準(zhǔn)(CODcf<100 mg/L)。黃國林、樂長高等[1O]利用水溶性酚醛樹脂和硫酸反應(yīng)得到的聚合物處理撫州某造紙廠制漿車間排污口的廢水,在最佳工藝條件下反應(yīng)時(shí),CODc和ss去除率分別可以達(dá)到80%一85%和 90% 一95%,處理水可以達(dá)到排放標(biāo)準(zhǔn)。
2.2 生物法
廢水的生物處理方法就是利用微生物的新陳代謝功能使廢水中呈溶解狀和膠體狀的有機(jī)污染物被降解并轉(zhuǎn)化成無害穩(wěn)定的物質(zhì),使廢水得到凈化。生物法處理廢水因其運(yùn)行成本低,效果較好而在廢水處理中得到了廣泛應(yīng)用。造紙廢水中含有大量有機(jī)物質(zhì),廢水的可生化性較好,可以為生物法的微生物提供大量的營養(yǎng)物質(zhì),從而能保證微生物的正常生長繁殖和生物法處理廢水的正常運(yùn)行。利用生物法對(duì)造紙廢水進(jìn)行二級(jí)處理可有效去除BOD、COD。造紙廢水生物處理法主要有以下幾種:
2.2.1好氧生物處理法
利用好氧微生物(主要為好氧菌)的新陳代謝作用來降解污染物,其中應(yīng)用最多的主要是活性污泥法,我國的科研人員對(duì)活性污泥法處理造紙廢水進(jìn)行了大量的研究,取得了許多成功的經(jīng)驗(yàn)。造紙廢水中的木素是不易生物降解的物質(zhì),活性污泥對(duì)木素具有極好的吸附性能,通過生物降解和活性污泥吸附作用,可達(dá)到除去木素的目的,從而降低溶解木素的濃度。芬蘭OULU紙漿廠[11]利用活性污泥法加污泥曝氣再生處理漂白硫酸鹽紙漿廢水,可使BOD去除率達(dá) 90%,COD去除率達(dá)84%?;钚晕勰喾ㄓ捎谄涮幚沓杀镜?、易于管理、處理效果較好而在廢水處理中的應(yīng)用越來越多。
2.2.2生物膜法
相對(duì)于活性污泥系統(tǒng)而言,生物膜系統(tǒng)具有如下顯著優(yōu)點(diǎn):高容積負(fù)荷、更強(qiáng)的抗毒能力和耐負(fù)荷沖擊能力、無須污泥回流且處理設(shè)施緊湊。朱光燦、呂錫武等[12]研究了采用脫木素—缺氧—好氧生物膜工藝處理造紙廢水。其中的脫木素工藝可有效地將黑液中堿木素脫穩(wěn)析出,并提高廢水的可生化性,當(dāng)廢水 pH=5,絕干纖維污泥與廢水 COD質(zhì)量之比為 1.1,硫酸鋁投加量為 160m g/L時(shí),COD去除率大于 63%。生物法在利用微生物處理造紙廢水時(shí)候,如果造紙廢水中含有大量不利于微生物生長的物質(zhì)時(shí)候,生物法處理效果較差,因此在制漿造紙過程中可以通過改變漂白劑的種類,提高造紙廢水的可生化性,使其更利于生物法處理。
2.3 其他方法
2.3.1電化學(xué)法
利用電化學(xué)法進(jìn)行廢水的處理是電化學(xué)法獲得應(yīng)用的典型領(lǐng)域。通過電化學(xué)反應(yīng)中的直接或者間接氧化和還原作用,可以破壞有毒或難降解有機(jī)物的結(jié)構(gòu),去除其生物毒性,提高其可生化性。電化學(xué)法處理廢水一般無需加入化學(xué)藥品,后處理簡單,占地面積小,管理方便,被稱為清潔處理法。景峰、王耀新、朱文菊等將電化學(xué)和凝聚沉淀法兩種方法聯(lián)合起來處理造紙廢水,使造紙廢水COD去除率達(dá)到55%~70%,色度去除,率達(dá)90%~95%[13]。目前關(guān)于電化學(xué)法的許多問題特別是降解機(jī)理、處理速度和經(jīng)濟(jì)
性問題尚未完全解決,電化學(xué)處理廢水電耗較高,使該方法的工業(yè)應(yīng)用受到限制。
2.3.2濕式空氣氧化法
濕式空氣氧化法是目前研究較多的新型處理方法,即在高溫、高壓下在液相中利用空氣或者氧氣作為氧化劑,將廢水中的有機(jī)物氧化成二氧化碳和水,從而達(dá)到去除污染物的目的。國內(nèi)從80年代開始進(jìn)行濕式空氣氧化法的研究,先后進(jìn)行了造紙黑液、含硫廢水、酚水及煤制氣廢水、農(nóng)藥廢水、印染廢水等的實(shí)驗(yàn)研究,目前,濕式空氣氧化法在國內(nèi)尚處于試驗(yàn)階段。與常規(guī)方法相比,濕式空氣氧化法具有適用范圍廣、處理效率高等優(yōu)點(diǎn)。但由于濕式空氣氧化法一般要求在高溫高壓的條件下進(jìn)行,對(duì)設(shè)備材料的要求較高,須耐高溫、高壓并耐腐蝕,因此設(shè)備費(fèi)用高,系統(tǒng)的一次性投資大,在實(shí)際推廣應(yīng)用方面仍存在著一定的局限性。
2.3.3超臨界水氧化法
在處理難降解有機(jī)廢水方面,超臨界水氧化技術(shù)是目前研究較為活躍的新技術(shù)。由于超臨界水氣液 相界面消失.成為一均相體系,因而超臨界水中的有機(jī)物反應(yīng)速度極快。Model等[14]對(duì)有機(jī)炭含量達(dá) 27.33 g/L的廢水進(jìn)行超臨界水氧化處理,在實(shí)驗(yàn)條件下,1分鐘內(nèi)就使有機(jī)氯和有機(jī)炭的去除率分別達(dá)到99.99%和99.97%。超臨界水氧化技術(shù)具有良好的工業(yè)應(yīng)用前景,但是由于對(duì)反應(yīng)條件要求較為苛刻(高溫、高壓),對(duì)設(shè)備要求偏高,因此還有一些實(shí)際的技術(shù)問題需要解決。造紙廢水治理技術(shù)展望
隨著全球可持續(xù)發(fā)展戰(zhàn)略的實(shí)施,循環(huán)經(jīng)濟(jì)和 清潔生產(chǎn)技術(shù)越來越受到人們的關(guān)注,造紙工業(yè)廢水治理從末端治理向清潔生產(chǎn)工藝、物質(zhì)循環(huán)利用、廢水回用綜合防治方向發(fā)展。未來造紙工業(yè)廢水治理將突出以下幾個(gè)方面:
(1)貫徹循環(huán)經(jīng)濟(jì)理念、重視清潔生產(chǎn)技術(shù)的開發(fā)與應(yīng)用,提高物質(zhì)的轉(zhuǎn)化率和循環(huán)使用率,從源頭上削減各污染物的產(chǎn)生量并在廠內(nèi)將大量廢水循環(huán)回用,實(shí)現(xiàn)封閉循環(huán),結(jié)合廢水綜合治理,最終實(shí)現(xiàn)廢水零排放。
(2)綜合目前國內(nèi)外技術(shù)發(fā)展情況,應(yīng)重視開發(fā)和引進(jìn)先進(jìn)的治理技術(shù):重視黑液 處理技術(shù)(主要為堿 回收 技術(shù))、重 視 SS、BOD、COD 的去除技術(shù)及脫色技術(shù)。
(3)應(yīng)重視 生物處理方法在造紙工業(yè)廢水處理中的應(yīng)用,生物技術(shù)具有成本低、效益高、與其他方法組合可大大提高造紙廢水的處理率,隨著分子生物學(xué)技術(shù)、物種微生物技術(shù)的發(fā)展和應(yīng)用,具有高效、耐毒性的菌種不斷培育成功,為生物技術(shù)的廣泛應(yīng)用提供了前提條件。
(4)人工濕地處理系統(tǒng)作為一種成本低廉、節(jié)能降耗、簡單易行、效果顯著、無二次污染的廢水處理技術(shù),是造紙廢水處理的新方法[15]。
(5)廢紙?jiān)旒埰髽I(yè)均存在諸多設(shè)計(jì)、建造、管理問題,阻礙廢水回用現(xiàn)狀的進(jìn)一步改善。節(jié)水空間仍然很大。生產(chǎn)過程中,應(yīng)加強(qiáng)管理,培養(yǎng)員工節(jié)水意識(shí)。調(diào)動(dòng)員工積極性,根據(jù)實(shí)際生產(chǎn)經(jīng)驗(yàn),提出合理的回改進(jìn)措施[16]。
參考文獻(xiàn)
[1] 張 珂,陳仁銳。丁明秀,等.造紙工業(yè)污染防治技術(shù)與環(huán)境管理[M].北京:輕工業(yè)出版社,1988.14-15.
[2] 謝 澄,陳中豪,疏明君,等.生物流化床~化學(xué)絮凝法處理紙漿漂白廢水[J].工業(yè)用水與廢
水,2002,33(I):27-30.
[3] 黃夏銀,馮彬.造紙廢水處理技術(shù)研究現(xiàn)狀及展望[J].污染防治技術(shù),2004,12:17(4):9-11.
[4] 劉全校,安郁琴.臭氧 用于治理造紙廢水.紙和造紙,2000,7:44.
[5] 張志軍,包志成,王克歐.二氧化鈦催化下的氯代二苯并一對(duì)一二啞英光解反應(yīng)[J].環(huán)境化學(xué),1996,15(1):47.
[6] M Cfistina Yeber,Jaime Rodrlguez,Juanita Freer,et a1.Photocatalytic Degradation of
C:ellulose Bleaching Effiuent by supportedTiO2 andZ 0.C卜lEM0sPERE2000,41:1193.
[9] 張學(xué)洪,解慶林,李金城,等,造紙廢水的混凝處理研究[J].桂林工學(xué)院學(xué)報(bào),2000,(4):
189-191.
[10] 黃國林,樂長高,粱平.利用聚合物處理造紙廢水的研究[J,環(huán)境科學(xué)與技術(shù),1997,(1):
24—26.[11] 范懋功.活性 污泥法處理造紙廢水….給水排水,1996,22(12):29—31.
[12] 朱光燦,呂錫武,宋海亮,等,脫木素一缺氧一好氧生物膜工藝處理造紙廢水試驗(yàn)研究[J],給水排水,2004.30(1):56—59.
[13] 景 峰,王耀新,宋文菊,試論電化學(xué)一凝聚法處理造紙廢水[J].黑龍江環(huán)境通報(bào),2000,24(2):
81—82.
[14] Model M.Processing Methods for the Oxidation ofOrganics in Supercritical Water『P1.US
Patent:4543(9).1 985.09.24.
[15] 朱光燦,呂錫武,宋海亮,等,造紙廢水治理技術(shù)研究現(xiàn)狀及展望[J],污染防治技術(shù),2004.17(4):14.
[16] 張金紅,廢紙?jiān)旒垙U水回用工藝現(xiàn)狀及改造實(shí)例[J],湖北造紙,2010.3:38.
第三篇:信息檢索論文
關(guān)于數(shù)字化學(xué)習(xí)資源利用的思考
人資1W 學(xué)號(hào):10213103
姓名:陳磊 班級(jí):10摘 要:隨著教育信息化工程的整體推進(jìn),要求數(shù)字化學(xué)習(xí)資源的建設(shè)也要同步地向前發(fā)展。正確認(rèn)識(shí)數(shù)字化學(xué)習(xí)資源建設(shè)的現(xiàn)狀,并提出正確有效的舉措與做法,對(duì)于數(shù)字化學(xué)習(xí)資源的建設(shè)具有重要的指導(dǎo)作用。
關(guān) 鍵 詞:數(shù)字化學(xué)習(xí)資源、發(fā)展趨勢、應(yīng)用與開發(fā)、質(zhì)量監(jiān)控
一、關(guān)于數(shù)字化學(xué)習(xí)資源的內(nèi)容———要關(guān)注國際上教育思想的轉(zhuǎn)變
1.1在考慮數(shù)字化學(xué)習(xí)資源建設(shè)的過程中,首先應(yīng)當(dāng)看到,從上世紀(jì)90年代末到本世紀(jì)初這幾年間,整個(gè)國際教育界的教育思想有一個(gè)大的轉(zhuǎn)變。[1] 由于在網(wǎng)絡(luò)環(huán)境下既有豐富的學(xué)習(xí)資源,又有很強(qiáng)的交互性,便于自主學(xué)習(xí)、自主探究,所以,隨著網(wǎng)絡(luò)的普及,在建構(gòu)主義理論的支持下,基于網(wǎng)絡(luò)的“以學(xué)生為中心”的教育思想在上世紀(jì)90年代初期、中期甚至到90年代末都一直很流行,而傳統(tǒng)的“以教師為中心”的教育思想則受到嚴(yán)厲的批判。與此同時(shí),在教學(xué)過程中教師必不可少的主導(dǎo)作用(如正確的啟發(fā)引導(dǎo)、重點(diǎn)與難點(diǎn)的分析把握、促進(jìn)新知與舊知之間的聯(lián)系等等)也被當(dāng)作糟粕扔掉了。
與國際教育界上述教育思想觀念的轉(zhuǎn)變相適應(yīng),數(shù)字化學(xué)習(xí)資源建設(shè)的內(nèi)容也要相應(yīng)地實(shí)現(xiàn)由支持“以教為主”或“以學(xué)為主”,轉(zhuǎn)變?yōu)橹С帧皩W(xué)教并重”。1.2 支持“以教為主”的數(shù)字化學(xué)習(xí)資源,由于其主要關(guān)注點(diǎn)是輔助教師解決教學(xué)中的重點(diǎn)、難點(diǎn),提高教學(xué)效率,更好地向?qū)W生傳授知識(shí)(而對(duì)學(xué)生自主學(xué)習(xí)、自主探究等活動(dòng)則缺乏相應(yīng)的關(guān)注與支持),故其內(nèi)容強(qiáng)調(diào)要為一線教師的學(xué)科教學(xué)提供多媒體課件、CAI課件、典型課例、教學(xué)設(shè)計(jì)方案和各類試題等資源;支持“以學(xué)為主”的數(shù)字化學(xué)習(xí)資源,由于其主要關(guān)注點(diǎn)是要促進(jìn)學(xué)者的自主學(xué)習(xí)、自主探究活動(dòng)和小組的協(xié)作學(xué)習(xí)、協(xié)作探究活動(dòng)(而對(duì)如何輔助教師的“教”,則缺乏相應(yīng)的關(guān)注與支持),故其內(nèi)容應(yīng)是能起認(rèn)知探究工具作用與協(xié)作交流工具作用的數(shù)字化學(xué)習(xí)資源。
二、關(guān)于數(shù)字化學(xué)習(xí)資源的管理———要關(guān)注兩個(gè)新的發(fā)展趨勢
關(guān)于數(shù)字化學(xué)習(xí)資源的管理,有兩個(gè)新的發(fā)展趨勢值得我們關(guān)注。
2.1目前對(duì)數(shù)字化學(xué)習(xí)資源的管理,主要考慮的問題是如何通過數(shù)據(jù)庫存儲(chǔ)方式對(duì)學(xué)習(xí)資源的數(shù)據(jù)內(nèi)容進(jìn)行有效的管理,但管理數(shù)字化學(xué)習(xí)資源的最終目的,是為了能在教學(xué)過程中充分地利用這些資源。所以,我們?cè)诮ㄔO(shè)數(shù)字化學(xué)習(xí)資源的過程中不僅應(yīng)當(dāng)關(guān)注學(xué)習(xí)資源的數(shù)據(jù)內(nèi)容管理,同時(shí)也應(yīng)當(dāng)關(guān)注(甚至更應(yīng)當(dāng)關(guān)注)學(xué)習(xí)資源應(yīng)用環(huán)境的支持與管理。
學(xué)科群資源網(wǎng)站是以不同學(xué)科的數(shù)字化學(xué)習(xí)資源為核心,建設(shè)起一個(gè)集資源共建共享、在線課件開發(fā)、聯(lián)機(jī)備課、學(xué)科信息發(fā)布、互動(dòng)交流等功能于一體的多學(xué)科、多層次的學(xué)科網(wǎng)站群,目的是使數(shù)字化學(xué)習(xí)資源的利用能更加符合教師和學(xué)生的思維方式與行為習(xí)慣。
2.2目前,絕大部分省、市或地區(qū)的數(shù)字化學(xué)習(xí)資源都是分散存儲(chǔ)于該省、市的各個(gè)學(xué)?;蛟摰貐^(qū)的不同學(xué)習(xí)資源網(wǎng)站上,應(yīng)當(dāng)采用何種機(jī)制才能對(duì)分散存儲(chǔ)的資源進(jìn)行有效管理并進(jìn)行共建、共享,這是數(shù)字化學(xué)習(xí)資源建設(shè)關(guān)注的焦點(diǎn)之一。我們認(rèn)為,建立“區(qū)域內(nèi)分布式資源網(wǎng)絡(luò)管理系統(tǒng)”是有效解決大范圍數(shù)字化學(xué)習(xí)資源整合與共享問題的較佳方案。建設(shè)區(qū)域內(nèi)分布式資源網(wǎng)絡(luò)管理系統(tǒng)的核心技術(shù)包括兩項(xiàng)內(nèi)容:
2.2.1對(duì)資源目錄的集中管理
本地區(qū)的學(xué)習(xí)資源中心(例如省電教館)要為廣大用戶提供一個(gè)能覆蓋本地區(qū)所有數(shù)字化學(xué)習(xí)資源網(wǎng)站的資源目錄管理系統(tǒng),以便本地區(qū)不同學(xué)習(xí)資源網(wǎng)站之間的互相訪問與資源共享。而且,還要有專人對(duì)該資源目錄系統(tǒng)進(jìn)行經(jīng)常性維護(hù),從而達(dá)到本地區(qū)范圍內(nèi)各資源站點(diǎn)目錄的同步更新與統(tǒng)一管理。與此同時(shí),系統(tǒng)還應(yīng)提供專用的教學(xué)搜索引擎,以實(shí)現(xiàn)對(duì)不同資源站點(diǎn)上相關(guān)信息的快速查詢與檢索;當(dāng)用戶需要打開某個(gè)資源時(shí),資源目錄管理系統(tǒng)應(yīng)提供重定向功能 2.2.2對(duì)資源數(shù)據(jù)的分布式存儲(chǔ)
數(shù)字化學(xué)習(xí)資源網(wǎng)絡(luò)系統(tǒng)是由多個(gè)資源站點(diǎn)組成的,資源網(wǎng)內(nèi)每一個(gè)提供資源信息服務(wù)的站點(diǎn)都是資源網(wǎng)中的一個(gè)節(jié)點(diǎn)———用于存儲(chǔ)實(shí)際的物理資源,資源節(jié)點(diǎn)之間基于一定的信任授權(quán)關(guān)系進(jìn)行資源互訪,資源元數(shù)據(jù)信息與本地區(qū)學(xué)習(xí)資源中心目錄管理系統(tǒng)中的目錄信息保持同步,因此可以實(shí)現(xiàn)網(wǎng)絡(luò)系統(tǒng)內(nèi)數(shù)字化學(xué)習(xí)資源的分布式存儲(chǔ)和集中式管理,并在本地區(qū)范圍內(nèi)提供廣泛的基于共享的數(shù)字化學(xué)習(xí)資源服務(wù)。
三、關(guān)于數(shù)字化學(xué)習(xí)資源的質(zhì)量監(jiān)控———評(píng)審機(jī)制的建立和實(shí)施
3.1當(dāng)前數(shù)字化學(xué)習(xí)資源的建設(shè)呈無序狀態(tài),很多單位在組織資源建設(shè)時(shí),只注重?cái)?shù)量而忽視質(zhì)量。應(yīng)該通過建立有效的數(shù)字化學(xué)習(xí)資源評(píng)審機(jī)制,并提高評(píng)審結(jié)果的科學(xué)性和權(quán)威性來規(guī)范資源建設(shè)行為。與此同時(shí),還應(yīng)制定具有可操作性的數(shù)字化學(xué)習(xí)資源評(píng)價(jià)指標(biāo)體系,這種評(píng)價(jià)指標(biāo)的制定要突出數(shù)字化學(xué)習(xí)資源的教育特性和新課程標(biāo)準(zhǔn)對(duì)學(xué)習(xí)資源的要求,并要以素質(zhì)教育和創(chuàng)新教育為基本出發(fā)點(diǎn)。3.2 為了保證數(shù)字化學(xué)習(xí)資源評(píng)審的科學(xué)性與有效性,應(yīng)當(dāng)采用專家評(píng)審與群眾(用戶)評(píng)價(jià)相結(jié)合的方式。
專家評(píng)審應(yīng)建立包括幾方面專業(yè)人員的評(píng)審小組,通常應(yīng)該包括學(xué)科教學(xué)專家、教育技術(shù)專家、信息技術(shù)人員、統(tǒng)計(jì)人員(對(duì)資源評(píng)審結(jié)果進(jìn)行統(tǒng)計(jì))等。在整個(gè)評(píng)審過程中每個(gè)成員應(yīng)各司其職,把好相應(yīng)環(huán)節(jié)的質(zhì)量關(guān)。
群眾(用戶)評(píng)價(jià)從時(shí)間上看,分為使用前評(píng)價(jià)和使用后評(píng)價(jià)兩種。使用前評(píng)價(jià)是根據(jù)事先制定的數(shù)字化學(xué)習(xí)資源評(píng)價(jià)指標(biāo)體系,為不同用戶編寫不同的問卷來獲取評(píng)價(jià)信息及相應(yīng)的得分———使用前的評(píng)價(jià)得分。使用后評(píng)價(jià)則主要依據(jù)公開發(fā)布該資源后被引用情況的統(tǒng)計(jì)信息(如被點(diǎn)擊次數(shù)、被下載次數(shù)、被引用次數(shù)等)以及用戶使用該資源后在網(wǎng)上的評(píng)論信息,把二者結(jié)合起來(即把被引用情況的統(tǒng)計(jì)信息和網(wǎng)上的評(píng)論信息結(jié)合起來)進(jìn)行綜合評(píng)價(jià),才能得出相應(yīng)的得分———使用后的評(píng)價(jià)得分。再對(duì)使用前評(píng)價(jià)和使用后評(píng)價(jià)所產(chǎn)生的兩種得分作加權(quán)統(tǒng)計(jì)———由此即可得出群眾(用戶)評(píng)價(jià)的總得分。
最后,將專家評(píng)審的結(jié)果與群眾(用戶)評(píng)價(jià)的總得分二者結(jié)合起來,這才是能夠保證數(shù)字化學(xué)習(xí)資源評(píng)審科學(xué)性與有效性的最終結(jié)果,并可以此作為確定該數(shù)字化學(xué)習(xí)資源評(píng)價(jià)等級(jí)以及收費(fèi)標(biāo)準(zhǔn)的主要依據(jù)。
【參考文獻(xiàn)】
[1]何克抗,從Blending Learning看教育技術(shù)理論的新發(fā)展[J].電化教育研究,2004,(3):1~6.2
第四篇:信息檢索論文
居民用電遠(yuǎn)程抄表系統(tǒng)
長期以來,供電企業(yè)電能數(shù)據(jù)的抄算都是基于電能表的手工作業(yè)方式,即每月定期派人到各用戶那里抄錄電能表的用電數(shù)據(jù)作為電費(fèi)計(jì)算和收繳的依據(jù)。隨著電力負(fù)荷的急劇增長,一戶一表和直供到戶等營銷舉措的不斷深入,用電企業(yè)紛紛將家屬宿舍的用電治理業(yè)務(wù)交還供電企業(yè),致使供電企業(yè)的電量抄錄的工作量急劇膨脹。白銀供電公司在城網(wǎng)農(nóng)網(wǎng)改造結(jié)束后,僅市區(qū)居民直供用戶將達(dá)到9萬戶,就地分散的手工抄表根本無法適應(yīng)用電治理的需要。因此,遠(yuǎn)程抄表系統(tǒng)的技術(shù)研究和產(chǎn)品開發(fā)勢在必行。
1遠(yuǎn)程自動(dòng)抄表系統(tǒng)的現(xiàn)狀及其特點(diǎn)
一般情況下,一個(gè)家屬樓單元有14~18塊低壓電能表,單元子區(qū)數(shù)據(jù)采集器負(fù)責(zé)采集其下屬的電能表電量數(shù)據(jù),配變集中器則負(fù)責(zé)收集配電變壓器下面的所有單元子區(qū)采集器的數(shù)據(jù)。從數(shù)據(jù)傳輸?shù)慕嵌瓤?,其組網(wǎng)方式有:兩級(jí)純專線組網(wǎng)方式、兩級(jí)混合組網(wǎng)方式、兩級(jí)載波組網(wǎng)方式。
從組網(wǎng)拓?fù)涞慕嵌戎v,只要在用戶電能表、單元子區(qū)采集器、配變集中器采用專用信道通信,遠(yuǎn)程自動(dòng)抄表系統(tǒng)的纜線工程量就非常大,有線專用信道的維護(hù)也有一定困難。鑒于這種情況,各科研單位和廠商都在努力做到取消單元子區(qū)采集器,實(shí)現(xiàn)用戶電能表與配變集中器的直接低壓電力線載波通信,這樣就大大減少了纜線工程量,而且數(shù)據(jù)遠(yuǎn)程傳輸?shù)慕M網(wǎng)拓?fù)渑c低壓配電網(wǎng)保持一致,有利于系統(tǒng)的運(yùn)行維護(hù)和用戶數(shù)量的模數(shù)化擴(kuò)展。這種拓?fù)湟笠粋€(gè)用戶終端,不但要實(shí)現(xiàn)電能計(jì)量,還要實(shí)現(xiàn)數(shù)據(jù)信息的編碼、解碼、載波收發(fā)等功能。可以構(gòu)成完全基于低壓電力線信道的載波電能表 配變集中器 營業(yè)站主機(jī)的組網(wǎng)拓?fù)?。?shí)踐證實(shí):目前市場上已經(jīng)開發(fā)出來的窄帶調(diào)制的低壓載波表和配變集中器很難保證電量或控制數(shù)據(jù)的可靠傳輸。主要原因是低壓電力線載波信道的特性隨機(jī)性、時(shí)變性很大,非常地不穩(wěn)定。因此,低壓電力線載波技術(shù)是直接通過電力線組網(wǎng)的遠(yuǎn)程抄表系統(tǒng)進(jìn)一步推廣應(yīng)用的瓶頸。
2試點(diǎn)居民小區(qū)遠(yuǎn)程抄表系統(tǒng)方案
在為試點(diǎn)居民小區(qū)遠(yuǎn)程抄表系統(tǒng)做的總體技術(shù)方案設(shè)計(jì)時(shí),本文遵循三條基本原則:
(1)在試點(diǎn)小區(qū)的配電變壓器和小區(qū)住戶之間不敷設(shè)任何專用有線信道,數(shù)據(jù)的上行或下行傳送必須使用現(xiàn)成的低壓電力線作為數(shù)據(jù)媒介。
(2)只在配電變壓器和住戶地點(diǎn)對(duì)應(yīng)安裝數(shù)據(jù)的收發(fā)裝置,建立起各用戶電能表終端與配變集中器的直接數(shù)據(jù)鏈路,中間不安裝任何硬件上的中繼或第二級(jí)集中轉(zhuǎn)發(fā)裝置。
(3)用戶電能表終端除了記錄電量外,它還應(yīng)該執(zhí)行就地保護(hù)和遠(yuǎn)方監(jiān)控功能。
2.1系統(tǒng)組成結(jié)構(gòu)
系統(tǒng)由營業(yè)站用電治理主機(jī)、配電變壓器集中器、接在配電變壓器低壓電力線上的多個(gè)用戶電能表終端(接于A相的A1~Ap終端、接于B相的B1~Bm終端、接于C相的C1~Cn終端)和通信信道組成。配電變壓器集中器和用戶電能表終端分別與配電變壓器、用戶一一對(duì)應(yīng)并就地分布式安裝。用電治理信息只能在系統(tǒng)的上下級(jí)之間傳輸。其中用電治理主機(jī)到配電變壓器集中器的信息傳輸媒介采用擴(kuò)頻無線信道或公共電話網(wǎng)(第一級(jí)信道),配電變壓器集中器到用戶電能表終端的信息傳輸媒介利用低壓電力線載波信道(第二級(jí)信道)。顯然,整個(gè)系統(tǒng)與配電變壓器下面的電壓電力網(wǎng)一樣呈樹形分布結(jié)構(gòu),可隨用戶發(fā)展和負(fù)荷增長任意擴(kuò)展。
本系統(tǒng)的任務(wù)在于實(shí)現(xiàn)低壓用戶電量數(shù)據(jù)的遠(yuǎn)程傳輸和抄算,對(duì)低壓電力用戶的負(fù)荷和用電進(jìn)行遠(yuǎn)程監(jiān)控。
由于使用了分布式安裝結(jié)構(gòu),在系統(tǒng)建設(shè)上與集中抄表箱用電系統(tǒng)相比,無須龐大繁瑣的纜線工程,施工難度將會(huì)大幅下降。系統(tǒng)的擴(kuò)展將隨用戶或配變數(shù)量的遞增而模數(shù)化擴(kuò)展,就象增加一個(gè)用戶增加一塊電能表那樣簡單。因此,系統(tǒng)擴(kuò)展極具伸縮性,不會(huì)象集中式系統(tǒng)那樣新建時(shí)資源閑置,用戶發(fā)展時(shí)容量又不夠。應(yīng)該說,這個(gè)系統(tǒng)比較符合營業(yè)用電治理系統(tǒng)發(fā)展的主流方向。
2.2網(wǎng)絡(luò)通信協(xié)議的選擇與研究
在計(jì)算機(jī)網(wǎng)絡(luò)中,信道共享技術(shù)已經(jīng)比較成熟。一般可分為兩類,即受控接入和隨機(jī)接入。
隨機(jī)接入共享信道的特點(diǎn)是所有用戶都可以根據(jù)自己的意愿隨機(jī)地發(fā)送信息。實(shí)際上就是爭用接入,征用勝利者才能獲得總線,從而發(fā)送自己的信息。典型的隨機(jī)接入是載體偵聽多重訪問/沖突檢測(CSMA/CD)網(wǎng)絡(luò),其為總線型結(jié)構(gòu),如圖2所示。后文重點(diǎn)介紹的基于CEbus的擴(kuò)頻載波線性掃頻信號(hào)(Chirp)由于具有自相關(guān)性,所以適用于CSMA網(wǎng)絡(luò)。結(jié)合電力線的傳輸特性,綜合比較各種網(wǎng)絡(luò),在本文所要開發(fā)的遠(yuǎn)抄系統(tǒng)中選用CSMA協(xié)議應(yīng)該是比較合適的。CSMA協(xié)議網(wǎng)絡(luò)的缺點(diǎn),如時(shí)延不確定、重載時(shí)效率下降,對(duì)數(shù)據(jù)傳輸量較小的遠(yuǎn)程抄表系統(tǒng)來講,并不是值得考慮的問題。
2.3用戶電能表終端的總體設(shè)計(jì)
用戶電能表終端由AC/DC開關(guān)電源模塊、電量傳感器模塊、故障保護(hù)模塊、計(jì)量模塊、負(fù)荷控制模塊、LED顯示模塊、MCU系統(tǒng)模塊、低壓擴(kuò)頻載波通信模塊構(gòu)成。
多輸出開關(guān)電源負(fù)責(zé)為用戶電能表終端供電,它輸出DC 5V0.5A和DC±15V0.5A電源各一組,其交流輸入的設(shè)計(jì)范圍為AC220V±20。為了降低電源模塊的體積,采用TOP2XX脈寬調(diào)制功率開關(guān)為核心器件,構(gòu)成單端反激式電路。
故障保護(hù)模塊負(fù)責(zé)監(jiān)視低壓用戶的負(fù)荷電器的運(yùn)行情況,當(dāng)發(fā)生短路、過流、漏電或電網(wǎng)電壓超標(biāo)時(shí),向MCU系統(tǒng)模塊發(fā)出信號(hào)請(qǐng)求執(zhí)行斷電控制程序。
計(jì)量模塊負(fù)責(zé)把用戶的用電功率轉(zhuǎn)化為頻率正比于功率大小的脈沖串,提供給MCU系統(tǒng)模塊進(jìn)行電量計(jì)算。即使用戶實(shí)施了竊電行為,它仍然可以輸出正確的電量計(jì)算脈沖串,并向MCU系統(tǒng)發(fā)出竊電信號(hào)。
負(fù)荷控制模塊是一個(gè)受MCU系統(tǒng)輸出的TTL電平控制的大功率交流無觸點(diǎn)開關(guān),能夠過零關(guān)斷或開啟6kW的負(fù)荷功率。
MCU系統(tǒng)由AT89C528位單片機(jī)、X5045看門狗芯片和DS1302時(shí)鐘日歷芯片構(gòu)成。它是用戶電能表終端的計(jì)算監(jiān)控中心,主要負(fù)責(zé)對(duì)電量脈沖串進(jìn)行計(jì)算或處理,執(zhí)行就地或遠(yuǎn)方的負(fù)荷控制程序,與低壓擴(kuò)頻載波通信模塊進(jìn)行數(shù)據(jù)交換并控制其收發(fā)信。
顯示模塊由一個(gè)8位LED及其動(dòng)態(tài)掃描控制芯片構(gòu)成,主要完成電量數(shù)據(jù)的舊的查詢顯示,便于用戶了解自己的電量或電費(fèi)情況。
低壓擴(kuò)頻載波模塊主要由SSCP200低壓電力線擴(kuò)頻載波網(wǎng)絡(luò)控制器、前置功放和電力線耦合電路構(gòu)成,負(fù)責(zé)對(duì)MCU系統(tǒng)送來的數(shù)據(jù)進(jìn)行線性掃頻調(diào)制,放大后耦合到電力線上,對(duì)通過電力線送來的載波信號(hào)進(jìn)行掃頻解調(diào)后送給MCU系統(tǒng)。這種數(shù)據(jù)通信采用了收發(fā)分時(shí)控制的半雙工通信。該模塊與配變集中器的設(shè)計(jì)通信距離為1000m。在信道特性最惡劣的情況下,也要保證不小于600m。
2.4配電變壓器集中器的總體設(shè)計(jì)
配變集中器主要由三個(gè)分相耦合的低壓擴(kuò)頻通信模塊、三個(gè)按相配置的電能表模塊、MCU單片機(jī)系統(tǒng)、3個(gè)雙口RAM和一個(gè)工控機(jī)系統(tǒng)及電話線調(diào)制解調(diào)器構(gòu)成。
低壓擴(kuò)頻載波通信模塊分相配置,是為了杜絕跨相耦合載波信號(hào),電能表和MCU電路按相配置是為了使集中器能夠并行處理各相的用戶終端數(shù)據(jù),增加數(shù)據(jù)傳輸和處理速度。以上電路基本上與用戶終端類似,只是不具備故障保護(hù)、竊電偵測和負(fù)荷控制電路而已。
在配變集中器內(nèi)設(shè)置電能表模塊便于對(duì)每一相的總電量進(jìn)行計(jì)量和統(tǒng)計(jì)分析,以作為用電治理部門考核線損和平衡3相負(fù)荷的依據(jù)。
工控機(jī)完成與每一相的MCU系統(tǒng)交換數(shù)據(jù),并通過Modem和公用電話網(wǎng)與營業(yè)站抄算主機(jī)交換數(shù)據(jù)信號(hào)。上行和下行數(shù)據(jù)要經(jīng)過工控機(jī)的處理,并在不需要數(shù)據(jù)通信的時(shí)候儲(chǔ)存在工控機(jī)的磁盤中。鑒于數(shù)據(jù)處理量不是很大,選用486工控機(jī)就能滿足要求。
2.5營業(yè)站抄算主站的總體設(shè)計(jì)
營業(yè)站抄算主機(jī)主要由PC機(jī)、電話線Modem及其軟件構(gòu)成。主要負(fù)責(zé)營業(yè)站到配電變壓器集中器之間的數(shù)據(jù)指令的調(diào)制發(fā)送、解調(diào)接受及綜合分析處理。另外,電話線Modem還可以將營業(yè)站用電治理主機(jī)與電費(fèi)托收銀行聯(lián)機(jī)。
PC微機(jī)主要完成用戶用電數(shù)據(jù)的采集,送電能表參數(shù)、用電信息、欠費(fèi)警告及斷電控制,不安全和違章用電監(jiān)視報(bào)警,用戶用電治理及查詢,報(bào)表輸出等功能。
其中,用電采集程序可以進(jìn)行定時(shí)統(tǒng)抄、不定時(shí)統(tǒng)抄及單用戶隨時(shí)查抄;用電量可按地址統(tǒng)計(jì),也可按相位統(tǒng)計(jì),以便合理地調(diào)整配電變壓器A、B、C三相負(fù)載的配置,使供電系統(tǒng)的性能發(fā)揮得更好;在電費(fèi)結(jié)算時(shí),可通過分時(shí)計(jì)費(fèi),合理定價(jià),使負(fù)載基本恒定;電表參數(shù)、用電信息可送到用戶終端,從而非常方便地修改電能表參數(shù),顯示用戶的用電量及結(jié)算電費(fèi);欠費(fèi)警告及斷電控制功能可督促用戶按時(shí)交費(fèi);不安全和違章用電監(jiān)視報(bào)警功能可使用電監(jiān)察人員迅速準(zhǔn)確地維護(hù)用電秩序;日?qǐng)?bào)表、月報(bào)表、年報(bào)表的形成和輸出方便而快捷。
3結(jié)論與展望
3.1研究結(jié)論
我們?cè)趲追N不同的環(huán)境下對(duì)用戶電能表終端和配變集中器進(jìn)行了測試,取得了比較滿足的結(jié)果。依照CEBus標(biāo)準(zhǔn)編制的程序,在傳輸過程中,沒有發(fā)現(xiàn)誤碼的存在。不同的測試環(huán)境下,干擾強(qiáng)度與信道輸入阻抗的波動(dòng)范圍是影響擴(kuò)頻載波可靠通信距離的兩個(gè)主要因素,數(shù)據(jù)通信成功的平均幀延遲時(shí)間與平均通信距離的關(guān)系較大。
戶表采集器的性能指標(biāo)如下:
·載波通信距離:架空網(wǎng)或電纜電網(wǎng)均可達(dá)1000m;
·抄表成功率:可達(dá)99.7;
·抄表正確率:100;
·讀數(shù)準(zhǔn)確度:計(jì)數(shù)精度達(dá)到小數(shù)點(diǎn)后兩位,用戶電能表讀數(shù)與標(biāo)準(zhǔn)電能表的誤差不大于1個(gè)字(即0.5kWh);
·時(shí)鐘誤差:天天小于 1s;
·用戶電能表功耗:待機(jī)時(shí)≤200mW,發(fā)送數(shù)據(jù)時(shí)≤700mW,發(fā)送時(shí)間≤25ms,接收靈敏度≤2mW;
·采用工業(yè)級(jí)芯片,環(huán)境溫度:-20~ 85℃;
·工作電壓:AC165~260V;
·掉電保護(hù):電源斷電情況下,數(shù)據(jù)可保存10年;
3.2總結(jié)與展望
電能直供到戶是供電企業(yè)最重要的營銷舉措,這使得電能營銷部門的電能抄算業(yè)務(wù)量成倍增長。采用新的遠(yuǎn)程抄表技術(shù)來改善用電治理和電能營銷的裝備水平、優(yōu)化電能市場服務(wù)的技術(shù)手段是供電企業(yè)最緊迫的需求。
我國的低壓電能供給都是以配電變壓器為一個(gè)臺(tái)區(qū)單元,在配電變壓器和用戶之間不使用任何獨(dú)立的中繼通信設(shè)備或?qū)S眯诺?,直接利用低壓電力線構(gòu)成與低壓電網(wǎng)系統(tǒng)結(jié)構(gòu)相對(duì)應(yīng)的用戶電能表終端+配變集中器+營業(yè)站電能抄算主機(jī)組網(wǎng)的遠(yuǎn)程抄表系統(tǒng),我們認(rèn)為這符合低壓遠(yuǎn)抄系統(tǒng)的主流發(fā)展方向,因而具有推廣應(yīng)用前景。
具有低壓擴(kuò)頻載波數(shù)據(jù)遠(yuǎn)傳功能的用戶電能表終端和配變集中器是構(gòu)成本文所提出的遠(yuǎn)程抄表方案的核心裝置。最終的技術(shù)目的的實(shí)現(xiàn)必須建立在成功地開發(fā)用戶電表終端和配變集中器的基礎(chǔ)之上,還要做營業(yè)站抄算主機(jī)的軟件編制和數(shù)據(jù)庫編制。顯然本文所做的工作還離這一目標(biāo)有相當(dāng)長的一段距離。本文只是對(duì)用戶電能表終端及其擴(kuò)頻載波通信模塊作了實(shí)用化開發(fā)設(shè)計(jì)和樣機(jī)試制,并且通過樣機(jī)的現(xiàn)場測試。配變集中器、軟件只作了一個(gè)方案性的設(shè)計(jì)。
本文所取得的另一個(gè)成果就是,把用戶電能表終端設(shè)計(jì)成一個(gè)智能化的綜合性終端,除了完成電能的記錄和計(jì)量外,它還具有用戶現(xiàn)場防竊電、防誤接線、故障保護(hù)、遠(yuǎn)方停送電、遠(yuǎn)方修改電能表參數(shù)和負(fù)荷控制功能,這些技術(shù)手段對(duì)提高供電企業(yè)的用電治理水平無疑具有積極的意義。
參考文獻(xiàn)
[1]邵源,鐘炬,等.關(guān)于低壓用戶集中抄表系統(tǒng)綜述.電力系統(tǒng)自動(dòng)化,1999(9).[2]徐平平,邱玉春.電力集中抄表中的通信技術(shù).電力系統(tǒng)通信,1999(4).[3]楊士中.靜電無繩廣播方法.[4]周世煒,張紹卿,洪文學(xué).一種基于電力配電網(wǎng)絡(luò)的雙向工頻通信技術(shù).電子技術(shù),1999(8).[5]邱玉春.利用電力線組網(wǎng)的監(jiān)控網(wǎng)絡(luò)協(xié)議選擇.現(xiàn)代通信,2000(1).[6]邱玉春,徐平平.低壓電力線載波通信特性分析.電力系統(tǒng)通信,1998:6(48).
第五篇:信息檢索論文
論搜索引擎中文自動(dòng)分詞技術(shù)
【摘要】
搜索引擎是應(yīng)用在web上的軟件系統(tǒng),它以一定的策略搜集和發(fā)現(xiàn)信息,再對(duì)信息進(jìn)行處理和組織后為用戶提供web信息查詢服務(wù)。搜索引擎分三個(gè)大模塊:網(wǎng)頁搜集,預(yù)處理和查詢服務(wù)。其中對(duì)搜索信息的預(yù)處理階段的關(guān)鍵技術(shù)是中文分詞和建立倒排文件,本文主要論述搜索引擎工作過程中的中文自動(dòng)分詞技術(shù)。
【關(guān)鍵字】:搜索引擎,中文分詞,分詞方法,分詞難題 【正文】
信息的飛速增長,使搜索引擎成為人們查找信息的首選工具,Google、百度等大型搜索引擎一直是人們討論的話題。目前在中文搜索引擎領(lǐng)域,國內(nèi)的搜索引擎已經(jīng)和國外的搜索引擎效果上相差不遠(yuǎn)。之所以能形成這樣的局面,有一個(gè)重要的原因就在于中文和英文兩種語言自身的書寫方式不同,這其中對(duì)于計(jì)算機(jī)涉及的技術(shù)就是中文分詞。
一、為什么要進(jìn)行分詞?
漢語是世界上最古老和最豐富的語言之一,但是漢語語法才有將近一百年的歷史,而且現(xiàn)代漢語白話文的形成歷史也比較短,加上漢語自身的特點(diǎn),因此它的形式化研究更加困難。對(duì)英文而言,是以詞為單位,詞與詞之間有空格隔開,而中文是以字為單位,多個(gè)字連在一起才能構(gòu)成一個(gè)表達(dá)具體含義的詞,詞與詞之間沒有分割,因此,對(duì)于支持自然語言檢索的工具,從語句中劃分出具有獨(dú)立意義的詞的過程即進(jìn)行中文分詞必不可少。
二、什么是中文分詞?
中文分詞技術(shù)就是搜索引擎針對(duì)用戶提交查詢的關(guān)鍵串進(jìn)行的查詢處理后,根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進(jìn)行的一種技術(shù)。中文分詞技術(shù)屬于自然語言處理技術(shù)范疇,對(duì)于一句話,人可以通過自己的知識(shí)來明白哪些是詞,哪些不是詞,但如何讓計(jì)算機(jī)也能理解?其處理過程就是分詞算法。例如,英文句子I am a student,用中文則為:“我是一個(gè)學(xué)生”。計(jì)算機(jī)可以很簡單通過空格知道student是一個(gè)單詞,但是不能很容易明白“學(xué)”、“生”兩個(gè)字合起來才表示一個(gè)詞。把中文的漢字序列切分成有意義的詞,就是中文分詞,有些人也稱為切詞。我是一個(gè)學(xué)生,分詞的結(jié)果是:我 是 一個(gè) 學(xué)生。
三、中文分詞與搜索引擎
分詞技術(shù)使用在搜索引擎網(wǎng)頁預(yù)處理階段。搜索引擎網(wǎng)頁預(yù)處理第一步是為原始網(wǎng)頁建立索引,形成索引網(wǎng)頁庫;第二步是對(duì)網(wǎng)頁進(jìn)行切分,也就是分詞,將每一篇網(wǎng)頁轉(zhuǎn)化為一組次的集合;最后將網(wǎng)頁索引詞的映射轉(zhuǎn)化為索引詞到網(wǎng)頁的映射,形成倒排文件。
中文分詞到底對(duì)搜索引擎有多大影響?對(duì)于搜索引擎來說,最重要的并不是找到所有結(jié)果,因?yàn)樵谏习賰|的網(wǎng)頁中找到所有結(jié)果沒有太多的意義,沒有人能看得完,最重要的是把最相關(guān)的結(jié)果排在最前面,這也稱為相關(guān)度排序。中文分詞的準(zhǔn)確與否,常常直接影響到對(duì)搜索結(jié)果的相關(guān)度排序。而且中文分詞的準(zhǔn)確度,對(duì)搜索引擎結(jié)果相關(guān)性和準(zhǔn)確性有相當(dāng)大的關(guān)系。
四、中文分詞技術(shù)的分類
我們討論的分詞算法可分為三大類:基于字典、詞庫匹配的分詞方法;基于詞頻度統(tǒng)計(jì)的分詞方法和基于知識(shí)理解的分詞方法。(一)基于字典、詞庫匹配的分詞方法
這種方法又叫做機(jī)械分詞方法,它是按照一定的策略將待分析的漢字串與一個(gè)“充分大的”機(jī)器詞典中的詞條進(jìn)行配,若在詞典中找到某個(gè)字符串,則匹配成功(識(shí)別出一個(gè)詞)。按照掃描方向的不同,串匹配分詞方法可以分為正向匹配和逆向匹配;按照不同長度優(yōu)先匹配的情況,可以分為最大(最長)匹配和最?。ㄗ疃蹋┢ヅ?;按照是否與詞性標(biāo)注過程相結(jié)合,又可以分為單純分詞方法和分詞與標(biāo)注相結(jié)合的一體化方法。
常用的幾種機(jī)械分詞方法如下:
(1)最大正向匹配法(MaximumMatching Method)通常簡稱為MM法
其基本思想為:假定分詞詞典中的最長詞有i個(gè)漢字字符,則用被處理文檔的當(dāng)前字串中的前i個(gè)字作為匹配字段,查找字典。若字典中存在這樣的一個(gè)i字詞,則匹配成功,匹配字段被作為一個(gè)詞切分出來。如果詞典中找不到這樣的一個(gè)i字詞,則匹配失敗,將匹配字段中的最后一個(gè)字去掉,對(duì)剩下的字串重新進(jìn)行匹配處理…… 如此進(jìn)行下去,直到匹配成功,即切分出一個(gè)詞或剩余字串的長度為零為止。這樣就完成了一輪匹配,然后取下一個(gè)i字字串進(jìn)行匹配處理,直到文檔被掃描完為止。
(2)逆向最大匹配法(Recerse MaximumMatching Method))通常簡稱為RMM法
RMM法的基本原理與MM法相同 ,不同的是分詞切分的方向與MM法相反,而且使用的分詞辭典也不同。逆向最大匹配法從被處理文檔的末端開始匹配掃描,每次取最末端的2i個(gè)字符(i字字串)作為匹配字段,若匹配失敗,則去掉匹配字段最前面的一個(gè)字,繼續(xù)匹配。相應(yīng)地,它使用的分詞詞典是逆序詞典,其中的每個(gè)詞條都將按逆序方式存放。在實(shí)際處理時(shí),先將文檔進(jìn)行倒排處理,生成逆序文檔。然后,根據(jù)逆序詞典,對(duì)逆序文檔用正向最大匹配法處理即可。
由于漢語中偏正結(jié)構(gòu)較多,若從后向前匹配,可以適當(dāng)提高精確度。所以,逆向最大匹配法比正向最大匹配法的誤差要小。統(tǒng)計(jì)結(jié)果表明 ,單純使用正向最大匹配的錯(cuò)誤率為 1/16 9,單純使用逆向最大匹配的錯(cuò)誤率為 1/245。例如切分字段“碩士研究生產(chǎn)”,正向最大匹配法的結(jié)果會(huì)是“碩士研究生 / 產(chǎn)”,而逆向最大匹配法利用逆向掃描,可得到正確的分詞結(jié)果“碩士 / 研究 / 生產(chǎn)”。
(3)最少切分法:使每一句中切出的詞數(shù)最小。還可以將上述各種方法相互組合,例如,可以將正向最大匹配方法和逆向最大匹配方法結(jié)合起來構(gòu)成雙向匹配法。由于漢語單字成詞的特點(diǎn),正向最小匹配和逆向最小匹配一般很少使用。一般說來,逆向匹配的切分精度略高于正向匹配,遇到的歧義現(xiàn)象也較少。統(tǒng)計(jì)結(jié)果表明,單純使用正向最大匹配的錯(cuò)誤率為1/169,單純使用逆向最大匹配的錯(cuò)誤率為1/245。但這種精度還遠(yuǎn)遠(yuǎn)不能滿足實(shí)際的需要。實(shí)際使用的分詞系統(tǒng),都是把機(jī)械分詞作為一種初分手段,還需通過利用各種其它的語言信息來進(jìn)一步提高切分的準(zhǔn)確率。
一種方法是改進(jìn)掃描方式,稱為特征掃描或標(biāo)志切分,優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞,以這些詞作為斷點(diǎn),可將原字符串分為較小的串再來進(jìn)機(jī)械分詞,從而減少匹配的錯(cuò)誤率。另一種方法是將分詞和詞類標(biāo)注結(jié)合起來,利用豐富的詞類信息對(duì)分詞決策提供幫助,并且在標(biāo)注過程中又反過來對(duì)分詞結(jié)果進(jìn)行檢驗(yàn)、調(diào)整,從而極大地提高切分的準(zhǔn)確率。
(二)全切分和基于詞的頻度統(tǒng)計(jì)的分詞方法
基于詞的頻度統(tǒng)計(jì)的分詞方法是一種全切分方法。在討論這個(gè)方法之前我們先要明白有關(guān)全切分的相關(guān)內(nèi)容。(1)全切分
全切分要求獲得輸入序列的所有可接受的切分形式,而部分切分只取得一種或幾種可接受的切分形式,由于部分切分忽略了可能的其他切分形式,所以建立在部分切分基礎(chǔ)上的分詞方法不管采取何種歧義糾正策略,都可能會(huì)遺漏正確的切分,造成分詞錯(cuò)誤或失敗。而建立在全切分基礎(chǔ)上的分詞方法,由于全切分取得了所有可能的切分形式,因而從根本上避免了可能切分形式的遺漏,克服了部分切分方法的缺陷。
全切分算法能取得所有可能的切分形式,它的句子覆蓋率和分詞覆蓋率均為100%,但全切分分詞并沒有在文本處理中廣泛地采用。(2)基于詞的頻度統(tǒng)計(jì)的分詞方法:
這是一種全切分方法。它不依靠詞典,而是將文章中任意兩個(gè)字同時(shí)出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì),次數(shù)越高的就可能是一個(gè)詞。它首先切分出與詞表匹配的所有可能的詞,運(yùn)用統(tǒng)計(jì)語言模型和決策算法決定最優(yōu)的切分結(jié)果。它的優(yōu)點(diǎn)在于可以發(fā)現(xiàn)所有的切分歧義并且容易將新詞提取出來。
(三)基于知識(shí)理解的分詞方法
該方法主要基于句法、語法分析,并結(jié)合語義分析,通過對(duì)上下文內(nèi)容所提供信息的分析對(duì)詞進(jìn)行定界,它通常包括三個(gè)部分:分詞子系統(tǒng)、句法語義子系統(tǒng)、總控部分。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對(duì)分詞歧義進(jìn)行判斷。這類方法試圖讓機(jī)器具有人類的理解能力,需要使用大量的語言知識(shí)和信息。由于漢語語言知識(shí)的籠統(tǒng)、復(fù)雜性,難以將各種語言信息組織成機(jī)器可直接讀取的形式。因此目前基于知識(shí)的分詞系統(tǒng)還處在試驗(yàn)階段。
(四)一種新的分詞方法
并行分詞方法:這種分詞方法借助于一個(gè)含有分詞詞庫的管道進(jìn)行 ,比較匹配過程是分步進(jìn)行的 ,每一步可以對(duì)進(jìn)入管道中的詞同時(shí)與詞庫中相應(yīng)的詞進(jìn)行比較 ,由于同時(shí)有多個(gè)詞進(jìn)行比較匹配 ,因而分詞速度可以大幅度提高。這種方法涉及到多級(jí)內(nèi)碼理論和管道的詞典數(shù)據(jù)結(jié)構(gòu)。
到底哪種分詞算法的準(zhǔn)確度更高,目前并無定論。對(duì)于任何一個(gè)成熟的分詞系統(tǒng)來說,不可能單獨(dú)依靠某一種算法來實(shí)現(xiàn),都需要綜合不同的算法。筆者了解,海量科技的分詞算法就采用“復(fù)方分詞法”,所謂復(fù)方,相當(dāng)于用中藥中的復(fù)方概念,即用不同的藥才綜合起來去醫(yī)治疾病,同樣,對(duì)于中文詞的識(shí)別,需要多種算法來處理不同的問題。
五、分詞中的難題
有了成熟的分詞算法,是否就能容易的解決中文分詞的問題呢?事實(shí)遠(yuǎn)非如此。中文是一種十分復(fù)雜的語言,讓計(jì)算機(jī)理解中文語言更是困難。在中文分詞過程中,有兩大難題一直沒有完全突破。
(一)切分歧義
就人對(duì)漢語的理解而言,漢語的分詞是一個(gè)理解的過程,這個(gè)過程綜合了詞法、語法、語義等各種信息。因此,一個(gè)理想的分詞系統(tǒng)也應(yīng)綜合運(yùn)用這些信息,而在計(jì)算機(jī)處理中這些信息的提取又是以分詞為前提的。所以,分詞與這些信息的運(yùn)用是既相聯(lián)系又相制約的一種相輔相成的關(guān)系,而純粹的機(jī)械切分必然會(huì)帶來切分歧義。
歧義是指同樣的一句話,可能有兩種或者更多的切分方法。例如:學(xué)歷史知識(shí),因?yàn)椤皩W(xué)歷”和“歷史”都是詞,那么這個(gè)短語就可以分成“學(xué)歷”和“歷史”。這種稱為交叉歧義。像這種交叉歧義十分常見由于沒有人的知識(shí)去理解,計(jì)算機(jī)很難知道到底哪個(gè)方案正確。
交叉歧義相對(duì)組合歧義來說是還算比較容易處理,組合歧義就必需根據(jù)整個(gè)句子來判斷了。例如,在句子“這個(gè)門把手壞了”中,“把手”是個(gè)詞,但在句子“請(qǐng)把手拿開”中,“把手”就不是一個(gè)詞;在句子“將軍任命了一名中將”中,“中將”是個(gè)詞,但在句子“產(chǎn)量三年中將增長兩倍”中,“中將”就不再是詞。這些詞計(jì)算機(jī)又如何去識(shí)別? 如果交叉歧義和組合歧義計(jì)算機(jī)都能解決的話,在歧義中還有一個(gè)難題,是真歧義。真歧義意思是給出一句話,由人去判斷也不知道哪個(gè)應(yīng)該是詞,哪個(gè)應(yīng)該不是詞。例如:“乒乓球拍賣完了”,可以切分成“乒乓 球拍 賣 完 了”、也可切分成“乒乓球 拍賣 完 了”,如果沒有上下文其他的句子,恐怕誰也不知道“拍賣”在這里算不算一個(gè)詞。
(二)新詞
專業(yè)術(shù)語稱為未登錄詞。也就是那些在字典中都沒有收錄過,但又確實(shí)能稱為詞的那些詞。最典型的是人名,人可以很容易理解句子“張三虎是山東人”中,“張三虎”是個(gè)詞,因?yàn)槭且粋€(gè)人的名字,但要是讓計(jì)算機(jī)去識(shí)別就困難了。如果把“張三虎”做為一個(gè)詞收錄到字典中去,全世界有那么多名字,而且每時(shí)每刻都有新增的人名,收錄這些人名本身就是一項(xiàng)巨大的工程。即使這項(xiàng)工作可以完成,還是會(huì)存在問題,例如:在句子“張三虎頭虎腦的”中,“張三虎”還能不能算詞?
新詞中除了人名以外,還有機(jī)構(gòu)名、地名、產(chǎn)品名、商標(biāo)名、簡稱、省略語等,還有目前網(wǎng)絡(luò)流行語詞,如“有沒有”、“傷不起”“神馬浮云”、“童鞋們”、“蘿莉”等等都是很難處理的問題,而且這些又正好是人們經(jīng)常使用的詞,因此對(duì)于搜索引擎來說,分詞系統(tǒng)中的新詞識(shí)別十分重要。目前新詞識(shí)別準(zhǔn)確率已經(jīng)成為評(píng)價(jià)一個(gè)分詞系統(tǒng)好壞的重要標(biāo)志之一。
判斷一個(gè)系統(tǒng)的中文分詞功能好壞,主要在于消歧功能和對(duì)未登錄詞識(shí)別功能。并且優(yōu)秀的分詞策略應(yīng)該是盡量不拆分,需要拆分時(shí),先把長的拆成中的,如果結(jié)果還是少,再把中的拆成短的。
【參考文獻(xiàn)】
【1】 吳勝遠(yuǎn);并行分詞方法的研究--《計(jì)算機(jī)研究與發(fā)展》1997年07期
【2】 張旭;一個(gè)基于詞典與統(tǒng)計(jì)的中文分詞算法[D];電子科技大學(xué);2007年
【3】 梁斌;走進(jìn)搜索引擎 電子工業(yè)出版社 2007年1月
【4】(美)克羅夫特;搜索引擎:信息檢索實(shí)踐 機(jī)械工業(yè)出版社
2010年