第一篇:挖掘生活源泉論文
生活是五彩繽紛的。在作文教學(xué)中,教師要時時把握“惟有生活才是作文的源泉”的宗旨,引導(dǎo)學(xué)生走進生活、觀察生活、審視生活、積累素材、引發(fā)激情,真正做到在生活中學(xué)習(xí)作文和評閱作文,在作文中學(xué)會做人?!吧钍莿?chuàng)作的唯一源泉。”筆者認為:提高學(xué)生對生活水平的觀察、品味,引導(dǎo)學(xué)生發(fā)現(xiàn)生活中的平凡之美,是激發(fā)學(xué)生寫好作文的必由之路。
一、觀察生活,積累素材,書寫生活百味
在學(xué)生眼里,作文最大的困難不是寫作技巧,而是題材的匱乏。這當然不是說學(xué)生已經(jīng)掌握了寫作技巧,現(xiàn)實是相當部分的學(xué)生對作文技巧或是無暇顧及或是根本沒有體會。如果學(xué)生連文章都寫不出來,那些技巧豈不成了無本之木、無源之水?
首先,我專門利用了一節(jié)班會課,冒冒失失在學(xué)生沒準備的情況下做了一個小游戲:找一位同學(xué)上臺表演小品,請其余同學(xué)仔細觀察。由于這位表演的同學(xué)事先沒做準備,我就讓別的同學(xué)來形容一下此時的情景,說說自己看到了什么。這時,學(xué)生的積極性被調(diào)動了起來。有的說:“他的臉漲得通紅,像一只紅龍蝦,一會兒用手撓撓頭,又低頭想了一會兒,一會兒又把手放在嘴里咬了幾下,再抬起頭看看老師,又像一只猴子……”有的說:……大家七嘴八舌地說開了。接著我又不失時機地引導(dǎo):“看到他的這些動作,你想到了什么詞?”“很茫然”、“難堪”、“狼狽”……同學(xué)都說了許多。于是,我又問:“你是怎么知道的?”有的說:“從他的表演看出來的?!庇械恼f:“從他的動作、神態(tài)看出來的?!痹趯W(xué)生的積極性調(diào)動起來之后,我讓學(xué)生把這些寫下來。評講時,我及時表揚了同學(xué)們,然后告訴他們:“這就是作文,作文就是要留心觀察生活中的人和事,用心想,用腦思考,然后把他用語言表述出來?!闭n后,我布置同學(xué)寫一位自己熟悉的人,大家都寫得很形象、很有特點。這樣逐步引導(dǎo),很快解決了學(xué)生提出的“沒材料”的問題。有了材料,我再教給學(xué)生如何積累材料,要求學(xué)生每天用簡短的話寫觀察心得,也就是培養(yǎng)學(xué)生寫日記的習(xí)慣。特別強調(diào)學(xué)生一定要把時間、事件、人物說清楚,以及由這件事你想到了什么,可以是一名話、兩句話或者是一、兩段話。這樣,通過平時觀察和練筆,使學(xué)生人人有話說,解決了“寫什么”的問題,并且有組織、有指導(dǎo)地觀察和練筆,使學(xué)生嘗到了甜頭,懂得了作文不神秘,是用語言文字再現(xiàn)生活,只要注意觀察你身邊的人和事,作文就有話說。
二、審視生活,體驗感悟,引發(fā)真情實感
“生活即教育”(陶行知語)。作文教學(xué)中,我們應(yīng)當引導(dǎo)學(xué)生審視生活,抓住契機,感悟生活;要激發(fā)學(xué)生的內(nèi)心情感,引導(dǎo)學(xué)生滿腔熱忱地去觀察、感受周圍的生活,表達自己對生活的獨特感受和真切體驗,讓他們在生活中寫作,因生活而作文,在作文中學(xué)會做人,使學(xué)生作文真正走出“輕描淡寫,沒有深度,為了中心而中心”的困境,有一個新的飛躍。在一次以《愛的教育》為主題的作文指導(dǎo)課中,我巧妙地運用了現(xiàn)成的教材:本校有一位學(xué)生,在六年前因一場車禍失去了爸爸,家中的媽媽也身患重疾,生活窘迫。為了能讓學(xué)生更加真切地感受到那種場景,我特意組織大家到這位學(xué)生家中采訪。來到這位學(xué)生家中,眼前的情景令同學(xué)們喟然:三間低矮的房子,家中除了一臺黑白電視機,再也沒有什么值錢的家具了。同學(xué)們目睹臥在床上含著熱淚講述不幸的母親,個個眼中噙滿了淚水……回到學(xué)校,我沒有讓學(xué)生馬上動筆,而是先讓他們說說采訪后的感受。我讓學(xué)生圍繞下列問題來談:看到這種情況你有何感想?現(xiàn)在你最想說的話是什么?最想干的事是什么?學(xué)生紛紛發(fā)言,課堂氣氛十分熱烈。最后通過老師聲情并茂的總結(jié)、點撥,學(xué)生“動之以情”,豐富的感情流于筆端,結(jié)果《人間自有真情在》、《同在一片藍天下》、《感動在一瞬間》、《關(guān)愛無限》等優(yōu)秀習(xí)作誕生了。
三、融于生活,創(chuàng)造作文,體驗成功的快樂
《標準》中指出:要溝通課堂內(nèi)外,充分利用學(xué)校、家庭和社區(qū)教育資源,開展綜合性的學(xué)習(xí)活動,拓寬學(xué)生的學(xué)習(xí)空間,增加學(xué)生語文實踐的機會。學(xué)生的生活積累從某種意義上說是有限的,教師要給學(xué)生提供拓寬視野、感受生活、積累知識的機會?,F(xiàn)在的孩子大多是獨生子女,在家里是衣來伸手、飯來張口,極少幫父母做家務(wù),油瓶倒了也懶得扶。調(diào)查表明,能主動幫父母做家務(wù)的占15%,會做簡單的飯菜的幾乎沒有。于是,我決定把“包餃子”這個活動搬進課堂。在整個活動中,孩子們搟的面皮有圓的、橢圓的、長方形的和不規(guī)則形的;包得餃子更不用說了,可以用奇形怪狀來形容,孩子們還給它們起了許多有趣的名字。在燒水下餃子這一環(huán)節(jié)就更有意思了,有的孩子被煙熏得眼淚直流,有的臉上沾了許多灰,一個個變成了“花臉貓”。但品嘗到自己親手包的餃子,那種發(fā)自內(nèi)心的樂和美,從孩子們洋溢的表情可以看出。學(xué)生親身經(jīng)歷了,作文寫得有血有肉,好得沒法說,并且他們也從中懂得了做家長的不容易,一舉兩得。
小小童心,大千世界。只要我們讓學(xué)生走進生活、關(guān)注生活、融入生活、感悟生活,在作文中注入生活的細流,學(xué)生就能在作文的土壤中孕育亮麗的風(fēng)景、滋生鮮活的生命力。這樣,他們的文章才會千姿百態(tài),才會“橫看成嶺側(cè)成峰”、“淡妝濃抹總相宜”,才會達到在生活中學(xué)習(xí)作文和做人的目的,才會使作文教學(xué)變成豐富有趣、生動活潑、真情可喜、令人向往、其樂無窮的現(xiàn)實生活。
第二篇:挖掘生活源泉,彰顯作文語言魅力----作文生活化淺談
挖掘生活源泉,彰顯作文語言魅力
----作文生活化淺談
【摘要】葉圣陶先生曾說過:“生活猶如泉源,文章猶如溪水,泉源豐盈而不枯竭,溪水自然活潑地流個不停?!笨梢?只有關(guān)心身邊的現(xiàn)實生活,才能更具體的去熱愛生活,追尋生命的價值,闡釋生命的意義。作文教學(xué)是小學(xué)語文教學(xué)的難點。如何才能使學(xué)生易于動筆,樂于表達呢?通過幾年來的教學(xué)實踐表明,讓作文貼近學(xué)生生活實際,才能避免學(xué)生下筆千言、一揮而就的尷尬。本文結(jié)合自己的教學(xué)實踐,認真總結(jié)了點滴對策,以求與同行共勉:教師在生活中要教會學(xué)生通過觀察、思考來了解生活。課堂內(nèi)外要通過豐富多彩的課外活動來走近生活,然后給學(xué)生提供用作文表達生活的契機,最終實現(xiàn)多數(shù)學(xué)生易于表達,樂于動筆,下筆千言,洋洋灑灑的作文溫情之旅的良好狀態(tài)。
【關(guān)鍵詞】社會生活;寫作素材;源頭活水
【正文】生活是寫作的源頭活水,教師要鼓勵孩子積極投身于五彩斑斕的生活實際,放眼關(guān)注國家大事,細心關(guān)注身邊小事,認真積累寫作素材,隨時結(jié)合自己的人生經(jīng)歷和心路歷程,深入思考,用心感悟,寫出感受獨特、內(nèi)容充實、思想深刻的文章來。只有不斷拓寬孩子生活的空間,讓他們親身實踐,切身體會,寫作時才能得心應(yīng)手,有事可寫,有感可發(fā),有情可抒。那么如何從生活中尋找寫作素材,用作文表現(xiàn)生活呢?這是擺在語文教師面前的一項艱巨的任務(wù)!
一、引領(lǐng)學(xué)生觀察生活,有感而發(fā)
生活缺乏體驗,心中缺少對生活真切的感受,孤零零的去寫作,是寫不出真情實感的?!拔膶W(xué)貴為有感而發(fā),緣事而發(fā)。”這句話深刻地揭示了文為心聲的道理。小學(xué)生對周圍事物往往視而不見,充耳不聞,導(dǎo)致作文時頭腦空空無內(nèi)容可寫。其實生活世界是多姿多彩、變化萬千的,這需要一雙發(fā)現(xiàn)美的眼睛去捕捉,這需要教師在平時的教學(xué)中要重視對學(xué)生觀察能力的培養(yǎng)。每天發(fā)生在我們身邊的新鮮事不計其數(shù),引領(lǐng)學(xué)生認識生活,體驗生活,思考生活,首先教師不能視而不見,聽而不聞,要及時采擷生活的浪花,讓孩子練練筆。
父親節(jié)的那天我布置給同學(xué)們這樣的作業(yè),回家大聲喊出:“老爸,我愛你!”記錄下父親的語言、動作、表情,談?wù)勛约汉俺鋈サ男睦砀惺?。實際告訴我們:這樣的文章感動的令人流淚。
我經(jīng)常布置學(xué)生結(jié)合焦點訪談的內(nèi)容進行社會跟蹤調(diào)查(三鹿奶粉事件、工業(yè)三廢的治理、農(nóng)村留守兒童的教育等等社會問題),學(xué)習(xí)撰寫調(diào)查報告,讓學(xué)生真實的走進社會,走進生活,為寫作積累真實的素材。
從學(xué)生的文本中,我感受到了他們已經(jīng)用他們稚嫩的肩膀勇敢地承擔(dān)起社會責(zé)任。如:
針對當前工業(yè)園區(qū)城市化進程中存在的問題進行社會調(diào)查,引發(fā)思考,很多學(xué)生會情不自禁的寫下意見或建議,寄語有關(guān)部門,孩子在履行自己的歷史使命的同時,對自己也是良好的思想教育。學(xué)生通過調(diào)查研究,體驗到當今社會城市化的過程與代價,同學(xué)們親臨現(xiàn)場感受滄桑變遷的同時,了解到人為因素是今昔變化的關(guān)鍵原因所在。同學(xué)們學(xué)有所動,動有所感,感有所悟。
二、抓住契機組織活動,豐富寫作素材
教師在指導(dǎo)學(xué)生親近自然,投入地球母親懷抱的同時,還要教給孩子用眼睛觀察這個新奇世界、用耳朵去諦聽天籟之音、用鼻子去呼吸天地之氣息、用心靈去感受自然之韻味的本領(lǐng)。盡情地投入生活,體味生活,將人與自然和諧相生的情愫訴諸筆端,要通過教師有目的組織的各種活動珍視個人的獨特感受,積累寫作素材,更好地調(diào)動學(xué)生學(xué)習(xí)的主動性。
1、親近自然
在教學(xué)中打破了封閉的課堂教學(xué),讓學(xué)生投入到大自然中,投入到社會生活中。我利用節(jié)假日組織學(xué)生參觀、游覽、郊游等活動,學(xué)生走出校園,回歸自然,自由采擷自己需要的寫作素材。投入母親的懷抱,感受到母愛的博大,情不自禁的疏于筆端:有的陶醉于對家鄉(xiāng)的美麗風(fēng)光,有的為家鄉(xiāng)悠久的歷史文化而自豪,有的為家鄉(xiāng)改革開放所帶來的發(fā)展變化而喝彩,他們深深地?zé)釔壑约簜ゴ蟮淖鎳?。通過活動不但磨練意志、開闊眼界,還可以幫助學(xué)生建立良好的人際關(guān)系、健全了學(xué)生的人格。情感得到升華,心靈得到陶冶。
2、重大歷史節(jié)日
我習(xí)慣以革命紀念日像盧溝橋事變、八一建軍節(jié)、九一八事變、十一國慶節(jié)為契機,請革命軍人,講革命傳統(tǒng)故事,對學(xué)生進行革命英雄主義教育,抒發(fā)對英雄們的崇敬之情。《親愛的祖國,生日快樂》、《振興中華、立志雪恥》這樣的文章年年寫,年年新,字里行間滲透著祖國花朵的豪言壯語!
3、熱點話題
我經(jīng)常結(jié)合成功訓(xùn)練課、思想品德課、綜合實踐課等有關(guān)的類似環(huán)保、污染、文明、誠信、感恩等時髦話題進行探討、辯論,學(xué)生自然會在豐富的校園活動中寫,在快樂的課余生活中寫。孩子們有時還把自己細細打磨的大作主動的展示給同學(xué)們:環(huán)保倡議書偷偷地上了墻報:環(huán)境,是人類賴以生存的必要條件,保護環(huán)境,人人有責(zé)。為了自已,為了子孫后代,為了全人類能永遠擁有美好的家園。請大家積極響應(yīng)倡議,為綠色環(huán)?!氨M一份責(zé),出一份力”!我們口號是:“綠色環(huán)保,舉手之勞;從我做起,從點滴做起”。以節(jié)水為榮!隨時關(guān)緊水龍頭,別讓水空流。以節(jié)電為榮!省一度電,少一分污染,多一分貢獻。以節(jié)糧為榮!愛惜糧食,讓節(jié)儉美德代代傳。參加植樹造林,保護森林資源。養(yǎng)成好習(xí)慣!不隨地
吐痰,不隨地亂扔亂倒廢棄物。少用一次性制品!節(jié)約能源,維護環(huán)境整潔。愛護一草一木!做綠色使者,保持空氣清新。做動物的朋友!善待生命,與萬物共存。樹立奉獻、友愛、互助、進步的時代新風(fēng)!奉獻社會,傳遞愛心,傳播文明,構(gòu)建和諧社會。既提高了寫作水平,又提升了全體學(xué)生的素養(yǎng),真是事半功倍!
4、傳統(tǒng)節(jié)日
母親節(jié)前夕,孩子們記下了令母親感動的一幕,有的同學(xué)這樣寫道:今天是母親節(jié),我準備親手為母親做一張賀卡。用紙做?不,用紙會破壞森林資源。21世紀是信息時代了,所以,我決定為媽媽制作一張電子賀卡。我連哄帶騙地把媽媽拉到書房(,讓她欣賞了我為她制作的賀卡。媽媽開心極了,臉上蕩起了像去年在母親節(jié)上得到我的禮物一樣的笑容。此刻,警戒完全消失,母女的心緊緊貼在一起。在這一天,我得到了媽媽回來后的第一個擁抱??
兒童節(jié)的前夕,我布置給同學(xué)們的作業(yè),回家大聲喊出:“老爸、老媽,我愛你!”記錄下父親的語言、動作、神情,讓他們說出自己的兒童節(jié)與現(xiàn)在有什么不同,記錄下自己的心理感受。這樣的文章是孩子真情的流露,自然感人至深,感動讀者,感動作者。
三、觀察生活,裝飾語言
如果細心觀察生活,就會發(fā)現(xiàn)生活的色彩與亮度,抓住這種色彩,再運用比喻、擬人、夸張、排比等表現(xiàn)手法,使語言在表達上更清新,更流暢。我們平常要多引導(dǎo)學(xué)生觀察生活,發(fā)現(xiàn)別人未曾發(fā)現(xiàn)的,習(xí)作中應(yīng)該鼓勵學(xué)生敢于創(chuàng)新。因為書面語言無法像口頭語言那樣借助表情和動作來加強表現(xiàn)力,那就得用修飾手段進行“淡妝濃抹”,把“瘦弱的骨架”裝飾起來,使文章既豐富又有觀賞性,最后,把語言的美感傳達給讀者,從而給人視覺上以全新的體驗。
如寫奶奶家種著很普通的花生,她靜心觀看,潛心思考,果然平中見奇,發(fā)現(xiàn)了花生成長的過程,并生動地描繪下來:花生從插種到開花只用一個月左右的時間,花生開花授粉后,子房基部子房柄的分生組織細胞迅速分裂,從花萼管內(nèi)長出一條果針,它先向上生長,幾天后,子房柄下垂于地面。在延伸過程中,子房柄逐漸形成一頂硬幅,保護幼嫩的果針入土。之后表皮逐漸皺縮,莢果逐漸成熟。當花生結(jié)果時,喜歡黑暗、濕潤和機械刺激的生態(tài)環(huán)境。當你看到一顆花生瑟縮地長在地上,不能立刻辨別出它有沒有果實,非得等你親密接觸后才能知道……我愿意做像它一樣的人……當我把這篇文章范讀給學(xué)生聽的時候,引起了大家的嘖嘖稱贊,我便隨機引導(dǎo)學(xué)生我們應(yīng)該像她一樣抓住生活的細節(jié),關(guān)注生活的每一個角落,就連平常的事也會有不平常的東西可寫,也會有別人沒有寫過的素材可以寫,在我的引導(dǎo)下,像這樣的文章越來越多,學(xué)生的寫作興趣也越來越濃。
四、注重作文的實用價值,發(fā)揮語言的交際功能。
怎樣才能使作文教學(xué)具有真正的“實用價值”?如果教師能堅持每次作文訓(xùn)練都有一定的目的、動機和實際應(yīng)用相聯(lián)系,就能幫助學(xué)生穩(wěn)步樹立起“有需要而表達”的觀念,并讓他們清楚地認識到自己的作文都是有實用價值的。
如寫我是小小推銷員,首先讓學(xué)生明白,推銷作文是為了讓別人了解自己的產(chǎn)品,喜歡并愿意與你一起分享產(chǎn)品的價值;再如,寫一份心得體會,是為了把自己成功或失敗的方法和經(jīng)驗告訴給同學(xué),讓他們也獲得成功,而且少走彎路??指導(dǎo)學(xué)生寫每一篇作文,都要注意幫助他們明確作文的目的,激發(fā)內(nèi)部動機,使之成為一種愉悅的社會交際活動。這樣,作文訓(xùn)練就與生活相聯(lián)系,與他們的社會交際相關(guān)聯(lián)。不僅使學(xué)生感受到表達是生活的需求,激發(fā)學(xué)生強烈的寫作欲望,促進他們的語言表達。
五、關(guān)注學(xué)生身邊情感,誘發(fā)寫作動力
作文與社會貼近,與生活貼近,與學(xué)生的實際貼近。一個熱愛生活的人,一定能夠從生活中“自然”感悟到一些東西的,積淀的情感也會自然地流諸筆底。學(xué)生從抒發(fā)情感的過程中獲得理智上的滿足,而且在情感、心靈的充盈中獲得精神的體驗。創(chuàng)設(shè)和培養(yǎng)一個給學(xué)生以情激情,以趣激趣的作文環(huán)境,來引導(dǎo)他們進入展示自我、完善自我的自由王國。實踐中,我發(fā)現(xiàn)學(xué)生敏銳的眼光洞察勞動者的美好心靈,見義勇為者的崇高境界,貪官污吏的丑惡嘴臉等等身邊的故事,積極捕捉貼近生活的素材,把寫作當作是一種心靈的釋放而絕不是外來壓力的一種任務(wù)、一種負擔(dān)?!傲η蟊磉_自己對自然、社會、人生的獨特體驗和真切感受”,寫出了真情實感,思想感悟發(fā)自肺腑,給人感染,引發(fā)共鳴。
如2008年的汶川大地震:武警、消防官兵的英勇無畏,志愿者的樂于奉獻,白衣戰(zhàn)士的忘我工作,海外僑胞的慷慨解囊,舉全國之力重建家園的壯舉.....都能讓學(xué)生感受到中華民族的凝聚力、向心力。在那令人悲痛、感動、激情蕩漾的時刻,我讓學(xué)生作文:《我向災(zāi)區(qū)表寸心》、《災(zāi)區(qū)的人要挺住》、《災(zāi)區(qū)的人們,我是你的親人》等。孩子們的話語讓我熱淚盈眶:地震無情人有情,雖然我不能來到現(xiàn)場進行援救,但我會為你們放孔明燈祈福,折千紙鶴祈禱,就像<螢火蟲>這首歌一樣:“燃燒小小的生命在夜晚,為夜晚的路人照亮方向,短暫的生命努力的發(fā)光,讓黑暗的世界充滿希望.......”這首歌就像一架投影儀,勾起了地震中無數(shù)感人的場面,不知不覺,眼睛已泛起了一層薄霧.我的耳邊仿佛想起了溫家寶總理親切的語句:“孩子,一定要好好活下去!”我眼前仿佛看見了人民解放軍叔叔翻山越嶺,不畏艱難地開展救援工作;護士阿姨強忍著失去親生孩子繼續(xù)擔(dān)著救死扶傷的天職;教師用他那血肉之軀抬起幾十斤的鋼筋混凝土.....我的心在那一瞬間顫抖著,是啊,地震并不可怕,只要我們眾志成城,攜手相助,就一定能夠挺過困難的險阻.....如:每學(xué)期我在班上召開了一次“感謝您,所有關(guān)愛我的人”的主題班會,因為是貼近孩子的生活,說起來總是滔滔不絕的,有的說感謝那些鼓勵自己學(xué)習(xí)的同學(xué),有的說感謝那些默默支持自己的老師,有的說感謝那些讓我走出人生低谷的名言警句,有的說感謝賦予我寶貴生命的媽媽,有的說,感謝撫養(yǎng)我長大,給了我無微不至的關(guān)懷、呵護的奶奶。有的說感謝那些在我成長的路上愛護、關(guān)心、幫助過我的所有人。會后我趁熱打鐵,讓他們寫信給關(guān)心你的人,表達自己對他們的尊敬、思念、感動之情,告訴他們自己的遠大理想。效果可想而知。每個同學(xué)都洋洋灑灑的寫了幾大篇。
一件細微的小事、一次小小的**、一絲淡淡的愁緒,都可成為寫作的契機和內(nèi)容。那些突如其來的或高興、或難過、或感動、或迷惘的情緒,都應(yīng)該成為寫作的題材。此時我為了讓學(xué)生能細細地感受自己的這種感情,積極地創(chuàng)設(shè)條件讓他們把這種感情表達出來。
生活原本就是使人百感交集的旅程,一顰一笑、一景一物都可以滋養(yǎng)我們的內(nèi)心世界,凝聚成動人的詩篇。“生活化”作文教學(xué)正是致力于學(xué)生現(xiàn)實生活的建構(gòu)、全面的生活能力的培養(yǎng),領(lǐng)悟生活意義,實現(xiàn)生命的價值!
【參考文獻】
1、汪雷雷;走進源頭活水:寫作教學(xué)必須回歸生活;新課程研究;2009.11
2、夏艷麗;溫情流淌的心靈旅程; 教學(xué)月刊;2009.11
3、何捷等.《作文與生活》小學(xué)作文創(chuàng)新教學(xué) 山西教育出版社 2004.10
4、周毅.《放膽寫真情》 小學(xué)作文創(chuàng)新教學(xué) 山西教育出版社 2004.07
5、于冥慧.《淺議作文語言創(chuàng)新》 山西教育出版社 2004.11
第三篇:數(shù)據(jù)挖掘論文
數(shù)據(jù)挖掘論文
在現(xiàn)實的學(xué)習(xí)、工作中,許多人都有過寫論文的經(jīng)歷,對論文都不陌生吧,論文是一種綜合性的文體,通過論文可直接看出一個人的綜合能力和專業(yè)基礎(chǔ)。那么你知道一篇好的論文該怎么寫嗎?下面是小編整理的數(shù)據(jù)挖掘論文,希望能夠幫助到大家。
數(shù)據(jù)挖掘論文1[1]劉瑩.基于數(shù)據(jù)挖掘的商品銷售預(yù)測分析[J].科技通報.20xx(07)
[2]姜曉娟,郭一娜.基于改進聚類的電信客戶流失預(yù)測分析[J].太原理工大學(xué)學(xué)報.20xx(04)
[3]李欣海.隨機森林模型在分類與回歸分析中的應(yīng)用[J].應(yīng)用昆蟲學(xué)報.20xx(04)
[4]朱志勇,徐長梅,劉志兵,胡晨剛.基于貝葉斯網(wǎng)絡(luò)的客戶流失分析研究[J].計算機工程與科學(xué).20xx(03)
[5]翟健宏,李偉,葛瑞海,楊茹.基于聚類與貝葉斯分類器的網(wǎng)絡(luò)節(jié)點分組算法及評價模型[J].電信科學(xué).20xx(02)
[6]王曼,施念,花琳琳,楊永利.成組刪除法和多重填補法對隨機缺失的二分類變量資料處理效果的比較[J].鄭州大學(xué)學(xué)報(醫(yī)學(xué)版).20xx(05)
[7]黃杰晟,曹永鋒.挖掘類改進決策樹[J].現(xiàn)代計算機(專業(yè)版).20xx(01)
[8]李凈,張范,張智江.數(shù)據(jù)挖掘技術(shù)與電信客戶分析[J].信息通信技術(shù).20xx(05)
[9]武曉巖,李康.基因表達數(shù)據(jù)判別分析的隨機森林方法[J].中國衛(wèi)生統(tǒng)計.20xx(06)
[10]張璐.論信息與企業(yè)競爭力[J].現(xiàn)代情報.20xx(01)
[11]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[12]徐進華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[13]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[14]馮軍.數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[15]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[16]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運營管理[D].華東師范大學(xué)20xx
[17]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場中應(yīng)用[D].重慶大學(xué)20xx
[18]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[19]賈治國.數(shù)據(jù)挖掘在高考填報志愿上的應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[20]馬飛.基于數(shù)據(jù)挖掘的航運市場預(yù)測系統(tǒng)設(shè)計及研究[D].大連海事大學(xué)20xx
[21]周霞.基于云計算的太陽風(fēng)大數(shù)據(jù)挖掘分類算法的研究[D].成都理工大學(xué)20xx
[22]阮偉玲.面向生鮮農(nóng)產(chǎn)品溯源的基層數(shù)據(jù)庫建設(shè)[D].成都理工大學(xué)20xx
[23]明慧.復(fù)合材料加工工藝數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)集成[D].大連理工大學(xué)20xx
[24]陳鵬程.齒輪數(shù)控加工工藝數(shù)據(jù)庫開發(fā)與數(shù)據(jù)挖掘研究[D].合肥工業(yè)大學(xué)20xx
[25]岳雪.基于海量數(shù)據(jù)挖掘關(guān)聯(lián)測度工具的設(shè)計[D].西安財經(jīng)學(xué)院20xx
[26]丁翔飛.基于組合變量與重疊區(qū)域的SVM-RFE方法研究[D].大連理工大學(xué)20xx
[27]劉士佳.基于MapReduce框架的頻繁項集挖掘算法研究[D].哈爾濱理工大學(xué)20xx
[28]張曉東.全序模塊模式下范式分解問題研究[D].哈爾濱理工大學(xué)20xx
[29]尚丹丹.基于虛擬機的Hadoop分布式聚類挖掘方法研究與應(yīng)用[D].哈爾濱理工大學(xué)20xx
[30]王化楠.一種新的混合遺傳的基因聚類方法[D].大連理工大學(xué)20xx
[31]楊毅超.基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺分析與研究[D].湖南農(nóng)業(yè)大學(xué)20xx
[32]徐進華.基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D].北京交通大學(xué)20xx
[33]俞馳.基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶獲取系統(tǒng)研究[D].西安電子科技大學(xué)20xx
[34]馮軍.數(shù)據(jù)挖掘在自動外呼系統(tǒng)中的應(yīng)用[D].北京郵電大學(xué)20xx
[35]于寶華.基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D].天津大學(xué)20xx
[36]王仁彥.數(shù)據(jù)挖掘與網(wǎng)站運營管理[D].華東師范大學(xué)20xx
[37]彭智軍.數(shù)據(jù)挖掘的若干新方法及其在我國證券市場中應(yīng)用[D].重慶大學(xué)20xx
[38]涂繼亮.基于數(shù)據(jù)挖掘的智能客戶關(guān)系管理系統(tǒng)研究[D].哈爾濱理工大學(xué)20xx
[39]賈治國.數(shù)據(jù)挖掘在高考填報志愿上的應(yīng)用[D].內(nèi)蒙古大學(xué)20xx
[ 40]馬飛.基于數(shù)據(jù)挖掘的航運市場預(yù)測系統(tǒng)設(shè)計及研究[D].大連海事大學(xué)20xx
數(shù)據(jù)挖掘論文2摘要:文章首先對數(shù)據(jù)挖掘技術(shù)及其具體功能進行簡要分析,在此基礎(chǔ)上對科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進行論述。期望通過本文的研究能夠?qū)蒲泄芾硭降倪M一步提升有所幫助。
關(guān)鍵詞:科研管理;數(shù)據(jù)挖掘;技術(shù)應(yīng)用
1數(shù)據(jù)挖掘技術(shù)及其具體功能分析
所謂的數(shù)據(jù)挖掘具體是指通過相關(guān)的算法在大量的數(shù)據(jù)當中對隱藏的、有利用價值的信息進行搜索的過程。數(shù)據(jù)挖掘是一門綜合性較強的科學(xué)技術(shù),其中涉及諸多領(lǐng)域的知識,如人工智能、機器學(xué)習(xí)、數(shù)據(jù)庫、數(shù)理統(tǒng)計等等。數(shù)據(jù)挖掘技術(shù)具有如下幾個方面的功能:1.1關(guān)聯(lián)規(guī)則分析。這是數(shù)據(jù)挖掘技術(shù)較為重要的功能之一,可從給定的數(shù)據(jù)集當中,找到出現(xiàn)比較頻繁的項集,該項集具體是指行形如X->Y,在數(shù)據(jù)庫當中,X和Y所代表的均為屬性取值。在關(guān)聯(lián)規(guī)則下,只要數(shù)據(jù)滿足X條件,就一定滿足Y條件,數(shù)據(jù)挖掘技術(shù)的這個功能在商業(yè)金融等領(lǐng)域中的應(yīng)用較為廣泛。1.2回歸模式分析回歸模式主要是通過對連續(xù)數(shù)值的預(yù)測,來達到挖掘數(shù)據(jù)的目的。例如,已知企業(yè)某個人的教育背景、工作年限等條件,可對其年薪的范圍進行判定,整個分析過程是利用回歸模型予以實現(xiàn)的。在該功能中,已知的條件越多,可進行挖掘的信息就越多。1.3聚類分析聚類具體是指將相似程度較高的數(shù)據(jù)歸為同一個類別,通過聚類分析能夠從數(shù)據(jù)集中找出類似的數(shù)據(jù),并組成不同的組。在聚類分析的過程中,需要使用聚類算法,借助該算法對數(shù)據(jù)進行檢測后,可以判斷其隱藏的屬性,并將數(shù)據(jù)庫分為若干個相似的組。
2科研管理中數(shù)據(jù)挖掘技術(shù)的應(yīng)用
科研是科學(xué)研究的簡稱,具體是指為認識客觀事物在內(nèi)在本質(zhì)及其運動規(guī)律,而借助某些技術(shù)手段和設(shè)備,開展調(diào)查研究、實驗等活動,并為發(fā)明和創(chuàng)造新產(chǎn)品提供理論依據(jù)??蒲泄芾硎菍蒲许椖咳^程的管理,如課題管理、經(jīng)費管理、成果管理等等。由于科學(xué)研究中涉及的內(nèi)容較多,從而給科研管理工作增添了一定的難度。為進一步提升科研管理水平,可在不同的管理環(huán)節(jié)中,對數(shù)據(jù)挖掘技術(shù)進行應(yīng)用。下面就此展開詳細論述。
2.1在立項及可行性評估中的應(yīng)用
科研管理工作的開展需要以相關(guān)的科研課題作為依托,當課題選定之后,需要對其可行性及合理性進行全面系統(tǒng)地評估,由此使得科研課題的立項及評估成為科研管理的主要工作內(nèi)容?,F(xiàn)階段,國內(nèi)的科研課題立項采用的是申請審批制,具體的流程是:由科研機構(gòu)的相關(guān)人員負責(zé)提出申請,然后再由科技主管部門從申請中進行篩選,經(jīng)過業(yè)內(nèi)專家的評審論證之后,擇優(yōu)選取科研項目的承接單位。在進行科研課題立項的過程中,涉及諸多方面的內(nèi)容,具體包括申請單位、課題的研究領(lǐng)域、經(jīng)費安排、主管單位以及評審專家等。通過調(diào)查發(fā)現(xiàn),由于國家宏觀調(diào)控政策的缺失,導(dǎo)致科研立項中存在低水平、重復(fù)性研究的情況,從而造成大量的研究經(jīng)費浪費,所取得的研究成果也不顯著??蒲泄芾聿块T雖然建立了相對完善的數(shù)據(jù)庫系統(tǒng),并且系統(tǒng)也涵蓋與項目申請、審評等方面有關(guān)的基本操作流程,如上傳項目申報文件、將文件發(fā)給相關(guān)的評審專家、對評審結(jié)果進行自動統(tǒng)計等。從本質(zhì)的角度上講,數(shù)據(jù)庫管理系統(tǒng)所完成的這些工作流程,就是將傳統(tǒng)管理工作轉(zhuǎn)變?yōu)樾畔⒒9蚀?,?yīng)當對已有的數(shù)據(jù)進行深入挖掘,從而找出其中更具利用價值的信息,據(jù)此對科研立項進行指導(dǎo),這樣不但能夠使有限的科技資源得到最大限度地利用,而且還能使科研經(jīng)費的使用效益獲得全面提升。在科研立項階段,可對數(shù)據(jù)挖掘技術(shù)進行合理運用,借此來對課題申請中涉及的各種因素進行挖掘,找出其中潛在的規(guī)則,為指標體系的構(gòu)建和遴選方法的選擇提供可靠依據(jù),最大限度地降低不合理因素對課題立項帶來的影響,對確需資助的科研項目進行準確選擇,并給予相應(yīng)的資助。在科研立項環(huán)節(jié)中,對數(shù)據(jù)挖掘技術(shù)進行應(yīng)用時,可以借助改進后的Apriori算法進行數(shù)據(jù)挖掘,從中找出關(guān)聯(lián)規(guī)則,在對該規(guī)則進行分析的基礎(chǔ)上,對立項的合理性進行評價。
2.2在項目管理中的應(yīng)用
項目管理是科研管理的關(guān)鍵環(huán)節(jié),為提高項目管理的效率和水平,可對數(shù)據(jù)挖掘技術(shù)進行合理運用。在信息時代到來的今天,計算機技術(shù)、網(wǎng)絡(luò)技術(shù)的普及程度越來越高,國內(nèi)很多科研機構(gòu)都紛紛構(gòu)建起了相關(guān)的管理信息系統(tǒng),其中涵蓋了諸多的信息,如課題、科研人員、研究條件等等,而在這些信息當中,隱藏著諸多具有特定意義的規(guī)則,為找出這些規(guī)則,需要借助數(shù)據(jù)挖掘技術(shù),對信息進行深入分析,進而獲取對科研項目有幫助的信息。由于大部分科研管理部門建立的科研管理信息系統(tǒng)時間較早,從而使得系統(tǒng)本身的功能比較單一,如信息刪減、修改、查詢、統(tǒng)計等等,雖然這些功能可以滿足對科研課題進展、經(jīng)費使用等方面的管理,但其面向的均為數(shù)據(jù)庫管理人員,處理的也都是常規(guī)事務(wù)。而從科研課題的管理者與決策者的角度上看,管理信息系統(tǒng)這些功能顯然是有所不足的,因為他們需要對歷史進行分析和提煉,從中獲取相應(yīng)的數(shù)據(jù),為決策和管理工作的開展提供支撐。對此,可應(yīng)用數(shù)據(jù)挖掘技術(shù)的OLAP,即數(shù)據(jù)庫聯(lián)機分析處理,由此能夠幫助管理者從不同的方面對數(shù)據(jù)進行觀察,進而深入了解數(shù)據(jù)并獲取所需的信息。利用OLAP可以發(fā)現(xiàn)多種于科研課題有關(guān)信息之間的內(nèi)在聯(lián)系,這樣管理者便能及時發(fā)現(xiàn)其中存在的相關(guān)問題,并針對問題采取有效的方法和措施加以應(yīng)對。運用數(shù)據(jù)挖掘技術(shù)能夠?qū)蒲许椖康南嚓P(guān)數(shù)據(jù)進行分析,找出其中存在的矛盾,從而使管理工作的開展更具針對性。
3結(jié)論
綜上所述,科研管理是一項較為復(fù)雜且系統(tǒng)的工作,其中涵蓋的信息相對較多。為此,可將數(shù)據(jù)挖掘技術(shù)在科研管理中進行合理應(yīng)用,對相關(guān)信息進行深入分析,從中挖掘出有利用價值的信息,為科研管理工作的開展提供可靠的依據(jù),由此除了能夠確??蒲许椖宽樌M行之外,還能提高科研管理水平。
參考文獻:
[1]劉占波,王立偉,王曉麗.大數(shù)據(jù)環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的高??蒲泄芾硐到y(tǒng)的設(shè)計[J].電子測試,20xx(1):21-22.
[2]史子靜.高??蒲泄芾硐到y(tǒng)中計算機數(shù)據(jù)挖掘技術(shù)的運用研究[J].科技資訊,20xx(6):65-66.
[3]丁磊.數(shù)據(jù)挖掘技術(shù)在高校教師科研管理中的應(yīng)用研究[D].大連海事大學(xué),20xx.
數(shù)據(jù)挖掘論文3進入信息時代以來,世界電子商務(wù)呈現(xiàn)飛速發(fā)展的勢頭。站在長遠的角度,企業(yè)能否在新經(jīng)濟的背景下生存,關(guān)鍵在于企業(yè)能否利用電子商務(wù)的優(yōu)勢,但是電子商務(wù)在發(fā)展的同時也使得企業(yè)暴露了一些問題,其中企業(yè)的數(shù)據(jù)量大,而真正有用的信息卻很少。所以現(xiàn)代企業(yè)急需解決的問題是如何在大量數(shù)據(jù)中發(fā)現(xiàn)有用數(shù)據(jù),獲得利于企業(yè)的商業(yè)運作的數(shù)據(jù),從而提高企業(yè)的競爭力。要解決這些問題,傳統(tǒng)的數(shù)據(jù)分析已經(jīng)不能適應(yīng)企業(yè)的發(fā)展需求,傳統(tǒng)的數(shù)據(jù)分析工具對數(shù)據(jù)的內(nèi)在信息無法提取,而是對指定的數(shù)據(jù)進行簡單的處理。信息管理系統(tǒng)的運用以及信息量的加大,企業(yè)希望有人可以創(chuàng)新及提高數(shù)據(jù)分析功能,只有擁有了高層次的數(shù)據(jù)分析功能,才能對企業(yè)決策工作提供有效的支持。所以,數(shù)據(jù)挖掘技術(shù)呈現(xiàn)在人們的眼前。
一、數(shù)據(jù)挖掘技術(shù)的發(fā)展背景
在近幾十年中,人們在利用信息技術(shù)生產(chǎn)和搜集數(shù)據(jù)的能力上有了很大提升。商業(yè)管理、政府辦公以及科學(xué)研究等等都應(yīng)用了大量的數(shù)據(jù)庫。并且仍在繼續(xù)發(fā)展,所以人們?yōu)榇藢⒚媾R一個新的挑戰(zhàn),在信息爆炸的今天,我們都需面對地問題是信息過量,那么我們將如何在大量的信息庫當中獲取有用的知識,提高信息利用率呢?要想讓數(shù)據(jù)成為企業(yè)的有效資源,并使它為企業(yè)的戰(zhàn)略發(fā)展及業(yè)務(wù)決策提供有效保障。否則,大量的數(shù)據(jù)將會阻礙公司的發(fā)展。因此,數(shù)據(jù)挖掘技術(shù)在人們被數(shù)據(jù)淹沒且急需知識的境地中帶來了希望,并在發(fā)展過程中顯示了它頑強的生命力。
人們長期對數(shù)據(jù)庫的技術(shù)進行研究和開發(fā)而創(chuàng)新出數(shù)據(jù)挖掘技術(shù),剛開始時商業(yè)數(shù)據(jù)一般存于計算機的數(shù)據(jù)庫里,然后變成了對數(shù)據(jù)庫進行訪問并查詢,而數(shù)據(jù)庫技術(shù)進入更高的臺階是由于數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用,數(shù)據(jù)挖掘技術(shù)給企業(yè)的運作和發(fā)展帶來很大便利,它不僅可以對以往的數(shù)據(jù)進行查閱,從而可以把各個時期的數(shù)據(jù)進行對比分析,利于商業(yè)水平的提高。商業(yè)數(shù)據(jù)庫正呈現(xiàn)空前發(fā)展的態(tài)勢,并且在各種行業(yè)中數(shù)據(jù)倉庫得到了廣泛的應(yīng)用。數(shù)據(jù)挖掘的核心包括數(shù)據(jù)統(tǒng)計、人工智能以及機器學(xué)習(xí)等等。且歷經(jīng)了十多年的發(fā)展歷程,使得數(shù)據(jù)挖掘技術(shù)趨向于穩(wěn)定。
二、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
1.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用
一種把客戶當作核心的經(jīng)營策略就是客戶關(guān)系管理,為了滿足企業(yè)的產(chǎn)品開發(fā)、市場營銷以及管理的決策,而通過現(xiàn)代技術(shù)來滿足。為獲取商業(yè)知識而利用客戶的信息,并以此來提高企業(yè)在市場當中的競爭力,采用數(shù)據(jù)挖掘技術(shù),企業(yè)可以充分地利用客戶數(shù)據(jù)資源,并對客戶進行分類分析,這樣不僅有利于企業(yè)對客戶的盈利能力進行分析,更有利于尋找有潛力的客戶,為企業(yè)帶來發(fā)展。另夕卜,為應(yīng)對商業(yè)數(shù)據(jù)的不斷增多,數(shù)據(jù)挖掘技術(shù)將成為企業(yè)立足的關(guān)鍵技術(shù),這項技術(shù)不僅可以加強企業(yè)對客戶的管理及其跟蹤市場活動,預(yù)測客戶的消費方向,并依據(jù)消費的趨勢開發(fā)產(chǎn)品。另外,客戶評價模型對客戶進行評價,并在分析客戶行為對企業(yè)收益產(chǎn)生的影響,達到企業(yè)與客戶和企業(yè)利潤最優(yōu)化。同時,在客戶數(shù)據(jù)挖掘技術(shù)應(yīng)用的基礎(chǔ)上,企業(yè)可以依據(jù)重點客戶和評價市場性能。為擴大企業(yè)銷售的渠道,制定個性化的營銷策略。通過呼叫中心優(yōu)化及暢通溝通的渠道,強化客戶關(guān)系管理的智能化并提高服務(wù)質(zhì)量。
2.數(shù)據(jù)挖掘技術(shù)在網(wǎng)站運營中的應(yīng)用
為提高網(wǎng)站的點擊率,網(wǎng)站的設(shè)計者們在設(shè)計網(wǎng)站時不再完全根據(jù)專家的意見來設(shè)計,而是依據(jù)訪問者在網(wǎng)站當中留下的痕跡來設(shè)計網(wǎng)站,其中包括了網(wǎng)站結(jié)構(gòu)的設(shè)計和外觀。在設(shè)計網(wǎng)站時,為節(jié)約客戶的訪問時間,壓縮網(wǎng)站的開支,網(wǎng)站的設(shè)計者會根據(jù)訪問者的訪問路徑,并分析這些路徑。如果可以分析并設(shè)計出最優(yōu)化的捷徑,這樣不僅可以讓訪問者很輕松地訪問,還能給訪問者留下好的印象,利于網(wǎng)站長期發(fā)展。同時,為降低網(wǎng)站的運營成本,采用數(shù)據(jù)挖掘技術(shù),可以挖掘有效的市場信息,并預(yù)測客戶的下一步行為,這樣有利于提高電子商務(wù)營銷活動的成功率。企業(yè)為增強廣告的目的性,為公司帶來更大的收益,應(yīng)依據(jù)訪問者瀏覽習(xí)慣安排廣告的位置,為企業(yè)帶來一定的廣告收益。
3.數(shù)據(jù)挖掘技術(shù)在商業(yè)信用評估中的應(yīng)用
目前,不良的商業(yè)秩序受低劣信用狀況影響,網(wǎng)上詐騙的事件屢見不鮮及企業(yè)財務(wù)中的造價現(xiàn)象也時有發(fā)生,這些現(xiàn)象的發(fā)生導(dǎo)致了信用危機的產(chǎn)生,嚴重制約著電子商務(wù)的發(fā)展和繁榮。發(fā)達的社會信息水平作為發(fā)展電子商務(wù)的基礎(chǔ),通過偏差分析,控制企業(yè)數(shù)據(jù)的統(tǒng)計和歷史記錄的差別,為構(gòu)建完善的安全體系,采用數(shù)據(jù)挖掘技術(shù)對企業(yè)的經(jīng)營情況進行分析,并對企業(yè)進行資產(chǎn)的評估以及收益分析等等。另外,為強化網(wǎng)站中的網(wǎng)上交易行為的安全,應(yīng)對網(wǎng)絡(luò)進行全程的監(jiān)控。在此基礎(chǔ)上,建立客戶的信譽記錄,這樣不僅可以有效地防止信用危機,更有利于提升企業(yè)風(fēng)險管理的水平和能力。
三、結(jié)語
在電子商務(wù)點中應(yīng)用數(shù)據(jù)挖掘技術(shù),并對這些數(shù)據(jù)進行挖掘,在挖掘當中找到有價值的數(shù)據(jù)。所以,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù),并建立數(shù)據(jù)挖掘為核心的客戶管理系統(tǒng),將使得企業(yè)在市場變化中立于不敗之地。
數(shù)據(jù)挖掘論文4[摘 要]目前,隨著現(xiàn)代科技的發(fā)展,互聯(lián)網(wǎng)已成為當代主流,互聯(lián)網(wǎng)技術(shù)的應(yīng)用已經(jīng)是任何一個國家所不能脫離的,經(jīng)濟全球化已成為一個必然的趨勢,在這樣的一個大數(shù)據(jù)時代,人民對信息的獲取需求呈直線上升的狀態(tài)。21世紀作為一個信息時代,網(wǎng)絡(luò)信息的安全防范也顯得尤為重要,而Web數(shù)據(jù)的數(shù)據(jù)技術(shù),對于網(wǎng)絡(luò)信息安全防范來說,是一個新的技術(shù)運用。本文從Web數(shù)據(jù)挖掘技術(shù)的基本概述入手,分析我國企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問題,最后提出將網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)進行整合運用。
[關(guān)鍵詞]Web數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)信息;安全防范
doi:10.3969/j.issn.1673-0194.20xx.22.091
[中圖分類號]TP393 [文獻標識碼]A [文章編號]1673-0194(20xx)22-0-02
引 言
世界是發(fā)展的,事物是不斷變化的,21世紀是一個大數(shù)據(jù)時代,互聯(lián)網(wǎng)技術(shù)顯得越來越重要。在科技發(fā)展的同時,互聯(lián)網(wǎng)也在家家戶戶普及,然而網(wǎng)絡(luò)安全問題卻隨之而來,人們在運用科技時也在擔(dān)心網(wǎng)絡(luò)技術(shù)的安全性。鑒于此,本文探討利用Web數(shù)據(jù)挖掘技術(shù)來控制網(wǎng)絡(luò)安全,以提高網(wǎng)絡(luò)信息安全度。Web數(shù)據(jù)挖掘技術(shù)概述
Web使用記錄挖掘方式是挖掘網(wǎng)絡(luò)上的瀏覽記錄,然后進行分析,同時還可以獲取其他企業(yè)的信息。通過使用Web數(shù)據(jù)挖掘技術(shù),企業(yè)可以進行復(fù)雜的操作,然后從網(wǎng)頁瀏覽記錄分析出自身企業(yè)的受關(guān)注度,并了解同行競爭企業(yè)的詳細信息,尋找自身的不足。
1.1 Web數(shù)據(jù)挖掘技術(shù)的含義
Web數(shù)據(jù)挖掘技術(shù),指的是通過自身的技術(shù),在獲取網(wǎng)上資源的同時,尋找到企業(yè)感興趣的信息資料。圖1為Web數(shù)據(jù)發(fā)掘技術(shù)工作流程。
Web數(shù)據(jù)發(fā)掘技術(shù)可以涉及多個領(lǐng)域,通過多種數(shù)據(jù)挖掘方式,為企業(yè)找到有用的信息資源。整體來說,Web挖掘技術(shù)有兩種類型,一是建立在人工智能模型的基礎(chǔ)上來實現(xiàn),類似于決策樹、分類等;二是建立在統(tǒng)計模型基礎(chǔ)上來實現(xiàn),類似于神經(jīng)網(wǎng)絡(luò)、自然計算法等。
1.2 Web數(shù)據(jù)挖掘技術(shù)的兩種方式
Web數(shù)據(jù)挖掘技術(shù)整體上來說有兩種方式,分別為內(nèi)容挖掘和使用記錄挖掘。Web內(nèi)容挖掘指的是企業(yè)可以通過Web挖掘技術(shù),自己從網(wǎng)上尋找對企業(yè)有用的信息資源,同時對后臺設(shè)置進行監(jiān)控,減少某些重要交易內(nèi)容的丟失、泄露。企業(yè)還可以通過Web挖掘技術(shù),查詢某些用戶的操作記錄,對企業(yè)的網(wǎng)絡(luò)信息安全進行檢查審核,從而降低企業(yè)信息被不法分子竊取的風(fēng)險。由于其他企業(yè)也有同樣的Web數(shù)據(jù)挖掘技術(shù),因此,企業(yè)也不能深入地去探索同行企業(yè)的內(nèi)部信息,但其通過該技術(shù),可以分析其他企業(yè)的基本信息資源,然后整合出對自身有用的資源,從而制定企業(yè)市場戰(zhàn)略。我國企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問題
目前,科技的發(fā)展,使全球的政治、經(jīng)濟一體化趨勢越來越明顯,互聯(lián)網(wǎng)的進步也使國家企業(yè)面臨著更多的挑戰(zhàn)。我國企業(yè)在網(wǎng)絡(luò)信息安全方面存在的問題也逐步顯現(xiàn),而網(wǎng)絡(luò)信息安全技術(shù)人才緊缺是較為明顯的一個問題。
2.1 人才緊缺問題
21世紀是一個互聯(lián)網(wǎng)的世紀,我國目前正在積極地吸收、引進人才,同時也在不斷地走出去,各行各業(yè)面臨的壓力也在逐漸變大,要想在快速發(fā)展的世界潮流中占據(jù)一席之地,我國必須積極發(fā)展自己的科技產(chǎn)業(yè)。目前,我國的計算機信息技術(shù)水平,在總體上還落后于其他很多國家,而在該方面的人才緊缺問題,是目前一個很明顯的現(xiàn)象。我國在該領(lǐng)域常常要引進國外技術(shù),受制于人,這也就間接地將自己的弊端暴露于人前,因此,我國要積極培養(yǎng)具有計算機網(wǎng)絡(luò)技術(shù)的高端人員,從而促進該領(lǐng)域不斷實現(xiàn)創(chuàng)新。
2.2 自身安全技術(shù)漏洞問題
除了人才緊缺,我國的網(wǎng)絡(luò)產(chǎn)品自身還存在許多的安全技術(shù)漏洞。從近幾年的市場經(jīng)濟發(fā)展現(xiàn)狀來看,我國很多的電子產(chǎn)品被國外壟斷,如蘋果、微軟等高端電子產(chǎn)品,在我國占有很大的市場份額。我國要想重新將自己的電子產(chǎn)品推向市場,就目前的形勢來看,還需要很大的努力,國民崇尚國外產(chǎn)品,不是為了標榜自己的地位,更多的是國外產(chǎn)品的性能確實比我國的要好。因此,通過我國網(wǎng)絡(luò)產(chǎn)品自身存在的安全技術(shù)漏洞可以看出,我國在網(wǎng)絡(luò)安全技術(shù)方面存在許多的不足。網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)的整合近幾年,網(wǎng)絡(luò)信息安全問題一直是國民較為關(guān)注的一個話題,我國也在該方面加大了防范力度。國家在發(fā)展創(chuàng)新互聯(lián)網(wǎng)技術(shù)的同時,也不能忽略其安全問題。網(wǎng)絡(luò)信息安全,關(guān)乎我國企業(yè)的發(fā)展,是企業(yè)重要資料不外漏的重要保護屏障,本文將網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)進行整合(見圖2),旨在提高網(wǎng)絡(luò)信息環(huán)境的安全度,提高我國網(wǎng)絡(luò)信息安全防范能力。
本文初探Web數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息安全防范的整合,將分別從4個方面來提高我國的網(wǎng)絡(luò)信息安全性能。
首先,將存在于網(wǎng)絡(luò)數(shù)據(jù)間的關(guān)聯(lián)尋找出來,然后整合交給企業(yè)進行分析,企業(yè)通過這些關(guān)聯(lián)數(shù)據(jù),分析提煉出對自己企業(yè)有用的信息,繼而制定企業(yè)戰(zhàn)略,防范風(fēng)險。
其次,使用Web數(shù)據(jù)挖掘技術(shù)對網(wǎng)絡(luò)信息進行分類分析。企業(yè)應(yīng)將所有的信息進行綜合,然后按照一定的指標分出類別,并對這些不同類別的信息進行整理,方便后續(xù)的檢索。該項功能主要依靠人工智能來完成,以保證資料能夠得到完整的利用。
再次,使用Web數(shù)據(jù)挖掘技術(shù)對網(wǎng)絡(luò)信息進行聚類分析。企業(yè)應(yīng)將這些具有共同點的信息進行分類,將這些數(shù)據(jù)分成各個小組,但每一個小組都要有一個共同的類似點,以便于從整體對局部進行分析。
最后,利用Web數(shù)據(jù)挖掘技術(shù),根據(jù)收集到的資源信息的不同點進行分類,分類后根據(jù)這些不同點的特征,分析出對自身企業(yè)有用的信息。從整體上說,Web數(shù)據(jù)挖掘技術(shù)通過運用其強大的分析能力,可對網(wǎng)絡(luò)信息進行篩選、整合,企業(yè)可再根據(jù)這些整合出來的資源信息,為自身制定戰(zhàn)略,為企業(yè)發(fā)展提供一個良好的網(wǎng)絡(luò)信息環(huán)境。結(jié) 語
網(wǎng)絡(luò)技術(shù)在給用戶帶來便利的同時,也給用戶的信息安全造成了極大的威脅,科技進步,技術(shù)也在不斷進步,為了使信息得到最大的保護,網(wǎng)絡(luò)信息的安全技術(shù)要隨著科技的進步不斷發(fā)展,為互聯(lián)網(wǎng)的運用提供一個完善安全的網(wǎng)絡(luò)系統(tǒng)。本文通過Web數(shù)據(jù)挖掘技術(shù),將網(wǎng)絡(luò)信息安全防范與該技術(shù)進行有效整合,提高了我國企業(yè)的網(wǎng)絡(luò)信息安全度,以為我國企業(yè)的發(fā)展提供一個良好的環(huán)境。
主要參考文獻
[1]劉波.淺談數(shù)據(jù)挖掘技術(shù)在臨床醫(yī)學(xué)領(lǐng)域中的應(yīng)用[J].電子世界,20xx(12).[2]趙炬紅,陳坤彥.基于數(shù)據(jù)挖掘技術(shù)的茶葉營銷策略分析[J].福建茶葉,20xx(5).[3]崔道江,陳琳,李勇.智能檢索引擎中的網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)優(yōu)化研究[J].計算機測量與控制,20xx(6).[4]王珣.基于Spark平臺的大數(shù)據(jù)挖掘技術(shù)研究[J].微型電腦應(yīng)用,20xx(6)
數(shù)據(jù)挖掘論文51.軟件工程數(shù)據(jù)的挖掘測試技術(shù)
1.1代碼編寫
通過對軟件數(shù)據(jù)進行分類整理,在進行缺陷軟件的排除工作以后,根據(jù)軟件開發(fā)過程中的各種信息進行全新的代碼編寫?;诖a編寫人員的編寫經(jīng)驗,在一般情況,對結(jié)構(gòu)功能與任務(wù)類似的模塊進行重新編寫,這些重新編寫的模塊應(yīng)遵循特定的編寫規(guī)則,這樣才能保證代碼編寫的合理有效性。
1.2錯誤重現(xiàn)
代碼編寫完成以后開發(fā)者會將這些代碼進行版本的確認,然后將正確有效的代碼實際應(yīng)用到適當版本的軟件中去。而對于存在缺陷的代碼,開發(fā)者需要針對代碼產(chǎn)生缺陷的原因進行分析,通過不但調(diào)整代碼內(nèi)的輸入數(shù)據(jù),直到代碼內(nèi)的數(shù)據(jù)與程序報告中的描述接近為止。存在缺陷的代碼往往會以缺陷報告的形式對開發(fā)者予以說明,由于缺陷報告的模糊性,常常會誤導(dǎo)開發(fā)者,進而造成程序設(shè)計混亂。
1.3理解行為
軟件開發(fā)者在設(shè)計軟件的過程中需要明確自己設(shè)計軟件中每一個代碼的內(nèi)容,同時還需要理解其他開發(fā)者編寫的代碼,這樣才能有效地完善軟件開發(fā)者的編寫技術(shù)。同時,軟件開發(fā)者在進行代碼編寫的過程中,需要對程序行為進行準確的理解,以此保證軟件內(nèi)文檔和注釋的準確性。
1.4設(shè)計推究
開發(fā)者在準備對軟件進行完善設(shè)計的過程中,首先需要徹底了解軟件的總體設(shè)計,對軟件內(nèi)部復(fù)雜的系統(tǒng)機構(gòu)進行詳細研究與分析,充分把握軟件細節(jié),這有這樣才能真正實現(xiàn)軟件設(shè)計的合理性與準確性。
2.軟件工程數(shù)據(jù)挖掘測試的有效措施
2.1進行軟件工程理念和方法上的創(chuàng)新
應(yīng)通過實施需求分析,將數(shù)據(jù)挖據(jù)逐漸演變成形式化、規(guī)范化的需求工程,在軟件開發(fā)理念上,加強對數(shù)據(jù)挖掘的重視,對軟件工程的架構(gòu)進行演化性設(shè)計與創(chuàng)新,利用新技術(shù),在軟件開發(fā)的過程中添加敏捷變成與間件技術(shù),由此,提高軟件編寫水平。
2.2利用人工智能
隨著我國科學(xué)技術(shù)的不斷發(fā)展與創(chuàng)新,機器學(xué)習(xí)已經(jīng)逐漸被我國各個領(lǐng)域所廣泛應(yīng)用,在進行軟件工程數(shù)據(jù)挖掘技術(shù)創(chuàng)新的過程中,可以將機器學(xué)習(xí)及數(shù)據(jù)挖掘技術(shù)實際應(yīng)用于軟件工程中,以此為我國軟件研發(fā)提供更多的便捷。人工智能作為我國先進生產(chǎn)力的重要表現(xiàn),在實際應(yīng)用于軟件工程數(shù)據(jù)的挖掘工作時,應(yīng)該利用機器較強的學(xué)習(xí)能力與運算能力,將數(shù)據(jù)統(tǒng)計及數(shù)據(jù)運算通過一些較為成熟的方法進行解決。在軟件工程數(shù)據(jù)挖掘的工作中,合理化的將人工智能實際應(yīng)用于數(shù)據(jù)挖掘,以此為數(shù)據(jù)挖掘提供更多的開發(fā)測試技術(shù)。
2.3針對數(shù)據(jù)挖掘結(jié)果進行評價
通過分析我國傳統(tǒng)的軟件工程數(shù)據(jù)挖掘測試工作,在很多情況下,傳統(tǒng)的數(shù)據(jù)挖掘測試技術(shù)無法做到對發(fā)掘數(shù)據(jù)的全面評價與實際應(yīng)用研究,這一問題致使相應(yīng)的軟件數(shù)據(jù)在被發(fā)掘出來以后無法得到有效地利用,進而導(dǎo)致我國軟件開發(fā)工作受到嚴重的抑制影響。針對這一問題,數(shù)據(jù)開發(fā)者應(yīng)該利用挖掘缺陷檢驗報告,針對缺陷檢驗的結(jié)果,制定相應(yīng)的挖掘結(jié)構(gòu)報告。同時,需要結(jié)合軟件用戶的體驗評價,對挖掘出的數(shù)據(jù)進行系統(tǒng)化的整理與分析,建立一整套嚴謹、客觀的服務(wù)體系,運用CodeCity軟件,讓用戶在的體驗過后可以對軟件進行評價。考慮到軟件的服務(wù)對象是人,因此,在軟件開發(fā)的過程中要將心理學(xué)與管理學(xué)應(yīng)用于數(shù)據(jù)挖掘,建立數(shù)據(jù)挖掘系統(tǒng)和數(shù)據(jù)挖掘評價系統(tǒng)。
3.結(jié)束語
綜上所述,由于軟件工程數(shù)據(jù)挖掘測試技術(shù)廣闊的應(yīng)用前景,我國相關(guān)部門已經(jīng)加大了對軟件技術(shù)的投資與開發(fā)力度,當下,國內(nèi)已經(jīng)實現(xiàn)了軟件工程的數(shù)據(jù)挖掘、人工智能、模式識別等多種領(lǐng)域上的發(fā)展。
數(shù)據(jù)挖掘論文6題目:檔案信息管理系統(tǒng)中的計算機數(shù)據(jù)挖掘技術(shù)探討
摘要:伴隨著計算機技術(shù)的不斷進步和發(fā)展, 數(shù)據(jù)挖掘技術(shù)成為數(shù)據(jù)處理工作中的重點技術(shù), 能借助相關(guān)算法搜索相關(guān)信息, 在節(jié)省人力資本的同時, 提高數(shù)據(jù)檢索的實際效率, 基于此, 被廣泛應(yīng)用在數(shù)據(jù)密集型行業(yè)中。筆者簡要分析了計算機數(shù)據(jù)挖掘技術(shù), 并集中闡釋了檔案信息管理系統(tǒng)計算機數(shù)據(jù)倉庫的建立和技術(shù)實現(xiàn)過程, 以供參考。
關(guān)鍵詞:檔案信息管理系統(tǒng);計算機;數(shù)據(jù)挖掘技術(shù);1 數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)就是指在大量隨機數(shù)據(jù)中提取隱含信息, 并且將其整合后應(yīng)用在知識處理體系的技術(shù)過程。若是從技術(shù)層面判定數(shù)據(jù)挖掘技術(shù), 則需要將其劃分在商業(yè)數(shù)據(jù)處理技術(shù)中, 整合商業(yè)數(shù)據(jù)提取和轉(zhuǎn)化機制, 并且建構(gòu)更加系統(tǒng)化的分析模型和處理機制, 從根本上優(yōu)化商業(yè)決策。借助數(shù)據(jù)挖掘技術(shù)能建構(gòu)完整的數(shù)據(jù)倉庫, 滿足集成性、時變性以及非易失性等需求, 整和數(shù)據(jù)處理和冗余參數(shù), 確保技術(shù)框架結(jié)構(gòu)的完整性。
目前, 數(shù)據(jù)挖掘技術(shù)常用的工具, 如SAS企業(yè)的Enterprise Miner、IBM企業(yè)的Intellient Miner以及SPSS企業(yè)的Clementine等應(yīng)用都十分廣泛。企業(yè)在實際工作過程中, 往往會利用數(shù)據(jù)源和數(shù)據(jù)預(yù)處理工具進行數(shù)據(jù)定型和更新管理, 并且應(yīng)用聚類分析模塊、決策樹分析模塊以及關(guān)聯(lián)分析算法等, 借助數(shù)據(jù)挖掘技術(shù)對相關(guān)數(shù)據(jù)進行處理。檔案信息管理系統(tǒng)計算機數(shù)據(jù)倉庫的建立
2.1 客戶需求單元
為了充分發(fā)揮檔案信息管理系統(tǒng)的優(yōu)勢, 要結(jié)合客戶的實際需求建立完整的處理框架體系。在數(shù)據(jù)庫體系建立中, 要適應(yīng)迭代式處理特征, 并且從用戶需求出發(fā)整合數(shù)據(jù)模型, 保證其建立過程能按照整體規(guī)劃有序進行, 且能按照目標和分析框架參數(shù)完成操作。首先, 要確立基礎(chǔ)性的數(shù)據(jù)倉庫對象, 由于是檔案信息管理, 因此, 要集中劃分檔案數(shù)據(jù)分析的主題, 并且有效錄入檔案信息, 確保滿足檔案的數(shù)據(jù)分析需求。其次, 要對日常工作中的用戶數(shù)據(jù)進行集中的挖掘處理, 從根本上提高數(shù)據(jù)倉庫分析的完整性。
(1)確定數(shù)據(jù)倉庫的基礎(chǔ)性用戶, 其中, 主要包括檔案工作人員和使用人員, 結(jié)合不同人員的工作需求建立相應(yīng)的數(shù)據(jù)倉庫。
(2)檔案工作要利用數(shù)據(jù)分析和檔案用戶特征分析進行分類描述。
(3)確定檔案的基礎(chǔ)性分類主題, 一般而言, 要將文書檔案歸檔情況、卷數(shù)等基礎(chǔ)性信息作為分類依據(jù)。
2.2 數(shù)據(jù)庫設(shè)計單元
在設(shè)計過程中, 要針對不同維度建立相應(yīng)的參數(shù)體系和組成結(jié)構(gòu), 并且有效整合組成事實表的主鍵項目, 建立框架結(jié)構(gòu)。
第一, 建立事實表。事實表是數(shù)據(jù)模型的核心單元, 主要是記錄相關(guān)業(yè)務(wù)和統(tǒng)計數(shù)據(jù)的表, 能整合數(shù)據(jù)倉庫中的信息單元, 并且提升多維空間處理效果, 確保數(shù)據(jù)儲存過程切實有效。(1)檔案管理中文書檔案目錄卷數(shù)事實表:事實表主鍵, 字段類型Int, 字段為Id;文書歸檔年份, 字段類型Int, 字段為Gdyear_key;文書歸檔類型, 字段類型Int, 字段為Ajtm_key;文書歸檔單位, 字段類型Int, 字段為Gddw_key;文書檔案生成年份, 字段類型Int, 字段為Ajscsj_key, 以及文書檔案包括的文件數(shù)目。(2)檔案管理中文書檔案卷數(shù)事實表:事實表主鍵, 字段類型Int, 字段為Id;文書歸檔利用日期, 字段類型Int, 字段為Date_key;文書歸檔利用單位, 字段類型Int, 字段為Dw_key;文書歸檔利用類別, 字段類型Int, 字段為Dalb_key;文書歸檔利用年份, 字段類型Int, 字段為Dayear_key等[1]。
第二, 建立維度表, 在實際數(shù)據(jù)倉庫建立和運維工作中, 提高數(shù)據(jù)管理效果和水平, 確保建立循環(huán)和反饋的系統(tǒng)框架體系, 并且處理增長過程和完善過程, 有效實現(xiàn)數(shù)據(jù)庫模型設(shè)計以及相關(guān)維護操作。首先, 要對模式的基礎(chǔ)性維度進行分析并且制作相應(yīng)的表, 主要包括檔案維表、利用方式維表等。其次, 要建構(gòu)數(shù)據(jù)庫星型模型體系。最后, 要集中判定數(shù)據(jù)庫工具, 保證數(shù)據(jù)庫平臺在客戶管理工作方面具備一定的優(yōu)勢, 集中制訂商務(wù)智能解決方案, 保證集成環(huán)境的穩(wěn)定性和數(shù)據(jù)倉庫建模的效果, 真正提高數(shù)據(jù)抽取以及轉(zhuǎn)換工作的實際水平。需要注意的是, 在全面整合和分析處理數(shù)據(jù)的過程中, 要分離文書檔案中的數(shù)據(jù), 相關(guān)操作如下:
from dag gd temp//刪除臨時表中的數(shù)據(jù)
Ch count=dag 1.importfile(dbo.u wswj)//將文書目錄中數(shù)據(jù)導(dǎo)出到數(shù)據(jù)窗口
Dag 1.()//將數(shù)據(jù)窗口中的數(shù)據(jù)保存到臨時表
相關(guān)技術(shù)人員要對數(shù)據(jù)進行有效處理, 以保證相關(guān)數(shù)據(jù)合并操作、連接操作以及條件性拆分操作等都能按照數(shù)據(jù)預(yù)處理管理要求合理化進行, 從根本上維護數(shù)據(jù)處理效果。
2.3 多維數(shù)據(jù)模型建立單元
在檔案多維數(shù)據(jù)模型建立的過程中, 相關(guān)技術(shù)人員要判定聯(lián)機分析處理項目和數(shù)據(jù)挖掘方案, 整合信息系統(tǒng)中的數(shù)據(jù)源、數(shù)據(jù)視圖、維度參數(shù)以及屬性參數(shù)等, 保證具體單元能發(fā)揮其實際作用, 并且真正發(fā)揮檔案維表的穩(wěn)定性、安全性優(yōu)勢。
第一, 檔案事實表中的數(shù)據(jù)穩(wěn)定, 事實表是加載和處理檔案數(shù)據(jù)的基本模塊, 按照檔案目錄數(shù)據(jù)表和檔案利用情況表分析和判定其類別和歸檔時間, 從而提高數(shù)據(jù)獨立分析水平。一方面, 能追加有效的數(shù)據(jù), 保證數(shù)據(jù)倉庫信息的基本質(zhì)量, 也能追加時間判定標準, 能在實際操作中減少掃描整個表浪費的時間, 從根本上提高實際效率。另一方面, 能刪除數(shù)據(jù), 實現(xiàn)數(shù)據(jù)更新, 檢索相關(guān)關(guān)鍵詞即可。并且也能同時修改數(shù)據(jù), 維護檔案撤出和檔案追加的動態(tài)化處理效果。
第二, 檔案維表的安全性。在維表管理工作中, 檔案參數(shù)和數(shù)據(jù)的安全穩(wěn)定性十分關(guān)鍵, 由于其不會隨著時間的推移出現(xiàn)變化, 因此, 要對其進行合理的處理和協(xié)調(diào)。維表本身的存儲空間較小, 盡管結(jié)構(gòu)發(fā)生變化的概率不大, 但仍會對代表的對象產(chǎn)生影響, 這就會使得數(shù)據(jù)出現(xiàn)動態(tài)的變化。對于這種改變, 需要借助新維生成的方式進行處理, 從而保證不同維表能有效連接, 整合正確數(shù)據(jù)的同時, 也能對事實表外鍵進行分析[2]。檔案信息管理系統(tǒng)計算機數(shù)據(jù)倉庫的實現(xiàn)
3.1 描述需求
隨著互聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)庫技術(shù)不斷進步, 要提高檔案數(shù)字化水平以及完善信息化整合機制, 加快數(shù)據(jù)庫管控體系的更新, 確保設(shè)備存儲以及網(wǎng)絡(luò)環(huán)境一體化水平能滿足需求, 尤其是在檔案資源重組和預(yù)測項目中, 只有從根本上落實數(shù)據(jù)挖掘體系, 才能為后續(xù)信息檔案管理項目升級奠定堅實基礎(chǔ)。另外, 在數(shù)據(jù)表和文書等基礎(chǔ)性數(shù)據(jù)結(jié)構(gòu)模型建立的基礎(chǔ)上, 要按照規(guī)律制定具有個性化的主動性服務(wù)機制。
3.2 關(guān)聯(lián)計算
在實際檔案分析工作開展過程中, 關(guān)聯(lián)算法描述十分關(guān)鍵, 能對某些行為特征進行統(tǒng)籌整合, 從而制定分析決策。在進行關(guān)聯(lián)規(guī)則強度分析時, 要結(jié)合支持度和置信度等系統(tǒng)化數(shù)據(jù)進行綜合衡量。例如, 檔案數(shù)據(jù)庫中有A和B兩個基礎(chǔ)項集合, 支持度為P(A∪B), 則直接表述了A和B在同一時間出現(xiàn)的基礎(chǔ)性概率。若是兩者出現(xiàn)的概率并不大, 則證明兩者之間的關(guān)聯(lián)度較低。若是兩者出現(xiàn)的概率較大, 則說明兩者的關(guān)聯(lián)度較高。另外, 在分析置信度時, 利用Confidence(A→B)=(A|B), 也能有效判定兩者之間的關(guān)系。在出現(xiàn)置信度A的情況下, B的出現(xiàn)概率則是整體參數(shù)關(guān)系的關(guān)鍵, 若是置信度的數(shù)值達到100%, 則直接證明A和B能同一時間出現(xiàn)。
3.3 神經(jīng)網(wǎng)絡(luò)算法
除了要對檔案的實際內(nèi)容進行數(shù)據(jù)分析和數(shù)據(jù)庫建構(gòu), 也要對其利用情況進行判定, 目前較為常見的利用率分析算法就是神經(jīng)網(wǎng)絡(luò)算法, 其借助數(shù)據(jù)分類系統(tǒng)判定和分析數(shù)據(jù)對象。值得注意的是, 在分類技術(shù)結(jié)構(gòu)中, 要結(jié)合訓(xùn)練數(shù)據(jù)集判定分類模型數(shù)據(jù)挖掘結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)算法類似于人腦系統(tǒng)的運行結(jié)構(gòu), 能建立完整的信息處理單元, 并且能夠整合非線性交換結(jié)構(gòu), 確保能憑借歷史數(shù)據(jù)對計算模型和分類體系展開深度分析[3]。
3.4 實現(xiàn)多元化應(yīng)用
在檔案管理工作中應(yīng)用計算機數(shù)據(jù)挖掘技術(shù), 能對檔案分類管理予以分析, 保證信息需求分類總結(jié)工作的完整程度。尤其是檔案使用者在對檔案具體特征進行差異化分析的過程中, 能結(jié)合不同的元素對具體問題展開深度調(diào)研。一方面, 計算機數(shù)據(jù)挖掘技術(shù)借助決策樹算法處理規(guī)則化的檔案分析機制。在差異化訓(xùn)練體系中, 要對數(shù)據(jù)集合中的數(shù)據(jù)進行系統(tǒng)化分析以及處理, 確保構(gòu)建要求能適應(yīng)數(shù)據(jù)挖掘的基本結(jié)構(gòu)[4]。例如, 檔案管理人員借助數(shù)據(jù)挖掘技術(shù)能整合檔案使用人員長期瀏覽與關(guān)注的信息, 并且能集中收集和匯總間隔時間、信息查詢停留時間等, 從而建構(gòu)完整的數(shù)據(jù)分析機制, 有效向其推送或者是提供便捷化查詢服務(wù), 保證檔案管理數(shù)字化水平的提高。另一方面, 在檔案收集管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 主要是對數(shù)據(jù)信息進行分析, 結(jié)合基本結(jié)果建立概念模型, 保證模型以及測試樣本之間的比較參數(shù)符合標準, 從而真正建立更加系統(tǒng)化的分類框架體系。結(jié)語
總而言之, 在檔案管理工作中應(yīng)用數(shù)據(jù)挖掘技術(shù), 能在準確判定用戶需求的同時, 維護數(shù)據(jù)處理效果, 并且減少檔案數(shù)字化的成本, 為后續(xù)工作的進一步優(yōu)化奠定堅實基礎(chǔ)。并且, 數(shù)據(jù)庫的建立, 也能節(jié)省經(jīng)費和設(shè)備維護成本, 真正實現(xiàn)數(shù)字化全面發(fā)展的目標, 促進檔案信息管理工作的長效進步。
參考文獻
[1]曾雪峰.計算機數(shù)據(jù)挖掘技術(shù)開發(fā)及其在檔案信息管理中的運用研究[J].科技創(chuàng)新與應(yīng)用, 20xx(9):285.[2]王曉燕.數(shù)據(jù)挖掘技術(shù)在檔案信息管理中的應(yīng)用[J].蘭臺世界, 20xx(23):25-26.[3]韓吉義.基于數(shù)據(jù)挖掘技術(shù)的高校圖書館檔案信息管理平臺的構(gòu)筑[J].山西檔案, 20xx(6):61-63.[4]哈立原.基于數(shù)據(jù)挖掘技術(shù)的高校圖書館檔案信息管理平臺構(gòu)建[J].山西檔案, 20xx(5):105-107.數(shù)據(jù)挖掘論文四: 題目:機器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用
摘要:隨著科學(xué)技術(shù)的快速發(fā)展, 各種新鮮的事物和理念得到了廣泛的應(yīng)用。其中機器學(xué)習(xí)算法就是一則典型案例——作為一種新型的算法, 其廣泛應(yīng)用于各行各業(yè)之中。本篇論文旨在探討機器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的具體應(yīng)用, 我們利用龐大的移動終端數(shù)據(jù)網(wǎng)絡(luò), 加強了基于GSM網(wǎng)絡(luò)的戶外終端定位, 從而提出了3個階段的定位算法, 有效提高了定位的精準度和速度。
關(guān)鍵詞:學(xué)習(xí)算法;GSM網(wǎng)絡(luò);定位;數(shù)據(jù);
移動終端定位技術(shù)由來已久, 其主要是利用各種科學(xué)技術(shù)手段定位移動物體的精準位置以及高度。目前, 移動終端定位技術(shù)主要應(yīng)用于軍事定位、緊急救援、網(wǎng)絡(luò)優(yōu)化、地圖導(dǎo)航等多個現(xiàn)代化的領(lǐng)域, 由于移動終端定位技術(shù)可以提供精準的位置服務(wù)信息, 所以其在市場上還是有較大的需求的, 這也為移動終端定位技術(shù)的優(yōu)化和發(fā)展, 提供了推動力。隨著通信網(wǎng)絡(luò)普及, 移動終端定位技術(shù)的發(fā)展也得到了一些幫助, 使得其定位的精準度和速度都得到了全面的優(yōu)化和提升。同時, 傳統(tǒng)的定位方法結(jié)合先進的算法來進行精準定位, 目前依舊還是有較大的進步空間。在工作中我選取機器學(xué)習(xí)算法結(jié)合數(shù)據(jù)挖掘技術(shù)對傳統(tǒng)定位技術(shù)加以改進, 取得了不錯的效果, 但也遇到了許多問題, 例如:使用機器學(xué)習(xí)算法來進行精準定位暫時無法滿足更大的區(qū)域要求, 還有想要利用較低的設(shè)備成本, 實現(xiàn)得到更多的精準定位的要求比較困難。所以本文對機器學(xué)習(xí)算法進行了深入的研究, 希望能夠幫助其更快速的定位、更精準的定位, 滿足市場的需要。數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘又名數(shù)據(jù)探勘、信息挖掘。它是數(shù)據(jù)庫知識篩選中非常重要的一步。數(shù)據(jù)挖掘其實指的就是在大量的數(shù)據(jù)中通過算法找到有用信息的行為。一般情況下, 數(shù)據(jù)挖掘都會和計算機科學(xué)緊密聯(lián)系在一起, 通過統(tǒng)計集合、在線剖析、檢索篩選、機器學(xué)習(xí)、參數(shù)識別等多種方法來實現(xiàn)最初的目標。統(tǒng)計算法和機器學(xué)習(xí)算法是數(shù)據(jù)挖掘算法里面應(yīng)用得比較廣泛的兩類。統(tǒng)計算法依賴于概率分析, 然后進行相關(guān)性判斷, 由此來執(zhí)行運算。
而機器學(xué)習(xí)算法主要依靠人工智能科技, 通過大量的樣本收集、學(xué)習(xí)和訓(xùn)練, 可以自動匹配運算所需的相關(guān)參數(shù)及模式。它綜合了數(shù)學(xué)、物理學(xué)、自動化和計算機科學(xué)等多種學(xué)習(xí)理論, 雖然能夠應(yīng)用的領(lǐng)域和目標各不相同, 但是這些算法都可以被獨立使用運算, 當然也可以相互幫助, 綜合應(yīng)用, 可以說是一種可以“因時而變”、“因事而變”的算法。在機器學(xué)習(xí)算法的領(lǐng)域, 人工神經(jīng)網(wǎng)絡(luò)是比較重要和常見的一種。因為它的優(yōu)秀的數(shù)據(jù)處理和演練、學(xué)習(xí)的能力較強。
而且對于問題數(shù)據(jù)還可以進行精準的識別與處理分析, 所以應(yīng)用的頻次更多。人工神經(jīng)網(wǎng)絡(luò)依賴于多種多樣的建模模型來進行工作, 由此來滿足不同的數(shù)據(jù)需求。綜合來看, 人工神經(jīng)網(wǎng)絡(luò)的建模, 它的精準度比較高, 綜合表述能力優(yōu)秀, 而且在應(yīng)用的過程中, 不需要依賴專家的輔助力量, 雖然仍有缺陷, 比如在訓(xùn)練數(shù)據(jù)的時候耗時較多, 知識的理解能力還沒有達到智能化的標準, 但是, 相對于其他方式而言, 人工神經(jīng)網(wǎng)絡(luò)的優(yōu)勢依舊是比較突出的。以機器學(xué)習(xí)算法為基礎(chǔ)的GSM網(wǎng)絡(luò)定位
2.1 定位問題的建模
建模的過程主要是以支持向量機定位方式作為基礎(chǔ), 把定位的位置柵格化, 面積較小的柵格位置就是獨立的一種類別, 在定位的位置內(nèi), 我們收集數(shù)目龐大的終端測量數(shù)據(jù), 然后利用計算機對測量報告進行分析處理, 測量柵格的距離度量和精準度, 然后對移動終端柵格進行預(yù)估判斷, 最終利用機器學(xué)習(xí)進行分析求解。
2.2 采集數(shù)據(jù)和預(yù)處理
本次研究, 我們采用的模型對象是我國某一個周邊長達10千米的二線城市。在該城市區(qū)域內(nèi), 我們測量了四個不同時間段內(nèi)的數(shù)據(jù), 為了保證機器學(xué)習(xí)算法定位的精準性和有效性, 我們把其中的三批數(shù)據(jù)作為訓(xùn)練數(shù)據(jù), 最后一組數(shù)據(jù)作為定位數(shù)據(jù), 然后把定位數(shù)據(jù)周邊十米內(nèi)的前三組訓(xùn)練數(shù)據(jù)的相關(guān)信息進行清除。一旦確定某一待定位數(shù)據(jù), 就要在不同的時間內(nèi)進行測量, 按照測量出的數(shù)據(jù)信息的經(jīng)緯度和平均值, 再進行換算, 最終, 得到真實的數(shù)據(jù)量, 提升定位的速度以及有效程度。
2.3 以基站的經(jīng)緯度為基礎(chǔ)的初步定位
用機器學(xué)習(xí)算法來進行移動終端定位, 其復(fù)雜性也是比較大的, 一旦區(qū)域面積增加, 那么模型和分類也相應(yīng)增加, 而且更加復(fù)雜, 所以, 利用機器學(xué)習(xí)算法來進行移動終端定位的過程, 會隨著定位區(qū)域面積的增大, 而耗費更多的時間。利用基站的經(jīng)緯度作為基礎(chǔ)來進行早期的定位, 則需要以下幾個步驟:要將邊長為十千米的正方形分割成一千米的小柵格, 如果想要定位數(shù)據(jù)集內(nèi)的相關(guān)信息, 就要選擇對邊長是一千米的小柵格進行計算, 而如果是想要獲得邊長一千米的大柵格, 就要對邊長是一千米的柵格精心計算。
2.4 以向量機為基礎(chǔ)的二次定位
在完成初步定位工作后, 要確定一個邊長為兩千米的正方形, 由于第一級支持向量機定位的區(qū)域是四百米, 定位輸出的是以一百米柵格作為中心點的經(jīng)緯度數(shù)據(jù)信息, 相對于一級向量機的定位而言, 二級向量機在定位計算的時候難度是較低的, 更加簡便。后期的預(yù)算主要依賴決策函數(shù)計算和樣本向量機計算。隨著柵格的變小, 定位的精準度將越來越高, 而由于增加分類的問題數(shù)量是上升的, 所以, 定位的復(fù)雜度也是相對增加的。
2.5 以K-近鄰法為基礎(chǔ)的三次定位
第一步要做的就是選定需要定位的區(qū)域面積, 在二次輸出之后, 確定其經(jīng)緯度, 然后依賴經(jīng)緯度來確定邊長面積, 這些都是進行區(qū)域定位的基礎(chǔ)性工作, 緊接著就是定位模型的訓(xùn)練。以K-近鄰法為基礎(chǔ)的三次定位需要的是綜合訓(xùn)練信息數(shù)據(jù), 對于這些信息數(shù)據(jù), 要以大小為選擇依據(jù)進行篩選和合并, 這樣就能夠減少計算的重復(fù)性。當然了, 選擇的區(qū)域面積越大, 其定位的速度和精準性也就越低。結(jié)語
近年來, 隨著我國科學(xué)技術(shù)的不斷發(fā)展和進步, 數(shù)據(jù)挖掘技術(shù)愈加重要。根據(jù)上面的研究, 我們證明了, 在數(shù)據(jù)挖掘的過程中, 應(yīng)用機器學(xué)習(xí)算法具有舉足輕重的作用。作為一門多領(lǐng)域互相交叉的知識學(xué)科, 它能夠幫助我們提升定位的精準度以及定位速度, 可以被廣泛的應(yīng)用于各行各業(yè)。所以, 對于機器學(xué)習(xí)算法, 相關(guān)人員要加以重視, 不斷的進行改良以及改善, 切實的發(fā)揮其有利的方面, 將其廣泛應(yīng)用于智能定位的各個領(lǐng)域, 幫助我們解決關(guān)于戶外移動終端的定位的問題。
參考文獻
[1]陳小燕, CHENXiaoyan.機器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].現(xiàn)代電子技術(shù), 20xx, v.38;No.451(20):11-14.[2]李運.機器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[D].北京郵電大學(xué), 20xx.[3]莫雪峰.機器學(xué)習(xí)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].科教文匯, 20xx(07):175-178.數(shù)據(jù)挖掘論文五: 題目:軟件工程數(shù)據(jù)挖掘研究進展
摘要:數(shù)據(jù)挖掘是指在大數(shù)據(jù)中開發(fā)出有價值信息數(shù)據(jù)的過程。計算機技術(shù)的不斷進步, 通過人工的方式進行軟件的開發(fā)與維護難度較大。而數(shù)據(jù)挖掘能夠有效的提升軟件開發(fā)的效率, 并能夠在大量的數(shù)據(jù)中獲得有效的數(shù)據(jù)。文章主要探究軟件工程中數(shù)據(jù)挖掘技術(shù)的任務(wù)和存在的問題, 并重點論述軟件開發(fā)過程中出現(xiàn)的問題和相關(guān)的解決措施。
關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;解決措施;
在軟件開發(fā)過程中, 為了能夠獲得更加準確的數(shù)據(jù)資源, 軟件的研發(fā)人員就需要搜集和整理數(shù)據(jù)。但是在大數(shù)據(jù)時代, 人工獲取數(shù)據(jù)信息的難度極大。當前, 軟件工程中運用最多的就是數(shù)據(jù)挖掘技術(shù)。軟件挖掘技術(shù)是傳統(tǒng)數(shù)據(jù)挖掘技術(shù)在軟件工程方向的其中一部分。但是它具有自身的特征, 體現(xiàn)在以下三個方面:
(1)在軟件工程中, 對有效數(shù)據(jù)的挖掘和處理;
(2)挖掘數(shù)據(jù)算法的選擇問題;
(3)軟件的開發(fā)者該如何選擇數(shù)據(jù)。在軟件工程中數(shù)據(jù)挖掘的主要任務(wù)
在數(shù)據(jù)挖掘技術(shù)中, 軟件工程數(shù)據(jù)挖掘是其中之一, 其挖掘的過程與傳統(tǒng)數(shù)據(jù)的挖掘無異。通常包括三個階段:第一階段, 數(shù)據(jù)的預(yù)處理;第二階段, 數(shù)據(jù)的挖掘;第三階段, 對結(jié)果的評估。第一階段的主要任務(wù)有對數(shù)據(jù)的分類、對異常數(shù)據(jù)的檢測以及整理和提取復(fù)雜信息等。雖然軟件工程的數(shù)據(jù)挖掘和傳統(tǒng)的數(shù)據(jù)挖掘存在相似性, 但是也存在一定的差異, 其主要體現(xiàn)在以下三個方面:
1.1 軟件工程的數(shù)據(jù)更加復(fù)雜
軟件工程數(shù)據(jù)主要包括兩種, 一種是軟件報告, 另外一種是軟件的版本信息。當然還包括一些軟件代碼和注釋在內(nèi)的非結(jié)構(gòu)化數(shù)據(jù)信息。這兩種軟件工程數(shù)據(jù)的算法是不同的, 但是兩者之間又有一定的聯(lián)系, 這也是軟件工程數(shù)據(jù)挖掘復(fù)雜性的重要原因。
1.2 數(shù)據(jù)分析結(jié)果的表現(xiàn)更加特殊
傳統(tǒng)的數(shù)據(jù)挖掘結(jié)果可以通過很多種結(jié)果展示出來, 最常見的有報表和文字的方式。但是對于軟件工程的數(shù)據(jù)挖掘來講, 它最主要的職能是給軟件的研發(fā)人員提供更加精準的案例, 軟件漏洞的實際定位以及設(shè)計構(gòu)造方面的信息, 同時也包括數(shù)據(jù)挖掘的統(tǒng)計結(jié)果。所以這就要求軟件工程的數(shù)據(jù)挖掘需要更加先進的結(jié)果提交方式和途徑。
1.3 對數(shù)據(jù)挖掘結(jié)果難以達成一致的評價
我國傳統(tǒng)的數(shù)據(jù)挖掘已經(jīng)初步形成統(tǒng)一的評價標準, 而且評價體系相對成熟。但是軟件工程的數(shù)據(jù)挖掘過程中, 研發(fā)人員需要更多復(fù)雜而又具體的數(shù)據(jù)信息, 所以數(shù)據(jù)的表示方法也相對多樣化, 數(shù)據(jù)之間難以進行對比, 所以也就難以達成一致的評價標準和結(jié)果。不難看出, 軟件工程數(shù)據(jù)挖掘的關(guān)鍵在于對挖掘數(shù)據(jù)的預(yù)處理和對數(shù)據(jù)結(jié)果的表示方法。軟件工程研發(fā)階段出現(xiàn)的問題和解決措施
軟件在研發(fā)階段主要的任務(wù)是對軟件運行程序的編寫。以下是軟件在編碼和結(jié)果的提交過程中出現(xiàn)的問題和相應(yīng)的解決措施。
2.1 對軟件代碼的編寫過程
該過程需要軟件的研發(fā)人員能夠?qū)ψ约盒枰帉懙拇a結(jié)構(gòu)與功能有充分的了解和認識。并能夠依據(jù)自身掌握的信息, 在數(shù)據(jù)庫中搜集到可以使用的數(shù)據(jù)信息。通常情況下, 編程需要的數(shù)據(jù)信息可以分為三個方面:
(1)軟件的研發(fā)人員能夠在已經(jīng)存在的代碼中搜集可以重新使用的代碼;
(2)軟件的研發(fā)人員可以搜尋可以重用的靜態(tài)規(guī)則, 比如繼承關(guān)系等。
(3)軟件的開發(fā)人員搜尋可以重用的動態(tài)規(guī)則。
包括軟件的接口調(diào)用順序等。在尋找以上信息的過程中, 通常是利用軟件的幫助文檔、尋求外界幫助和搜集代碼的方式實現(xiàn), 但是以上方式在搜集信息過程中往往會遇到較多的問題, 比如:幫助文檔的準確性較低, 同時不夠完整, 可利用的重用信息不多等。
2.2 對軟件代碼的重用
在對軟件代碼重用過程中, 最關(guān)鍵的問題是軟件的研發(fā)人員必須掌握需要的類或方法, 并能夠通過與之有聯(lián)系的代碼實現(xiàn)代碼的重用。但是這種方式哦足跡信息將會耗費工作人員大量的精力。而通過關(guān)鍵詞在代碼庫中搜集可重用的軟件代碼, 同時按照代碼的相關(guān)度對搜集到的代碼進行排序, 該過程使用的原理就是可重用的代碼必然模式基本類似, 最終所展現(xiàn)出來的搜索結(jié)果是以上下文結(jié)構(gòu)的方式展現(xiàn)的。比如:類與類之間的聯(lián)系。其實現(xiàn)的具體流程如下:
(1)軟件的開發(fā)人員創(chuàng)建同時具備例程和上下文架構(gòu)的代碼庫;
(2)軟件的研發(fā)人員能夠向代碼庫提供類的相關(guān)信息, 然后對反饋的結(jié)果進行評估, 創(chuàng)建新型的代碼庫。
(3)未來的研發(fā)人員在搜集過程中能夠按照評估結(jié)果的高低排序, 便于查詢, 極大地縮減工作人員的任務(wù)量, 提升其工作效率。
2.3 對動態(tài)規(guī)則的重用
軟件工程領(lǐng)域內(nèi)對動態(tài)規(guī)則重用的研究已經(jīng)相對成熟, 通過在編譯器內(nèi)安裝特定插件的方式檢驗代碼是否為動態(tài)規(guī)則最適用的, 并能夠?qū)⒉贿m合的規(guī)則反饋給軟件的研發(fā)人員。其操作流程為:
(1)軟件的研發(fā)人員能夠規(guī)定動態(tài)規(guī)則的順序, 主要表現(xiàn)在:使用某一函數(shù)是不能夠調(diào)用其他的函數(shù)。
(2)實現(xiàn)對相關(guān)數(shù)據(jù)的保存, 可以通過隊列等簡單的數(shù)據(jù)結(jié)構(gòu)完成。在利用編譯拓展中檢測其中的順序。
(3)能夠?qū)㈠e誤的信息反饋給軟件的研發(fā)人員。結(jié)束語
在軟件工程的數(shù)據(jù)挖掘過程中, 數(shù)據(jù)挖掘的概念才逐步被定義, 但是所需要挖掘的數(shù)據(jù)是已經(jīng)存在的。數(shù)據(jù)挖掘技術(shù)在軟件工程中的運用能夠降低研發(fā)人員的工作量, 同時軟件工程與數(shù)據(jù)挖掘的結(jié)合是計算機技術(shù)必然的發(fā)展方向。從數(shù)據(jù)挖掘的過程來講, 在其整個實施過程和周期中都包括軟件工程。而對數(shù)據(jù)挖掘的技術(shù)手段來講, 它在軟件工程中的運用更加普遍。在對數(shù)據(jù)挖掘技術(shù)的研究過程中可以發(fā)現(xiàn), 該技術(shù)雖然已經(jīng)獲得一定的效果, 但是還有更多未被挖掘的空間, 還需要進一步的研究和發(fā)現(xiàn)。
參考文獻
[1]王藝蓉.試析面向軟件工程數(shù)據(jù)挖掘的開發(fā)測試技術(shù)[J].電子技術(shù)與軟件工程, 20xx(18):64.[2]吳彥博.軟件工程中數(shù)據(jù)挖掘技術(shù)的運用探索[J].數(shù)字通信世界, 20xx(09):187.[3]周雨辰.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].電腦迷, 20xx(08):27-28.[4]劉桂林.分析軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用方式[J].中國新通信, 20xx, 19(13):119.
數(shù)據(jù)挖掘論文71電子商務(wù)中的數(shù)據(jù)挖掘簡介
電子商務(wù)中的數(shù)據(jù)挖掘即Web挖掘,是利用數(shù)據(jù)挖掘技術(shù)從004km.cnKI(1980-20xx年)相關(guān)文獻中治療神經(jīng)根型頸椎病的方劑建立數(shù)據(jù)庫, 采用SPSS11.5統(tǒng)計軟件這些治方常用藥物使用頻次頻率、性味頻率、歸經(jīng)頻率分析比較, 治療神經(jīng)根型頸椎病的中藥共計99味, 使用頻次479味次;所用藥物種類依次以補益藥、活血化瘀藥、祛風(fēng)濕藥運用最多, 其中藥味以辛、苦為主, 藥性以溫、寒為主, 歸經(jīng)以肝、脾、心為主, 而本病以肝腎虧虛, 氣血瘀滯為主, 臨床以補益藥、活血化瘀藥、祛風(fēng)濕藥等中藥運用最多。這對于醫(yī)家治療該病選用藥物的性味、歸經(jīng)等具有指導(dǎo)意義。陳元川等[11]檢索20xx年1月至20xx年3月發(fā)表的以單純口服中藥治療神經(jīng)根型頸椎病的有關(guān)文獻, 對其中的方劑和藥物進行統(tǒng)計、歸類、分析, 最終納入32首方劑, 涉及111味中藥, 補氣藥、發(fā)散風(fēng)寒藥、活血止痛藥、補血藥等使用頻次較高;葛根、白芍、黃芪、當歸、桂枝等藥物使用頻次較高, 證實與古方桂枝加葛根湯主藥相同, 且該方扶陽解表的治法與該研究得出的扶正祛邪的結(jié)果相吻合, 同時也證實石氏傷科強調(diào)治傷科病當“以氣為主, 以血為先”等正確性。所以大數(shù)據(jù)背后的規(guī)律和關(guān)系在很多方面古今是一致的, 同時數(shù)據(jù)依據(jù)的支持也為現(xiàn)代神經(jīng)根型頸椎病治療提供有力的保障。謝輝等[12]收集20xx至20xx年10月3日的166張治療神經(jīng)根型頸椎病的治方建立數(shù)據(jù)庫, 采用關(guān)聯(lián)規(guī)則算法、復(fù)雜系統(tǒng)熵聚類等無監(jiān)督數(shù)據(jù)挖掘方法, 利用中醫(yī)傳承輔助平臺(TCMISS)軟件分析處方中各種藥物的使用頻次、藥物之間的關(guān)聯(lián)規(guī)則、核心藥物組合和新處方, 從中挖掘出治療該病中醫(yī)中的常用藥物、藥對, 闡明了治療該病以解肌散寒藥、補氣活血藥、祛風(fēng)勝濕藥和溫經(jīng)通絡(luò)藥為主, 治法主要包括解肌舒筋、益氣活血和補益肝腎, 這一方面很清晰明了地展示了藥物使用頻率、藥物之間的聯(lián)系, 證實其與很多古代經(jīng)典中治療神經(jīng)根型頸椎病的治則、治法及用藥規(guī)律是吻合的, 是臨床用藥的積累和升華, 可有效地指導(dǎo)臨床并提高療效;另一方面也為中藥新藥的創(chuàng)制提供處方來源, 指導(dǎo)新藥研發(fā)[13]。小結(jié)
數(shù)據(jù)挖掘技術(shù)作為一種新型的研究技術(shù), 在神經(jīng)根型頸椎病的治方研究中的運用相對于其他領(lǐng)域是偏少的, 并且基本上是研究文獻資料上出現(xiàn)的治方, 在對名老中醫(yī)個人治療經(jīng)驗及用藥規(guī)律的總結(jié)是缺乏的, 因此研究范圍廣而缺乏針對性, 同時使用該技術(shù)的相關(guān)軟件種類往往是單一的?,F(xiàn)在研究者在研究中醫(yī)方劑時往往采用傳統(tǒng)的研究方法, 這就導(dǎo)致在大數(shù)據(jù)的研究中耗時、耗力甚則無能為力, 同樣也難以精準地提取大數(shù)據(jù)背后的隱藏的潛在關(guān)系和規(guī)則及缺乏對未知情況的預(yù)測。產(chǎn)生這樣的現(xiàn)狀, 一方面是很多研究者尚未清楚該技術(shù)在方劑研究中的優(yōu)勢所在, 思維模式尚未更新;另一方面是很多研究者尚未清楚該技術(shù)的操作技能及軟件種類及其應(yīng)用范圍。故以后應(yīng)向更多研究者普及該技術(shù)的軟件種類、其中的優(yōu)勢及操作技能, 讓該技術(shù)在臨床中使用更廣, 產(chǎn)生更大的效益。
參考文獻
[1]舒正渝.淺談數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].中國西部科技, 20xx, 9(5):38-39.[2]曹毅, 季聰華.臨床科研設(shè)計與分析[M].杭州:浙江科學(xué)技術(shù)出版社, 20xx:189.[3]王靜, 崔蒙.數(shù)據(jù)挖掘技術(shù)在中醫(yī)方劑學(xué)研究中的應(yīng)用[J].中國中醫(yī)藥信息雜志, 20xx, 15(3):103-104.[4]陳丈偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社, 20xx:5.[5]楊玉珠.數(shù)據(jù)挖掘技術(shù)綜述與應(yīng)用[J].河南科技, 20xx, 10(19):21.[6]余侃侃.數(shù)據(jù)挖掘技術(shù)在方劑配伍中的研究現(xiàn)狀及研究方法[J].中國醫(yī)藥指南, 20xx, 6(24):310-312.[7]趙睿曦.方證數(shù)據(jù)挖掘分析張氏骨傷對腰椎間盤突出癥的辨證用藥規(guī)律[J].陜西中醫(yī)藥大學(xué)學(xué)報, 20xx, 39(6):44-46.[8]李曙明, 尹戰(zhàn)海, 王瑩.神經(jīng)根型頸椎病的影像學(xué)特點和分型[J].中國矯形外科雜志, 20xx, 21(1):7-11.[9]劉向前, 陳民, 黃廣平等.頸項肩臂痛內(nèi)治古方常用藥物的統(tǒng)計分析[J].中華中醫(yī)藥學(xué)刊, 20xx, 30(9):42-44.[10]齊兵獻, 樊成虎, 李兆和.神經(jīng)根型頸椎病中醫(yī)用藥規(guī)律的文獻研究[J].河南中醫(yī), 20xx, 32(4):518-519.[11]陳元川, 王翔, 龐堅, 等.單純口服中藥治療神經(jīng)根型頸椎病用藥分析[J].上海中醫(yī)藥雜志, 20xx, 48(6):78-80.[12]謝輝, 劉軍, 潘建科, 等.基于數(shù)據(jù)挖掘方法的神經(jīng)根型頸椎病用藥規(guī)律研究[J].世界中西醫(yī)結(jié)合雜志, 20xx, 10(6):849-852.[13]唐仕歡, 楊洪軍.中醫(yī)組方用藥規(guī)律研究進展述評[J].中國實驗方劑學(xué)雜志, 20xx(5):359-363.
數(shù)據(jù)挖掘論文9摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,計算機的使用也愈來愈廣泛,他已經(jīng)發(fā)展到各個行業(yè),現(xiàn)如今保險行業(yè)也就相應(yīng)的業(yè)務(wù)引進了計算機業(yè)務(wù)系統(tǒng),而在20xx年8月,我國也出臺了《國務(wù)院關(guān)于加快發(fā)展現(xiàn)代保險服務(wù)業(yè)的若干意見》這一舉措的有效實施,從政策上為保險行業(yè)的快速發(fā)展提供相應(yīng)了保障。而如何在這些被積累下來的寶貴數(shù)據(jù)中,分析挖掘出新的商機及財富,就成為了我國當前保險行業(yè)發(fā)展的重要突破口。本篇文章就從數(shù)據(jù)挖掘技術(shù)的應(yīng)用方面、概念、必要性,以及方法手段進行了深入探討與分析其對財產(chǎn)保險應(yīng)用的意義。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);財產(chǎn)保險;應(yīng)用;分析
在最近幾年中,我國對于保險行業(yè)給予了高度的關(guān)注與重視并出臺了許多與之相對應(yīng)的相關(guān)政策,這些政策的發(fā)行對于我國的保險行業(yè)帶來的極大程度的發(fā)展空間。而我國的保險行業(yè)也開始了轉(zhuǎn)型,正在從粗放型經(jīng)營向集約化經(jīng)營管理進行過度,最明顯的改變就是之前只注重新客戶的開發(fā)而忘記顧忌老客戶的需求與發(fā)展,但是現(xiàn)在是同時注重新老客戶的需求與發(fā)展,從根本上實現(xiàn)“兩手抓”的政策,所以這種新的形式背景下,計算機中保險行業(yè)所留的數(shù)據(jù)就成為極為重要的挖掘資源。
一、解析數(shù)據(jù)挖掘技術(shù)在財產(chǎn)保險分析中的應(yīng)用
(一)提升財險客戶服務(wù)能力
對于任何一個公司來說沒有客戶所有的產(chǎn)品經(jīng)營都是紙上談兵,這對于服務(wù)行業(yè)的財產(chǎn)保險公司更是如此,所以對此所以財產(chǎn)保險行業(yè)就面臨著轉(zhuǎn)型升級的事情財產(chǎn)行業(yè)的轉(zhuǎn)型就意味著面臨著面向客戶的服務(wù)質(zhì)量的提升。在現(xiàn)如今的經(jīng)濟情況下,保險消費者對于保險行業(yè)知識的了解日益增加,保險意識也是越發(fā)的加強。客戶對于保險行業(yè)也出現(xiàn)了個性化與差異化的需求。從這里就要求保險公司通過數(shù)據(jù)挖掘技術(shù)對客戶的需求進行更深一層的分析與探索,通過探究與分析的結(jié)果明確而客戶的需要,并為有更高需求的客戶提供更適合他的保險產(chǎn)品,從而提高業(yè)務(wù)服務(wù)水平,吸引更多的優(yōu)質(zhì)客源,來增強市場的競爭力。例如,在對客戶進行細分的時候,可以通過數(shù)據(jù)挖掘技術(shù)中的“二八定律”,對客戶進行細分。通過細分得出結(jié)果,參照數(shù)據(jù)根據(jù)每個客戶群體的風(fēng)險偏好、特點以及需求為他們量身定制適合他們自身的新產(chǎn)品,并制定對應(yīng)適合的費照新差旅費管理辦法正確規(guī)范填寫市內(nèi)交通補助、伙食補助、城市間交通費、和住宿費金額。并填寫上合計金額,不得出現(xiàn)多報的行為,從而提高差旅費報銷工作的質(zhì)量。
(二)風(fēng)險管理和合規(guī)經(jīng)營
每個保險公司的生命底線就是合規(guī)經(jīng)營以及對風(fēng)險的管理,所以每個保險公司必須在運營生產(chǎn)中嚴格的遵守國家的法律法規(guī),不許做出違反法律底線的事情,而風(fēng)險管理對于保險公司來說具有兩層含義,其實并不簡單,一方面是需要對于企業(yè)自身的風(fēng)險進行管理;另一方面是對于客戶所帶來的風(fēng)險進行管理。對于保險公司來說這兩方面的風(fēng)險是相互作用、相輔相成的,第一個方面的風(fēng)險管理出現(xiàn)問題后者的風(fēng)險管理就會成為空談,反之第二方面的風(fēng)險管理沒有得到很好的管理,極大可能會引起前者管理出現(xiàn)問題。而恰恰數(shù)據(jù)挖掘技術(shù)的應(yīng)用,就可以為財產(chǎn)保險企業(yè)規(guī)避風(fēng)險起到很大的幫助。保險公司可以以計算機為使用的工具,通過數(shù)據(jù)挖掘的技術(shù),可以對數(shù)據(jù)內(nèi)大量的信息進行查找并比對分析,高效的識別出在計算機內(nèi)不符合正常業(yè)務(wù)邏輯的數(shù)據(jù),這樣管理者就可以及時就這些風(fēng)險數(shù)據(jù)和業(yè)務(wù)漏洞進行監(jiān)測與管控,以減少違法亂紀的事情發(fā)生,逐步消除或減少隱藏的風(fēng)險。保障保險業(yè)健康有序的發(fā)展,為市場經(jīng)濟持續(xù)健康的進一步發(fā)展保駕護航。
(三)開發(fā)新產(chǎn)品
新的保險產(chǎn)品的開發(fā)對于增強保險公司的公司收益、內(nèi)容、滿足消費者的需求以及競爭力等方面起著重要的作用,這也是經(jīng)營保險公司的首要內(nèi)容。新產(chǎn)品的開發(fā)是指保險公司針對當前市場的需求、想要達到的效果與自身情況相結(jié)合的產(chǎn)物,而在原有的產(chǎn)品上加以重新的組合與設(shè)計的創(chuàng)造與改良,來滿足市場的需求,進而提高公司自身的競爭力的過程與行為。后者自不必說,基于我國財產(chǎn)保險公司數(shù)據(jù)庫信息方面已經(jīng)積累了很多,而后通過對信息的數(shù)據(jù)進行發(fā)掘,使實現(xiàn)新產(chǎn)品的開發(fā)成為可能。譬如,通過數(shù)據(jù)挖掘技術(shù),我們可以使用現(xiàn)有產(chǎn)品進行進一步的完善、修正或者拆分、組合的,使其變成一全新的保險產(chǎn)品,他會更接近客戶的需求,滿足客戶的真實所需,同時也能夠增加市場的銷量,增強市場競爭力。就以原有的普通財產(chǎn)保險為例子,在保險有效期內(nèi)未出現(xiàn)任何對客戶的產(chǎn)才造成損失的情況下,客戶所繳納的保險費用是不予以退還的,在財產(chǎn)保險的有效期過后,客戶所繳納的保險費是由保險公司所擁有的。這樣的保險產(chǎn)品是不被大多數(shù)客戶所看好與接受的,即使有客戶在第一次購買了此保險,但之后是不會在對本產(chǎn)品進行第二次的投資的。而現(xiàn)在通過數(shù)據(jù)挖掘的技術(shù),保險公司可以根據(jù)對客戶信息的了解進行分析,保險公司推出了一款新的家庭財產(chǎn)兩全保險保險,這是一種全新的保險類別。全新的家庭財產(chǎn)保險,他所需要交納的是保險儲備金,比如每份保險金額為50000元的家庭財產(chǎn)兩全保險,則保險儲金為5000元,投保人必須根據(jù)保險金額一次性交納保險儲備金,保險人可以將保險儲備金的利息作為保險費。在保險期滿后,無論是不是在保險期內(nèi)發(fā)生賠付的情況,保險公司都會將保險人的全部的保險儲金如數(shù)退還。自從出現(xiàn)了這種投保方式,客戶的接受度得到了大大的提高,全新的家庭財產(chǎn)保險,一方面使保險人保險中得到了應(yīng)得的利益,另一方面投保人的財產(chǎn)也得到了保險,從而在市場的銷售份額上面也得到了迅速提升。
二、保險業(yè)數(shù)據(jù)挖掘技術(shù)及應(yīng)用的必要性
(一)保險業(yè)數(shù)據(jù)挖掘技術(shù)的含義
什么是保險行業(yè)的數(shù)據(jù)挖掘技術(shù),就是從客戶管理的角度出發(fā),針對保險行業(yè)數(shù)據(jù)庫系統(tǒng)內(nèi)大量的保險單,對客戶的信用數(shù)據(jù)進行屬性變量提取,進而采用自動化或半自動化等多種挖掘技巧和方法來對客戶的數(shù)據(jù)進行分析,找到潛在的有價值的信息.(二)數(shù)據(jù)挖掘的過程及方法
數(shù)據(jù)挖掘是一個跨越多種學(xué)科的交叉技術(shù),主要的用途是利用各種數(shù)據(jù)為商業(yè)上存在的問題提供切實可行的方法與數(shù)據(jù)。數(shù)據(jù)挖掘的過程有以下幾個步驟:業(yè)務(wù)理解→數(shù)據(jù)準備→數(shù)據(jù)理解→構(gòu)建模型→測試設(shè)計→做出評價→實施應(yīng)用。在數(shù)據(jù)挖掘方面有三個常用的方法:DM、SEMMA以及CRISP等分析方法。同時我們需要根據(jù)實際情況來運用數(shù)據(jù)挖掘技術(shù),選擇最適當?shù)姆椒?,要想將?shù)據(jù)挖掘技術(shù)達到最佳的效果必須針對具體的流程做出相應(yīng)的調(diào)節(jié)。
(三)保險行業(yè)應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要性
在保險行業(yè)的運營中,常常會出現(xiàn)一下的幾個問題:例如,細分客戶的問題:對于不同的社會收入階層、不同年齡段、不同的行業(yè)的客戶,該怎么樣去確定其的保險金額呢?客戶的成長問題:如何把握時機對客戶進行交叉銷售;險種關(guān)聯(lián)分析問題:在對購買某種保險的客戶進行分析與探查,觀察其是否在同一時間購買另一種保險產(chǎn)品,客戶的獲取問題:如何在付出最小的成本獲得最有價值的客戶的挽留及索賠優(yōu)化的問題:如何對索賠受理的過程進行優(yōu)化,挽留住有價值的投保人。保險公司在完成數(shù)據(jù)的匯總后,所獲取的業(yè)務(wù)及大量客戶信息,不過是對公司當前所處的市場環(huán)境、企業(yè)經(jīng)營情況及客戶基本資料的記錄及反映。而進行數(shù)據(jù)集中的信息系統(tǒng),也只能是對數(shù)據(jù)庫中的這部分數(shù)據(jù)進行簡單的操作處理,并不能從中發(fā)現(xiàn)并提取這些數(shù)據(jù)中蘊含的具有深層次價值的信息。所以,如若想在決策層面給出解決答案,是不可能實現(xiàn)的。而如果采用數(shù)據(jù)挖掘技術(shù)來對數(shù)據(jù)庫中所存在的大量的數(shù)據(jù)進行高水平而深層次的分析,就能夠為實現(xiàn)保險公司的決策及科學(xué)經(jīng)營提供切實可行的依據(jù),因此此技術(shù)的出現(xiàn)從而得到了許多保險公司的應(yīng)用與重視。
三、結(jié)論
我國經(jīng)濟的發(fā)展正在向新常態(tài)的方向進行轉(zhuǎn)變,而我國財產(chǎn)保險市場的競爭也日益激烈。為了面對這些挑戰(zhàn),各個保險公司都復(fù)出了努力在積極的面向轉(zhuǎn)型,由傳統(tǒng)的粗放式經(jīng)營向集約化經(jīng)營的方式進行過度,面向客戶的營銷模式也是在這之中產(chǎn)生出來的。在這種轉(zhuǎn)型過度的過程中,財產(chǎn)保險公司對于數(shù)據(jù)挖掘技術(shù)進行充分的利用,使公司的風(fēng)險管理能力、產(chǎn)品創(chuàng)新能力經(jīng)營能力、盈利能力、客戶服務(wù)能力、和業(yè)務(wù)發(fā)展?jié)摿Χ嫉玫搅巳娴拇蠓忍嵘?。在對我國?jīng)濟建設(shè)的繁榮以及促進財產(chǎn)保險公司自身的長遠發(fā)展,都做出了不可磨滅的貢獻,也是對國家的號召積極的響應(yīng),進而對市場經(jīng)濟持續(xù)發(fā)展也做出了不少的.貢獻。
參考文獻:
[1]高文文.數(shù)據(jù)挖掘技術(shù)在財產(chǎn)保險分析中的應(yīng)用[D].河北科技大學(xué),20xx.[2]楊杉,何躍.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)在保險公司中的應(yīng)用[J].計算機技術(shù)與發(fā)展,20xx.[3]葛春燕.數(shù)據(jù)挖掘技術(shù)在保險公司客戶評估中的應(yīng)用研究[J].軟件,20xx.[4]陳慶文.數(shù)據(jù)挖掘在財產(chǎn)保險公司應(yīng)用研究——以人保財險公司為例[D].對外經(jīng)濟貿(mào)易大學(xué),20xx.
數(shù)據(jù)挖掘論文10摘要:數(shù)據(jù)挖掘是指從海量數(shù)據(jù)中找到人們未知、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校學(xué)籍預(yù)警機制的研究中,在大量以往的教學(xué)管理數(shù)據(jù)庫中挖掘出未知、可能有用的、隱藏的規(guī)則,促進教育的改革和發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘;DataMining;學(xué)籍預(yù)警機制
本文針對學(xué)分制背景下高校學(xué)籍預(yù)警機制存在的問題和現(xiàn)狀,用計算機數(shù)據(jù)挖掘(DataMining)技術(shù)對學(xué)籍預(yù)警機制進行分析,通過數(shù)據(jù)挖掘有關(guān)方法對搜集到的學(xué)生學(xué)籍數(shù)據(jù)進行分析和處理,以求能夠挖掘出大量的隱含在學(xué)籍信息系統(tǒng)中的有價值的資源,用以預(yù)測可能發(fā)生的預(yù)警事件,為教學(xué)管理者進行危機管理提供幫助。隨著高校招生規(guī)模不斷擴大,如何保證高校的教學(xué)質(zhì)量最終完成人才培養(yǎng)方案,成為一個重要的問題,具有重要研究價值。
一、高校學(xué)籍預(yù)警機制的現(xiàn)狀及問題
20xx年8月教育部對“學(xué)籍預(yù)警”這一詞語做出了解釋:是一種高等教育管理方式。普通高校學(xué)籍的預(yù)警方式一般采用學(xué)校和院系雙向管理,學(xué)校負責(zé)統(tǒng)一制定學(xué)籍預(yù)警標準,通過學(xué)習(xí)進度推進的不同階段劃分學(xué)分預(yù)警標準,在達到一定學(xué)分線開始預(yù)警,分為考勤預(yù)警、選課預(yù)警、成績預(yù)警、學(xué)籍異動預(yù)警、畢業(yè)預(yù)警。根據(jù)高校教學(xué)管理系統(tǒng),對缺課達到一定數(shù)目的學(xué)生進行提醒教育,期末統(tǒng)計學(xué)生完成的學(xué)分來評估學(xué)生學(xué)習(xí)情況,并預(yù)測學(xué)生是否能夠完成培養(yǎng)方案,通過教師提供的學(xué)生考勤記錄、作業(yè)情況以及課堂表現(xiàn)等,針對學(xué)生的具體情況對其預(yù)警。教學(xué)考核工作與學(xué)生思想政治工作在學(xué)生管理方面相對獨立,主要是事先警示教育、事后跟蹤管理。目前的學(xué)籍預(yù)警主要是單方向的,原有的學(xué)籍管理制度大都是傳統(tǒng)的事后處理型,具有延遲性。只有出現(xiàn)嚴重的學(xué)籍異常后,才會觸發(fā)預(yù)警機制,采取相應(yīng)的對策解決問題,家長對學(xué)生的在校學(xué)習(xí)情況了解不清,了解不及時,比如之前學(xué)期表現(xiàn)良好的學(xué)生本學(xué)期出現(xiàn)網(wǎng)癮狀態(tài)而不能及時發(fā)現(xiàn),往往會錯過對該生的最佳教育期。傳統(tǒng)的學(xué)籍預(yù)警機制無法做到提前預(yù)知,對學(xué)生的學(xué)習(xí)和生活狀況無法實時監(jiān)管,問題的根源也無法追蹤。
二、數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(DataMining)是指從海量數(shù)據(jù)中找到人們未知的、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。因此,將計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校學(xué)籍預(yù)警機制的研究中,在大量以往的教學(xué)管理數(shù)據(jù)庫中挖掘出未知的、可能有用的、隱藏的規(guī)則,促進教育的改革和發(fā)展。將計算機數(shù)據(jù)挖掘技術(shù)和傳統(tǒng)的人力管理相結(jié)合,以學(xué)生為本,建立健全全方位學(xué)籍預(yù)警構(gòu)架,做到“防微杜漸”,為學(xué)校順利完成教育目標起到促進作用。
三、數(shù)據(jù)挖掘在學(xué)籍預(yù)警機制里的應(yīng)用
隨著計算機技術(shù)的進步,各大高校逐步建立了日益完善的學(xué)籍信息管理系統(tǒng),累積了大量學(xué)籍信息數(shù)據(jù)庫。目前,這些數(shù)據(jù)主要用來向各級管理部門上報和學(xué)校自行查看存檔,但對于這些數(shù)據(jù)后面隱藏的價值并沒有進行深度挖掘和利用,十分可惜。所以,應(yīng)以高校學(xué)生信息管理系統(tǒng)為對象,研究深度數(shù)據(jù)挖掘的方法,“透過現(xiàn)象看本質(zhì)”,綜合分析出有價值的學(xué)籍預(yù)警信息,為管理提供參考。例如,學(xué)校發(fā)現(xiàn)高等數(shù)學(xué)等主干課的不及格率有逐年上升的趨勢,一般認為是學(xué)習(xí)不認真所致,但做了很多工作效果并不明顯,這時通過數(shù)據(jù)挖掘分析挖掘最近10年所有有過不及格課程的學(xué)生的成績,發(fā)現(xiàn)有較高比例的學(xué)生來自西部地區(qū),而且還發(fā)現(xiàn)有較高比例的學(xué)生家庭收入非常高或者非常低(生源地和經(jīng)濟情況問題)。針對此可以在學(xué)生管理上提前采取有針對性的管理措施。制定好目標標準,挖掘?qū)W生的學(xué)習(xí)習(xí)慣及學(xué)習(xí)特長,輔助教師指導(dǎo)學(xué)生,指導(dǎo)學(xué)生改正自己的不當行為,提高學(xué)習(xí)能力。從教學(xué)管理系統(tǒng)中所記載的學(xué)生基本資料、學(xué)習(xí)成績、學(xué)習(xí)經(jīng)歷、學(xué)習(xí)喜好以及知識體系結(jié)構(gòu)等內(nèi)容,發(fā)現(xiàn)學(xué)生學(xué)習(xí)習(xí)慣,輔助學(xué)生改正自身學(xué)習(xí)行為。提高學(xué)生各方面綜合素質(zhì)。利用數(shù)據(jù)挖掘的關(guān)聯(lián)分析輔助師生行為預(yù)警干預(yù)。各高校學(xué)籍管理系統(tǒng)中記載著各院系各專業(yè)學(xué)生與教師的學(xué)習(xí)工作,社會活動,獎勵處罰情況,可從中分析出師生各種活動之間的內(nèi)在聯(lián)系,假定有規(guī)則“A∪B∈C”,那么當在實際活動中,某學(xué)生已有A和B行為,馬上可以分析出產(chǎn)生下個行為的概率,可即時預(yù)警,提前制止C行為的發(fā)生。利用數(shù)據(jù)挖掘為課程設(shè)置提供合理依據(jù)。高校學(xué)生的課程安排設(shè)置是循序漸進的,每門課程之間都有一定的關(guān)聯(lián)和前后順序,在學(xué)習(xí)一門專業(yè)課程之前必須先修一門基礎(chǔ)課程,基礎(chǔ)知識沒學(xué)好勢必影響專業(yè)課程的學(xué)習(xí)。而且,同一年級不同專業(yè)學(xué)生之間,由于教師或教師專業(yè)背景知識不同,各個學(xué)生總體成績相差有時會很大。數(shù)據(jù)庫中記載著以往各專業(yè)學(xué)生各學(xué)科考試成績,使用數(shù)據(jù)挖掘的關(guān)聯(lián)分析與時序分析技術(shù),能分析出原因,在此基礎(chǔ)上對課程進行合理設(shè)置。
綜上所述,將基于計算機數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校的教學(xué)管理,以提高教學(xué)管理的預(yù)知性,增加教法選擇的參考性,加強教學(xué)過程的指導(dǎo)性,提高教學(xué)質(zhì)量。
參考文獻:
[1]陳東民,等.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)[M].北京:北京電子工業(yè)出版社,20xx
[2]楊悅.數(shù)據(jù)挖掘在高校招生工作中的應(yīng)用前景[J].教育科學(xué),20xx
[3]胡侃.基于大型數(shù)據(jù)倉庫的數(shù)據(jù)采掘[J].軟件學(xué)報,1998
數(shù)據(jù)挖掘論文11摘要:隨著我國社會經(jīng)濟的不斷發(fā)展,人力資源管理也受到越來越多人們的重視,然而在如今激烈的市場競爭下很多企業(yè)依然不重視人力資源管理,從而使得自身的整體工作效率不高。為此,筆者認為為了提高礦建人力資源管理的質(zhì)量,應(yīng)采取數(shù)據(jù)挖掘技術(shù)來開展工作,從而讓整個企業(yè)在激烈的市場競爭中穩(wěn)定、長久發(fā)展下去。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);企業(yè)人力資源管理;應(yīng)用
1、數(shù)據(jù)挖掘技術(shù)在企業(yè)人力資源管理中應(yīng)用的現(xiàn)狀
隨著我國人力資源管理體系的不斷發(fā)展,隱藏在管理工作中的問題也被逐漸顯露出來,雖然很多企業(yè)的高層管理者對人力資源管理這塊已經(jīng)高度重視,但是企業(yè)往往是希望通過運用相關(guān)的系統(tǒng)來對人才進行管理,基于我國社會整體經(jīng)濟實力的不斷發(fā)展以及互聯(lián)網(wǎng)信息時代的到來,數(shù)據(jù)挖掘技術(shù)也受到越來越多的企業(yè)多關(guān)注,并紛紛采用該技術(shù)對自身人力資源進行管理,同時也將人力資源管理系統(tǒng)作為整個信息化建設(shè)過程中的核心部位,就數(shù)據(jù)調(diào)查顯示,數(shù)據(jù)挖掘技術(shù)已經(jīng)被國外很多軟件開放式引入自身的人力資源管理工作中,并使自身內(nèi)部逐步形成了一套完整的人力資源管理系統(tǒng)體系。除此之外,數(shù)據(jù)挖掘技術(shù)也被廣泛應(yīng)用在企業(yè)的基本人力資源檔案管理工作中,隨著信息技術(shù)時代的到來,以往傳統(tǒng)的計算機管理模式對人力資源管理效率往往并不高,為此,數(shù)據(jù)挖掘技術(shù)對企業(yè)人力資管理工作是百利而無一害的。
2、數(shù)據(jù)挖掘技術(shù)在企業(yè)人力資源管理中的應(yīng)用2、1人才的招聘
任何企業(yè)在發(fā)展過程中都是離不開新鮮血液注入的,隨著目前我國市場經(jīng)濟競爭趨勢的不斷增長,企業(yè)要想穩(wěn)固發(fā)展必須要引入人力資源管理,只有這樣才能提高企業(yè)經(jīng)濟效益以及社會收益。為此,企業(yè)應(yīng)對人才進行招聘,這也是獲取人力資源的重要手段,通過采用數(shù)據(jù)挖掘技術(shù)來吸引社會中的各類人才,并采取有效的人才管理流程來對人才進行篩選,最終選擇質(zhì)量最佳的人才資源。與此同時,企業(yè)對人才招聘質(zhì)量的優(yōu)與良對自身內(nèi)部的員工、人類資源也會造成一定的影響,換句話來講,人才的招聘往往是企業(yè)人力資源管理工作開展的前期階段,然而在實際人才招聘過程中很多企業(yè)總是找不到合適的人選,同時也有大量的優(yōu)質(zhì)人才也很難找的適合自身的工作,這也就加大了企業(yè)人才招聘的難度,也進一步加大了招聘的成本,為此,企業(yè)采取數(shù)據(jù)挖掘技術(shù)可以有效降低人才招聘的成本支出,從而使自身獲得更大的經(jīng)濟收益與社會利益。
2、2對人才的管理
隨著社會對人才需求量的不斷增加,企業(yè)對員工的數(shù)據(jù)記錄和管理方式也逐步優(yōu)化,然而在很多企業(yè)人力資源管理過程中仍然存在著諸多問題,而這些問題的存在對企業(yè)未來發(fā)展也產(chǎn)生阻礙作用。為了企業(yè)在未來發(fā)展道路上穩(wěn)固、長久發(fā)展,應(yīng)采取數(shù)據(jù)挖掘技術(shù)來對人才進行管理,以往傳統(tǒng)的管理模式往往是對員工的基本信息以及日常考核進行管理,這種管理方式已經(jīng)不適應(yīng)現(xiàn)在時代發(fā)展的趨勢,為此,礦建企業(yè)必要順應(yīng)當下時代的發(fā)展趨勢來采取有效的措施來對人力資源進行管理,現(xiàn)代化的管理模式主要強調(diào)的是對相關(guān)數(shù)據(jù)的分析和整理能力,通過對數(shù)據(jù)的分析來形成具有實際指導(dǎo)作用的總結(jié),從而為企業(yè)人力資源管理工作提供有價值的參考依據(jù)。例如,在實際人力資源管理過程中可以利用數(shù)據(jù)挖掘技術(shù)來對企業(yè)內(nèi)部員工的薪資水平進行分析,并對企業(yè)的成本控制提出有效的建議,也可以利用數(shù)據(jù)挖掘技術(shù)對企業(yè)中年紀較大的員工進行分析,并對其進行科學(xué)的評判,從而對其提出更有利的參考價值和依據(jù)。
2、3實現(xiàn)對企業(yè)人才的合理分配
隨著我國社會經(jīng)濟的不斷發(fā)展,人才的發(fā)展形勢也變得越來越“多元化”“個體化”。為此,筆者認為為了進一步提高礦建企業(yè)人力資源管理工作的質(zhì)量,應(yīng)采取數(shù)據(jù)挖掘技術(shù)來對人才進行合理分配,并結(jié)合內(nèi)部員工的實際特點以及具體類型進行客觀性的評判,這對企業(yè)的人才資源管理以及未來發(fā)展無疑是百利無一害的。通過采取數(shù)據(jù)挖掘技術(shù)不僅可以實現(xiàn)對員工的共性以及特點進行分析,使每一位員工的信息資源、崗位職責(zé)得到有效劃分,同時也進一步實現(xiàn)對企業(yè)人才的合理分配。通過對數(shù)據(jù)信息的管理技術(shù)構(gòu)建實現(xiàn)對人員分組,從而使數(shù)據(jù)挖掘技術(shù)在企業(yè)人力資源管理中得到有效利用,使其發(fā)揮最大的作用與價值,同時也進一步提高企業(yè)人力資源管理工作的效率和和質(zhì)量,最終推動企業(yè)穩(wěn)固、長久的發(fā)展。
3、結(jié)語
綜上所述,隨著社會經(jīng)濟的飛速發(fā)展,建設(shè)領(lǐng)域也得到逐步提高,然而在人力資源管理工作中依然存在著諸多問題,這些問題的存在也嚴重阻礙我國社會經(jīng)濟的穩(wěn)固發(fā)展。所以,只有充分采用數(shù)據(jù)挖掘技術(shù)來開展人力資源管理工作,才能提高企業(yè)的人力資源管理水平。
參考文獻:
[1]曾巍、數(shù)據(jù)挖掘在人力資源市場中的應(yīng)用與研究[D].吉林大學(xué),20xx
[2]賴華強,王三銀,仲崇高、人力資源管理領(lǐng)域的數(shù)據(jù)挖掘應(yīng)用展望———以基于灰色關(guān)聯(lián)模型的離職管理實證分析為例[J].江蘇商論.20xx(08):42—47
[3]馬秦,張江、數(shù)據(jù)挖掘技術(shù)在企業(yè)人力資源管理中應(yīng)用的研究[J].中國新通信,20xx.20(15):232
[4]孫明標、基于大數(shù)據(jù)挖掘技術(shù)下的企業(yè)人力資源管理研究[J].現(xiàn)代營銷(下旬刊).20xx(01):166
數(shù)據(jù)挖掘論文12摘要:隨著計算機信息網(wǎng)絡(luò)的快速發(fā)展,數(shù)據(jù)挖掘在軟件工程中的地位越來越突出。軟件工程數(shù)據(jù)挖掘是在冗余的數(shù)據(jù)中發(fā)現(xiàn)有用的數(shù)據(jù),從而得到更好地利用。社會的發(fā)展,科技的進步使得社會進入了網(wǎng)絡(luò)信息熱時代,隨之計算機軟件也不斷增加,人們獲取的信息大部分是人手動操作軟件獲得的,這樣的信息量具有一定的局限性。因此,為了滿足當今社會的需要,必須借助于軟件工程數(shù)據(jù)挖掘的手段。
關(guān)鍵詞:軟件工程;數(shù)據(jù)挖掘;研究現(xiàn)狀
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(20xx)26-0020-02
利用數(shù)據(jù)挖掘技術(shù)對大量冗余的數(shù)據(jù)進行篩選從而得到少量精確的信息。冗余的數(shù)據(jù)是指既包含有用信息有包含無用信息,利用數(shù)據(jù)挖掘技術(shù)剔除掉多余的無用信息留下有用信息,這樣既可以提高手機數(shù)據(jù)的質(zhì)量又可以提高工作效率。所以,數(shù)據(jù)挖掘技術(shù)在當前的軟件工程中起著越來越重要的作用。數(shù)據(jù)挖掘技術(shù)提取、篩選、分析和整理數(shù)據(jù)比人工操作軟件獲得的數(shù)據(jù)更精確更高效。同時,使用這種技術(shù)為軟件開發(fā)者提供了有利的條件,它可以給軟件開發(fā)者提供一些對其開發(fā)軟件有用的信息。軟件開發(fā)者想要更有效率的開發(fā)出更高質(zhì)量的軟件,就必須獲得更多的更有用的數(shù)據(jù),而想要收集和整理出有用數(shù)據(jù)就需要借助數(shù)據(jù)挖掘技術(shù)來實現(xiàn),進而提高工作效率。數(shù)據(jù)挖掘的基本概述
軟件工程數(shù)據(jù)主要是指開發(fā)軟件過程中所涉及的各類數(shù)據(jù),如需求分析、可行性分析、設(shè)計等文檔,開發(fā)商通信、軟件注釋、代碼、版本、測試用例和結(jié)果、使用說明、用戶反饋等信息數(shù)據(jù),一般情況下其是軟件開發(fā)者獲取軟件數(shù)據(jù)的唯一來源;而數(shù)據(jù)挖掘是指在海量數(shù)據(jù)中集中發(fā)現(xiàn)有用知識或信息的過程。
軟件工程數(shù)據(jù)挖掘的工作原理 主要包括數(shù)據(jù)預(yù)處理階段、挖掘階段以及評估階段三個方面。在挖掘階段主要是運用分類、統(tǒng)計、關(guān)聯(lián)、聚類、異常檢測等一系列算法的過程。在評估階段數(shù)據(jù)挖掘的意義主要在于其結(jié)果應(yīng)易被用戶理解,其結(jié)果評估主要有兩個環(huán)節(jié)分別是模式過濾和模式表示。
數(shù)據(jù)挖掘在計算機軟件工程中的研究相當多,它是分析數(shù)據(jù)的一種新穎方式。目前,隨著社會工作的復(fù)雜度,需要更加完善的軟件,因此對于軟件代碼的數(shù)量也在急劇增加進而導(dǎo)致了數(shù)據(jù)量的快速增長。而傳統(tǒng)的數(shù)據(jù)計算方式已經(jīng)不能滿足目前對于大量數(shù)據(jù)進行分析的要求,所以,研究者希望能夠發(fā)掘出一種新的數(shù)據(jù)分析方式更高效的整理出有用的數(shù)據(jù)信息。軟件開發(fā)中會積累大量的數(shù)據(jù),比如說文本數(shù)據(jù),測試數(shù)據(jù),用戶信息數(shù)據(jù)以及用戶體驗反饋數(shù)據(jù)等等,軟件開發(fā)者為了開發(fā)出更好的軟件就必須分析和整理這些數(shù)據(jù)。但是,目前軟件工程開發(fā)的軟件越來越大,其數(shù)據(jù)越累越復(fù)雜對于數(shù)據(jù)的處理已經(jīng)超出了人工處理的能力的范疇,所以說繼續(xù)使用傳統(tǒng)數(shù)據(jù)處理的方式來收集,整理和分析數(shù)據(jù)已經(jīng)不可能實現(xiàn)。因此,推動了人們對于新的數(shù)據(jù)處理方式的研究,所以才提出了軟件工程數(shù)據(jù)挖掘技術(shù)。軟件工程數(shù)據(jù)挖掘的應(yīng)用
隨著計算機軟件工程的發(fā)展,可以發(fā)現(xiàn)傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)具有很多的不足,存在一定的缺陷。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的定位系統(tǒng)不完善,定位不精確,并沒有體現(xiàn)出數(shù)據(jù)挖掘技術(shù)的高性能,它不足以滿足當代對于數(shù)據(jù)處理的要求,因此需要對傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)進行改進和完善,這是我們目前的首要任務(wù)之一。為了迎合現(xiàn)代化網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,需要發(fā)掘出新的數(shù)據(jù)處理模式,就是在這樣的背景條件下,誕生了軟件工程數(shù)據(jù)挖掘技術(shù)。相比于存在很多缺陷與不足的傳統(tǒng)軟件工程而言,軟件工程數(shù)據(jù)挖掘技術(shù)更加簡單、方便、高效以及精確。軟件工程數(shù)據(jù)挖掘技術(shù)并不需要特定的技術(shù)平臺,體現(xiàn)了其普適性。當前,我國已經(jīng)開始深入的研究軟件工程數(shù)據(jù)挖掘技術(shù),但是,仍然需要更深的開發(fā)其性能以便更好地滿足社會的需求。軟件工程數(shù)據(jù)挖掘面臨的挑戰(zhàn)
軟件工程數(shù)據(jù)相比于普通數(shù)據(jù)更加復(fù)雜,所以對于軟件工程數(shù)據(jù)進行處理具有很大的挑戰(zhàn)性。處理軟件工程的大量數(shù)據(jù)具有:軟件工程數(shù)據(jù)復(fù)雜性,軟件工程的數(shù)據(jù)處理非傳統(tǒng)以及需要嚴格精確的軟件工程數(shù)據(jù)的分析結(jié)果等三方面的困難。
3.1 對數(shù)據(jù)復(fù)雜性的分析
軟件工程數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。軟件工程中所產(chǎn)生的缺陷報告以及各種版本信息構(gòu)成了結(jié)構(gòu)化數(shù)據(jù)信息;而軟件工程處理過程中所產(chǎn)生的代碼信息和文本文檔信息構(gòu)成了非結(jié)構(gòu)化數(shù)據(jù)信息。由于這兩類數(shù)據(jù)包含的具體內(nèi)容不同,所以需要分別處理這兩種數(shù)據(jù),需要使用不同的算法對他們進行處理。雖然說需要不同方式處理這兩種數(shù)據(jù)但是并不表示這兩種數(shù)據(jù)之間沒有任何聯(lián)系,事實上,它們之間存在著重要的對應(yīng)關(guān)系。例如:代碼中存在著缺陷報告,版本信息中存在著對應(yīng)的文檔信息,由于它們之間存在著這樣的對應(yīng)關(guān)系,所以使得人們不能很好地對其進行整體分析,這就促使了人們開發(fā)出一種新的算法,新的數(shù)據(jù)分析技術(shù)能夠同時將結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息這兩種對應(yīng)數(shù)據(jù)一起挖掘出來。
3.2 對數(shù)據(jù)處理非傳統(tǒng)的分析
分析和評估軟件工程數(shù)據(jù)挖掘出來的信息,這是數(shù)據(jù)挖掘過程的最后一步??蛻羰擒浖こ虜?shù)據(jù)挖掘數(shù)據(jù)處理的最后宿體,軟件開發(fā)者需要對最終挖掘出來的數(shù)據(jù)進行轉(zhuǎn)變,格式轉(zhuǎn)變是為了滿足廣大客戶對于數(shù)據(jù)不同的要求。但是,由于需要對數(shù)據(jù)進行格式轉(zhuǎn)變,相當于增加了一定的工作量,那么軟件工程數(shù)據(jù)挖掘的效率則會被大大降低。對于客戶而言,他們需要的信息各種各樣并不單一,比如說客戶可能會同時需要具體的例子和編程代碼等;或者說需要具體例子和缺陷報告等;或者三者皆需要。由此可見,我們?nèi)匀恍枰倪M和完善軟件工程數(shù)據(jù)挖掘技術(shù)來提高其效率。怎樣才能做到讓客戶得到滿意的數(shù)據(jù)挖掘結(jié)果呢?那么就需要高效的數(shù)據(jù)挖掘技術(shù)將各類信息進行歸納總結(jié),改變其格式。這樣的技術(shù),不僅僅可以滿足客戶需求而且還可以使軟件開發(fā)者從中得到更大的利益。
3.3 對數(shù)據(jù)挖掘結(jié)果好壞的評價標準
對于傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)而言,它也有一套自己的對于數(shù)據(jù)結(jié)果處理好壞的分析標準,而這個標準對于傳統(tǒng)數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)處理的分析較準確。但是,在當前的軟件工程所要處理的數(shù)據(jù)量很大,傳統(tǒng)的評價標準已經(jīng)不能滿足現(xiàn)在的數(shù)據(jù)分析要求;使用不同的數(shù)據(jù)結(jié)果評價標準來評判不同的數(shù)據(jù)挖掘結(jié)果。然而不同的評價標準之間的聯(lián)系并不緊密,因此就需要開發(fā)者針對不同的數(shù)據(jù)類型做出不同的評價分析標準以便滿足客戶需求。想要對數(shù)據(jù)分析結(jié)果是否準確,數(shù)據(jù)挖掘的信息是否合理等等這些不同的問題進行更加深刻的了解,就要求開發(fā)者有獨特的見解,對于數(shù)據(jù)結(jié)果是否精確有一定的判斷能力??傊?,獲取準確的信息就是軟件工程數(shù)據(jù)挖掘的目的。所以,最后獲得的數(shù)據(jù)是否滿足要求就是評判軟件工程數(shù)據(jù)挖掘結(jié)果是否完美的標準。endprint對軟件工程數(shù)據(jù)挖掘應(yīng)用進行分析
4.1 對軟件數(shù)據(jù)挖掘技術(shù)進行分析
在軟件開發(fā)的過程中,數(shù)據(jù)挖掘技術(shù)包括兩個方面:(1)程序編寫;(2)程序成果。在這個過程中,程序結(jié)構(gòu)和程序功能技術(shù)的主要作用就是檢索出有效的信息。提升信息的有效性需要聯(lián)系到客戶的實際需要,同時也需要對程序編寫過程進行智能化培訓(xùn)。將調(diào)用、重載和多重繼承等關(guān)系家合起來進行有效的記錄各種相關(guān)信息,重視靜態(tài)規(guī)則的同時利用遞歸測試的方式來分配工作,從而更有效的掌握關(guān)聯(lián)度之間的可信性。
4.2 做好軟件維護中的軟件工程數(shù)據(jù)挖掘工作
在軟件維護的過程中,軟件修復(fù)和軟件改善工作依賴于數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘技術(shù)在軟件缺陷以及軟件結(jié)構(gòu)等也起到了重要的作用。軟件修復(fù)即維護者通過依據(jù)缺陷分派進行有效的評估并改善缺陷程序進而確定修復(fù)級別或者維護者可以選擇缺陷修復(fù)方式,無論哪種方式最終目的都是進行軟件修復(fù)來保證數(shù)據(jù)挖掘的高效性。缺陷分派即將缺陷轉(zhuǎn)化為文本類型,采取有效措施來進行修復(fù)。但是,這樣的方式它的實際準確率并不高,因而需要利用強化檢測來完善缺陷報告技術(shù)。
4.3 注重高性能數(shù)據(jù)挖掘技術(shù)開發(fā)工作
數(shù)據(jù)挖掘技術(shù)體現(xiàn)在軟件開發(fā)工作中的創(chuàng)新性不可或缺,在實際的工作過程中,目前的軟件工程數(shù)據(jù)挖掘更加重視兩個工作:(1)規(guī)則分析方式;(2)項目檢索工作??偠灾?,想要高效快速地尋找病毒,并對其進行全方位分析和評估得到準確的病毒數(shù)據(jù)需要高性能數(shù)據(jù)挖掘技術(shù)。只有提升數(shù)據(jù)分析的可行性,提升軟件開發(fā)安全性能,才能更好地實現(xiàn)軟件工程的良好發(fā)展??偨Y(jié)
綜上所述,數(shù)據(jù)挖掘技術(shù)的應(yīng)用非常廣泛,比如說分析代碼、軟件故障檢測以及軟件項目管理等三個方面應(yīng)用較多。值得關(guān)注的是,當前對于數(shù)據(jù)挖掘技術(shù)的研究還不夠成熟。因此,研究者需要對軟件工程數(shù)據(jù)挖掘技術(shù)進行深入的研究,從而能夠促進軟件更好地開發(fā)和管理。相信在不久的將來,我們一定可以在數(shù)據(jù)挖掘方面取得非常好的優(yōu)化效果。
參考文獻:
[1] 江義晟.軟件工程數(shù)據(jù)挖掘研究進展[J].電子技術(shù)與軟件工程,20xx(22).[2] 胡金萍.探析軟件工程數(shù)據(jù)挖掘研究進展[J].電腦知識與技術(shù),20xx(34).[3] 馬保平.關(guān)于對軟件工程中的數(shù)據(jù)挖掘技術(shù)的探討[J].電子技術(shù)與軟件工程,20xx(19).[4] 徐琳,王寧.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].數(shù)字通信世界,20xx(8).
數(shù)據(jù)挖掘論文13計算機技術(shù)的不斷發(fā)展,信息技術(shù)不斷加強,在社會新的發(fā)展趨勢下,以往的傳統(tǒng)管理模式落后于現(xiàn)代化發(fā)展的管理水平。為了創(chuàng)新檔案管理的模式,提高檔案管理的質(zhì)量,在現(xiàn)代檔案信息管理系統(tǒng)中引入數(shù)據(jù)挖掘技術(shù)。
1、信息挖掘技術(shù)
1.1數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)是一種基于統(tǒng)計學(xué)、人工智能等等技術(shù)基礎(chǔ)上,能夠自動分析原有數(shù)據(jù),從而做出歸納整理,并對其潛在的模式進行挖掘的決策支持過程,簡單來說就是從一系列復(fù)雜的數(shù)據(jù)中提取人們需要的潛在性信息。
1.2數(shù)據(jù)挖掘技術(shù)的方法
二十世紀末,計算機挖掘技術(shù)產(chǎn)生。其一般用到的方法有:
(1)孤立點分析。孤立點分析法主要用于對于特殊信息的挖掘。
(2)聚類分析。聚類分析方法是在指定的對象中,對其價值聯(lián)系進行搜索。
(3)分類分析。分類分析就是找出具有一定特點的數(shù)據(jù),對需要解讀的數(shù)據(jù)進行識別。
(4)關(guān)聯(lián)性分析。關(guān)聯(lián)性分析方法是對指定數(shù)據(jù)中出現(xiàn)頻繁的數(shù)據(jù)進行挖掘。
(5)序列分析。與關(guān)聯(lián)性分析法一樣,由數(shù)據(jù)之間內(nèi)在的聯(lián)系得出潛在的關(guān)聯(lián)。
1.3計算機挖掘技術(shù)的形式分析
計算機挖掘技術(shù)在使用過程中,收集到的數(shù)據(jù)不同,數(shù)據(jù)收集的方法也就不同。在對數(shù)據(jù)挖掘技術(shù)進行形式分析的時候,主要用到:分類形式、粗糙集形式、相關(guān)規(guī)則形式。
2、計算機數(shù)據(jù)挖掘技術(shù)在檔案信息管理
系統(tǒng)中的應(yīng)用計算機挖掘技術(shù),能夠?qū)㈦[藏的信息挖掘出來并進行總結(jié)和利用,運用到檔案管理中來,在充分發(fā)揮挖掘技術(shù)作用的同時,極大的提高了檔案數(shù)據(jù)的利用價值。數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中,一般用到的方法為:
2.1收集法
該方法在對數(shù)據(jù)庫中的數(shù)據(jù)進行分析的基礎(chǔ)上,建立對已知數(shù)據(jù)詳細描述的概念模型。然后將每個測試的樣本與此模型進行比較,若有一個模型在測試中被認可,就可以以此模型對管理的對象分類。例如,檔案管理員就某事向客戶進行問卷調(diào)查并將答案輸入到數(shù)據(jù)庫中。在該數(shù)據(jù)庫中,對客戶的回答進行具體屬性描述,當有新的回答內(nèi)容輸入的時候,系統(tǒng)會自動對該客戶需求分類,在減輕管理員工作壓力的同時,提高了檔案管理的效率。
2.2保留法
該方法是防止老客戶檔案丟失并將客戶留住的過程。對于任何一個企業(yè)來說,發(fā)展一個新的客戶的成本要遠遠高于留住一個來客戶的成本。在客戶保留的過程中,對客戶檔案流失原因的分析至關(guān)重要,因此,采用挖掘技術(shù)對其進行分析是必要的。
2.3分類法
通過計算機挖掘技術(shù)對檔案進行分類,按照不同的性質(zhì)進行系統(tǒng)的劃分,將所有相似或相通的檔案進行整理,在人們需要的時候,能夠快速的被提取出來,提高了檢索的效率和分類的專業(yè)性。
3、檔案管理引入計算機挖掘技術(shù)的必要性
計算機挖掘技術(shù)的應(yīng)用,對檔案管理方式的不斷完善有著極其重要的意義,其重要性主要體現(xiàn)在:
3.1對檔案的保護更全面
一部分具有歷史意義的檔案,隨著保存的時間不斷增加,其年代感加強,意義和價值增大。相應(yīng)的,利用的頻率會隨著利用的價值增加,也更容易被損壞從而導(dǎo)致檔案信息壽命折損,此外,管理不當造成泄密,使檔案失去了原本的利用價值,這種存在于檔案管理和利用之間的矛盾,使得檔案管理面臨著巨大的難題。挖掘技術(shù)的運用,緩解了這種矛盾,在檔案管理工作中具有重要的意義。
3.2提升檔案管理的質(zhì)量
在檔案信息管理系統(tǒng)中引入計算機挖掘技術(shù),使得檔案信息管理打破了傳統(tǒng)的模式,通過挖掘技術(shù),對管理的模式有了極大的創(chuàng)新,工作人員以往繁重的工作壓力得到釋放,時間和精力更加豐富,在對檔案管理的細節(jié)方面也就更加注意,同時也加快了對檔案的數(shù)據(jù)信息進行處理的速度,提升檔案管理的整體質(zhì)量。
4、結(jié)語
綜上所述,計算機數(shù)據(jù)挖掘技術(shù)涉及的內(nèi)容很廣,對挖掘技術(shù)的運用,使得各行各業(yè)的發(fā)展水平得到了很大的提高,推動社會經(jīng)濟的發(fā)展,帶動社會發(fā)展模式的創(chuàng)新。在檔案管理中使用計算機挖掘技術(shù),使得檔案信息保存的方法及安全性有了很大的提高。同時,也需要檔案信息管理人員在進行檔案信息管理的時候,能合理利用計算機信息挖掘技術(shù),在提高工作效率的同時,促進管理模式的不斷創(chuàng)新,以適應(yīng)時代發(fā)展的要求。
數(shù)據(jù)挖掘論文14摘要:在電子商務(wù)中運用數(shù)據(jù)挖掘技術(shù),對服務(wù)器上的日志數(shù)據(jù)、用戶信息和訪問鏈接信息進行數(shù)據(jù)挖掘,有效了解客戶的購買欲望,從而調(diào)整電子商務(wù)平臺,最終實現(xiàn)利益更大化。本文旨在了解電子商務(wù)中的數(shù)據(jù)源有哪些,發(fā)掘數(shù)據(jù)挖掘在電子商務(wù)中的具體作用,從而為數(shù)據(jù)挖掘的具體設(shè)計奠定基礎(chǔ)。
關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)數(shù)據(jù)源
1.服務(wù)器日志數(shù)據(jù)客戶在訪問網(wǎng)站時,就會在服務(wù)器上產(chǎn)生相應(yīng)的服務(wù)器數(shù)據(jù),這些文件主要是日志文件。而日志文件又可分為Ser-vicelogs、Errorlogs、Cookielogs。其中Servicelogs文件格式是最常用的標準公用日志文件格式,也是標準組合日志文件格式。標準公用日志文件的格式存儲關(guān)于客戶連接的物理信息。標準組合日志文件格式主要包含關(guān)于日志文件元信息的指令,如版本號,會話監(jiān)控開始和結(jié)束的日期等。在日志文件中,Cookielogs日志文件是很重要的日志文件,是服務(wù)器為了自動追蹤網(wǎng)站訪問者,為單個客戶瀏覽器生成日志[1]。
2.客戶登記信息
客戶登記信息是指客戶通過Web頁輸入的、并提交給服務(wù)器的相關(guān)用戶信息,這些信息通常是關(guān)于用戶的常用特征。
在Web的數(shù)據(jù)挖掘中,客戶登記信息需要和訪問日志集成,以提高數(shù)據(jù)挖掘的準確度,使之能更進一步的了解客戶。
3.web頁面的超級鏈接
輔之以監(jiān)視所有到達服務(wù)器的數(shù)據(jù),提取其中的HTTP請求信息。此部分數(shù)據(jù)主要來自瀏覽者的點擊流,用于考察用戶的行為表現(xiàn)。網(wǎng)絡(luò)底層信息監(jiān)聽過濾指監(jiān)聽整個網(wǎng)絡(luò)的所有信息流量,并根據(jù)信息源主機、目標主機、服務(wù)協(xié)議端口等信息過濾掉垃圾數(shù)據(jù),然后進行進一步的處理,如關(guān)鍵字的搜索等,最終將用戶感興趣的數(shù)據(jù)發(fā)送到給定的數(shù)據(jù)接受程序存儲到數(shù)據(jù)庫中進行分析統(tǒng)計。
二、Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用通過對數(shù)據(jù)源的原始積累、仔細分析,再利用數(shù)據(jù)發(fā)掘技術(shù),最終達到為企業(yè)為用戶服務(wù)的目的,而這些服務(wù)主要有以下幾種。
1.改進站點設(shè)計,提高客戶訪問的興趣對客戶來說,傳統(tǒng)客戶與銷售商之間的空間距離在電子商務(wù)中已經(jīng)不存在了,在Internet上,每一個銷售商對于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點上駐留更長的時間,對銷售商來說將是一個挑戰(zhàn)。為了使客戶在自己的網(wǎng)站上駐留更長的時間,就應(yīng)該對客戶的訪問信息進行挖掘,通過挖掘就能知道客戶的瀏覽行為,從而了解客戶的興趣及需求所在,并根據(jù)需求動態(tài)地調(diào)整頁面,向客戶展示一個特殊的頁面,提供特有的一些商品信息和廣告,以使客戶能繼續(xù)保持對訪問站點的興趣。
2.發(fā)現(xiàn)潛在客戶
在對web的客戶訪問信息的挖掘中,利用分類技術(shù)可以在Internet上找到未來的潛在客戶。獲得這些潛在的客戶通常的市場策略是:先對已經(jīng)存在的訪問者進行分類。對于一個新的訪問者,通過在Web上的分類發(fā)現(xiàn),識別出這個客戶與已經(jīng)分類的老客戶的一些公共的描述,從而對這個新客戶進行正確的歸類。然后從它所屬類判斷這個新客戶是否為潛在的購買者,決定是否要把這個新客戶作為潛在的客戶來對待。
客戶的類型確定后,就可以對客戶動態(tài)地展示W(wǎng)eb頁面,頁面的內(nèi)容取決于客戶與銷售商提供的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。
對于一個新的客戶,如果花了一段時間瀏覽市場站點,就可以把此客戶作為潛在的客戶并向這個客戶展示一些特殊的頁面內(nèi)容。
3.個性化服務(wù)
根據(jù)網(wǎng)站用戶的訪問情況,為用戶提供個性化信息服務(wù),這是許多互聯(lián)網(wǎng)應(yīng)用,尤其是互聯(lián)網(wǎng)信息服務(wù)或電子商務(wù)(網(wǎng)站)所追求的目標。根據(jù)用戶的訪問行為和檔案向使用者進行動態(tài)的推薦,對許多應(yīng)用都有很大的吸引力。Web日志挖掘是一個能夠出色地完成這個目標的方式。通過Web數(shù)據(jù)挖掘,可以理解訪問者的動態(tài)行為,據(jù)此優(yōu)化電子商務(wù)網(wǎng)站的經(jīng)營模式。通過把所掌握的大量客戶分成不同的類,對不同類的客戶提供個性化服務(wù)來提高客戶的滿意度,從而保住老客戶;通過對具有相似瀏覽行為的客戶進行分組,提取組中客戶的共同特征,從而實現(xiàn)客戶的聚類,這可以幫助電子商務(wù)企業(yè)更好地了解客戶的興趣、消費習(xí)慣和消費傾向,預(yù)測他們的需求,有針對性地向他們推薦特定的商品并實現(xiàn)交叉銷售,可以提高交易成功率和交易量,提高營銷效果。
例如全球最大中文購物網(wǎng)站淘寶網(wǎng)。當你購買一件商品后,淘寶網(wǎng)會自動提示你“購買過此商品的人也購買過……”類似的信息,這就是個性化服務(wù)的代表。
4.交易評價
現(xiàn)在幾乎每一個電子商務(wù)網(wǎng)站都增加了交易評價功能,交易評價功能主要就是為了降低交易中的信息不對稱問題。
電子商務(wù)交易平臺設(shè)計了在線信譽評價系統(tǒng),對買賣雙方的交易歷史及其評價進行記錄。在聲譽效應(yīng)的影響下,賣家也更加重視買家的交易滿意度,并且也形成了為獲取好評減少差評而提高服務(wù)質(zhì)量的良好風(fēng)氣。交易中的不滿意(或者成為糾紛)是產(chǎn)生非好評(包括中評和差評)的直接原因。那么,交易中一般會產(chǎn)生哪些交易糾紛,這些交易糾紛的存在會如何影響交易評價結(jié)果,這些問題的解決對賣家的經(jīng)營具有重要的指導(dǎo)價值。
總結(jié)
數(shù)據(jù)挖掘是當今世界研究的熱門領(lǐng)域,其研究具有廣闊的應(yīng)用前景和巨大的現(xiàn)實意義。借助數(shù)據(jù)挖掘可以改進企業(yè)的電子商務(wù)平臺,增加企業(yè)的經(jīng)營業(yè)績,拓寬企業(yè)的經(jīng)營思路,最終提高企業(yè)的競爭力。
參考文獻:
[1].趙東東.電子商務(wù)中的web數(shù)據(jù)挖掘系統(tǒng)設(shè)計[J].微計算機信息20xx,23(10-3):168[2].劉曄.Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].中國市場20xx,39(9):178
數(shù)據(jù)挖掘論文15一、旅游業(yè)數(shù)據(jù)挖掘國內(nèi)外研究現(xiàn)狀
隨著我國的旅游業(yè)的迅猛發(fā)展,旅游產(chǎn)業(yè)正邁向國際化的軌道,傳統(tǒng)旅游業(yè)積累的海量數(shù)據(jù),沒有被有效利用,資源被極大浪費。將數(shù)據(jù)挖掘引入到旅游產(chǎn)業(yè)是大勢所趨。當前數(shù)據(jù)挖掘在旅游信息化建設(shè)中的應(yīng)用與研究情況主要集中在高校理論界的研究,大多數(shù)研究僅僅是學(xué)術(shù)研究,真正運用到旅游行業(yè)的文章多是從某個具體的方面出發(fā),針對個別應(yīng)用進行數(shù)據(jù)挖掘的融合。筆者主要研究決策樹方法在旅游信息化建設(shè)中的應(yīng)用。目前,決策樹算法有CLS算法、ID3算法、C4.5算法、CART算法、SLIQ算法、Z統(tǒng)計算法、并行決策樹算法和SPRINT算法等。不同算法在執(zhí)行效率、輸出結(jié)果、可擴容性、可理解性、預(yù)測的準確性等方面各不相同。總的來說,這么多決策樹算法各有優(yōu)缺點,真正將數(shù)據(jù)挖掘運用到整個旅游信息化建設(shè)中還有很多問題需要解決。
二、旅游業(yè)數(shù)據(jù)挖掘算法選擇
數(shù)據(jù)挖掘中常用的基本分類算法有決策樹、貝葉斯、基于規(guī)則的算法等等。其中,決策樹是目前主流的分類技術(shù),己經(jīng)成功的應(yīng)用于更多行業(yè)的數(shù)據(jù)分析。在關(guān)聯(lián)規(guī)則挖掘研究中,最重要的是Apriori算法,這個算法后來成為絕大多數(shù)關(guān)聯(lián)規(guī)則分類的基礎(chǔ)。聚類算法也是數(shù)據(jù)挖掘技術(shù)中極為重要的組成部分。與分類技術(shù)不同的是,聚類不要求對數(shù)據(jù)進行事先標定,就數(shù)據(jù)挖掘功能而言,聚類能夠可以針對數(shù)據(jù)的相異度來分析評估數(shù)據(jù),可以作為其他對發(fā)現(xiàn)的簇運行的數(shù)據(jù)挖掘算法的預(yù)處理步驟。各種算法分類模型建立有所不同,但原理是大致相同的。筆者考慮決策樹算法結(jié)構(gòu)簡單,便于理解,且很擅長處理非數(shù)值型數(shù)據(jù),建模效率高,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理的優(yōu)點,結(jié)合旅游產(chǎn)業(yè)數(shù)據(jù)特點,故作重點分析。
三、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)需求分析
旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的基本特點如下:統(tǒng)計旅游興趣;購物消費趨向;推薦其感興趣的旅游景點;在后臺管理中,通過決策樹算法對游客數(shù)量、平均年齡、景點收費、游客來自地區(qū)等進行分析總結(jié),為旅游消費者和旅游管理者提供服務(wù):為消費者提供吃住行購娛樂天氣各方面信息查詢、機票、車船票、酒店、景區(qū)門票、餐飲等方面的預(yù)定與現(xiàn)金支付、第三方支付、消費者評價、在線咨詢等方面的便利、快捷服務(wù)。為管理者提供推薦、游客管理、線路管理、景點管理、特色服務(wù)管理、機票管理、在線咨詢管理、旅游客戶關(guān)系管理等服務(wù),提高整體服務(wù)效率和水平。
四、旅游業(yè)數(shù)據(jù)挖掘系統(tǒng)的實現(xiàn)
旅游業(yè)信息管理系統(tǒng)包括游客信息管理與游客信息分析兩個子模塊。根據(jù)系統(tǒng)日常運行出現(xiàn)的問題及時對系統(tǒng)進行維護,如添加或者刪除某個模塊功能,系統(tǒng)整體運行速度的更近等。系統(tǒng)運用數(shù)據(jù)庫層、持久化層、業(yè)務(wù)邏輯層、表示層四層體系結(jié)構(gòu),主要利用ID3算法達到旅游數(shù)據(jù)信息的快速、準確分類??紤]了游客與酒店之間的關(guān)系、游客與旅游路線之間的關(guān)系、游客與旅游景點之間的關(guān)系、游客與機票、車票之間的關(guān)系、管理員與游客之間的關(guān)系、邏輯結(jié)構(gòu)設(shè)計。程序之間的獨立性增加,易于擴展,規(guī)范化得到保證的同時提高了系統(tǒng)的安全性。詳細功能設(shè)計包括:用戶登錄、用戶查詢、預(yù)定及支付、后臺管理、旅游客戶管理和數(shù)據(jù)分析等方面。本系統(tǒng)中主要運用Java語言就行邏輯上的處理。系統(tǒng)主要使用Struts2和Hibernate這兩個框架來進行整個系統(tǒng)的搭建。其中Struts2主要處理業(yè)務(wù)邏輯,而Hibernate主要是處理數(shù)據(jù)存儲、查詢等操作。系統(tǒng)采用Tomcat服務(wù)器。系統(tǒng)模塊需要實現(xiàn)酒店推薦實現(xiàn)、景點推薦實現(xiàn)、天氣預(yù)報實現(xiàn)、旅游線路實現(xiàn)、特產(chǎn)推薦、數(shù)據(jù)分析展現(xiàn)功能、報表數(shù)據(jù)獲取、景區(qū)客流量變化分析實現(xiàn)等。需要進行后臺信息管理等功能測試以及時間測試、數(shù)據(jù)測試等性能測試。
五、旅游業(yè)數(shù)據(jù)挖掘算法方案中存在的一般性問題及其改進
在對數(shù)據(jù)挖掘的基本方法與技術(shù)進行總結(jié)的基礎(chǔ)上,結(jié)合當今數(shù)據(jù)挖掘的發(fā)展方向和研究熱點,可以發(fā)現(xiàn)旅游業(yè)數(shù)據(jù)挖掘算法系統(tǒng)有待進一步完善之處:訂票系統(tǒng)尚待完善。界面美化需要進一步改進。數(shù)據(jù)表之間的結(jié)構(gòu)關(guān)系需要優(yōu)化,以提高數(shù)據(jù)處理能力和效率。數(shù)據(jù)挖掘工具及算法有待精細化改進。
作者:朱暉 單位:河南職業(yè)技術(shù)學(xué)院
第四篇:電子商務(wù)數(shù)據(jù)挖掘方法論文
摘要: 電子商務(wù)是現(xiàn)代商業(yè)的主流趨勢,如何充分利用網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)發(fā)揮企業(yè)優(yōu)勢,成為企業(yè)制勝的法寶。本文介紹了常用的數(shù)據(jù)挖掘方法,以及在電子商務(wù)領(lǐng)域的應(yīng)用,分析了利用數(shù)據(jù)挖掘技術(shù)建設(shè)動態(tài)、高效電子商務(wù)的可行性。
關(guān)鍵詞:數(shù)據(jù)挖掘 電子商務(wù) 數(shù)據(jù)庫
一、引言
電子商務(wù)是指以Internet網(wǎng)絡(luò)為載體、利用數(shù)字化電子方式開展的商務(wù)活動。隨著網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫技術(shù)的飛速發(fā)展,電子商務(wù)正顯示越來越強大的生命力。電子商務(wù)的發(fā)展促使公司內(nèi)部收集了大量的數(shù)據(jù),并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識,為公司創(chuàng)造更多潛在的利潤。利用數(shù)據(jù)挖掘技術(shù)可以有效地幫助企業(yè)分析從網(wǎng)上獲取的大量數(shù)據(jù),發(fā)現(xiàn)隱藏在其后的規(guī)律性,提取出有效信息,進而指導(dǎo)企業(yè)調(diào)整營銷策略,給客戶提供動態(tài)的個性化的高效率服務(wù)。
二、數(shù)據(jù)挖掘技術(shù)
1.數(shù)據(jù)挖掘
數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database, KDD),是從大量的、不完全的、有噪聲的、模糊的和隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的知識。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用領(lǐng)域,它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且,要對數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指定實際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動進行預(yù)測。數(shù)據(jù)挖掘技術(shù)在金融、保險、電信、大型超市等積累有大量數(shù)據(jù)的電子商務(wù)行業(yè)有著廣泛的應(yīng)用,如信用分析、風(fēng)險分析、欺詐檢驗、用戶聚類分析、消費者習(xí)慣分析等。
2.數(shù)據(jù)挖掘過程
挖掘數(shù)據(jù)過程可以分為3個步驟:數(shù)據(jù)預(yù)處理、模式發(fā)現(xiàn)、模式分析。
(1)數(shù)據(jù)預(yù)處理。實際系統(tǒng)中的數(shù)據(jù)一般都具有不完全性、冗余性和模糊性。因此,數(shù)據(jù)挖掘一般不對原始數(shù)據(jù)進行挖掘,要通過預(yù)處理提供準確、簡潔的數(shù)據(jù)。預(yù)處理主要完成以下工作:包括合并數(shù)據(jù),將多個文件或多個數(shù)據(jù)庫中的數(shù)據(jù)進行合并處理;選擇數(shù)據(jù),提取出適合分析的數(shù)據(jù)集合;數(shù)據(jù)清洗、過濾,剔除一些無關(guān)記錄,將文件、圖形、圖像及多媒體等文件轉(zhuǎn)換成可便于數(shù)據(jù)挖掘的格式等。
(2)模式發(fā)現(xiàn)。模式發(fā)現(xiàn)階段就是利用挖掘算法挖掘出有效的、新穎的、潛在的、有用的以及最終可以理解的信息和知識??捎糜赪eb的挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類規(guī)則、聚類分析、序列分析、依賴性建模等等。
(3)模式分析。模式分析是從模式發(fā)現(xiàn)階段獲得的模式、規(guī)則中過濾掉不感興趣的規(guī)則和模式。通過技術(shù)手段,對得到的模式進行數(shù)據(jù)分析,得出有意義的結(jié)論。常用的技術(shù)手段有:關(guān)聯(lián)規(guī)則、分類、聚類、序列模式等。
三、電子商務(wù)中幾種常用的數(shù)據(jù)挖掘方法
1.關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘研究的主要模式之一,側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,找出滿足給定條件下的多個域間的依賴關(guān)系。關(guān)聯(lián)規(guī)則挖掘?qū)ο笠话闶谴笮蛿?shù)據(jù)庫,該規(guī)則一般表示式為:A1∧A2∧…Am=>B1∧B2∧…Bm,其中,Ak(k=1,2,…, m),Bj(j=1,2,…,n)是數(shù)據(jù)庫中的數(shù)據(jù)項。有Support(A=>B)=p(A∪B),Confidence(A=>B)=p(A|B)。數(shù)據(jù)項之間的關(guān)聯(lián),即根據(jù)一個事務(wù)中某些數(shù)據(jù)項的出現(xiàn)可以導(dǎo)出另一些數(shù)據(jù)項在同一事務(wù)中的出現(xiàn)。關(guān)聯(lián)分析的目的是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。關(guān)聯(lián)規(guī)則用于尋找在同一個事件中出現(xiàn)的不同項的相關(guān)性,比如在一次購買活動中所買不同商品的相關(guān)性。關(guān)聯(lián)分析的典型例子是購物籃分析,描述顧客的購買行為,可以幫助零售商決定商品的擺放和捆綁銷售策略。如著名的(面包+黃油→牛奶)例子就屬于關(guān)聯(lián)分析:在超市中,90%的顧客在購買面包和黃油的同時,也會購買牛奶。直觀的意義是:顧客在購買某種商品時有多大的傾向會購買另外一些商品。找出所有類似的關(guān)聯(lián)規(guī)則,對于企業(yè)確定生產(chǎn)銷售、產(chǎn)品分類設(shè)計、市場分析等多方面是有價值的。
2.聚類分析方法
類聚分析就是直接比較樣本中各事物之間的性質(zhì),將性質(zhì)相近的歸為一類,而將性質(zhì)差別較大的分在不同的類。對變量聚類計算變量之間的距離,對樣本聚類則計算樣本之間的距離。它的目的是使得屬于同一類別的個體之間的距離盡可能小,而不同類別上的個體間的距離盡可能大。
聚類分析用于把有相似特性的客戶、數(shù)據(jù)項集合到一起。在電子商務(wù)中, 聚類分析常用于市場細分。根據(jù)已有客戶的數(shù)據(jù),利用聚類技術(shù)將市場按客戶消費模式的相似性分為若干細分市場,以進行有針對性的市場營銷,提供更適合、更滿意的服務(wù)。如自動給一個特定的客戶聚類發(fā)送銷售郵件,為一個客戶聚類動態(tài)地改變一個特殊的站點等。通過對聚類的客戶特征的提取,電子商務(wù)網(wǎng)站還可以為客戶提供個性化的服務(wù)。
3.分類分析
分類系統(tǒng)是基于遺傳算法的機器學(xué)習(xí)中的一類,它包括一個簡單的基于串規(guī)則的并行生成子系統(tǒng)、規(guī)則評價子系統(tǒng)和遺傳算法子系統(tǒng)。分類系統(tǒng)正在被人們越來越多地應(yīng)用于科學(xué)、工程和經(jīng)濟領(lǐng)域中,是目前遺傳算法研究領(lǐng)域中一個非?;钴S的領(lǐng)域。
分類分析是數(shù)據(jù)挖掘中應(yīng)用最多的方法。分類要解決的問題是為一個事件或?qū)ο髿w類,既可以用于分析已有的數(shù)據(jù),也可以用來預(yù)測未來的數(shù)據(jù)。分類通過分析已知分類信息的歷史數(shù)據(jù),總結(jié)出一個預(yù)測模型,預(yù)測哪些人可能會對郵寄廣告、產(chǎn)品目錄等有反應(yīng),可以針對這一類客戶的特點展開商務(wù)活動,提供個性化的信息服務(wù)。
4.序列模式
序列模式挖掘就是要挖掘出交易集之間有時間序列關(guān)系的模式。它挖掘的側(cè)重點在于分析數(shù)據(jù)間的前后或因果關(guān)系,找到那些“一些項跟隨另一些項”,以預(yù)測未來的訪問模式。序列模式分析和關(guān)聯(lián)分析類似,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側(cè)重點在于分析數(shù)據(jù)間的前后序列關(guān)系。它能發(fā)現(xiàn)數(shù)據(jù)庫中形如“在某一段時間內(nèi),顧客購買商品A,接著購買商品B,而后購買商品C,即序列A-B-C出現(xiàn)的頻率較高”之類的知識。序列模式分析描述的問題是:在給定交易序列數(shù)據(jù)庫中,每個序列是按照交易時間排列的一組交易集,挖掘序列函數(shù)作用在這個交易序列數(shù)據(jù)庫上,返回該數(shù)據(jù)庫中出現(xiàn)的高頻序列。在進行序列模式分析時,同樣也需要有用戶輸入最小置信度C和最小支持度S。
序列模式便于進行電子商務(wù)的組織,預(yù)測客戶的訪問模式,對客戶開展有針對性的廣告服務(wù)或者主動推薦客戶感興趣的頁面,以滿足訪問者的特定要求。
四、結(jié)束語
電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,也是未來商業(yè)運作模式的必然選擇。利用數(shù)據(jù)挖掘技術(shù)來分析大量的數(shù)據(jù),可以挖掘出商品的消費規(guī)律與客戶的訪問模式,幫助企業(yè)制定有效的營銷策略,充分發(fā)揮企業(yè)的獨特優(yōu)勢,促進管理創(chuàng)新和技術(shù)創(chuàng)新,提高企業(yè)競爭力。
隨著電子商務(wù)發(fā)展的勢頭越來越強勁, 面向電子商務(wù)的數(shù)據(jù)挖掘?qū)⑹且粋€非常有前景的領(lǐng)域。它能自動預(yù)測客戶的消費趨勢、市場走向,指導(dǎo)企業(yè)建設(shè)個性化智能網(wǎng)站,帶來巨大的商業(yè)利潤,可以為企業(yè)創(chuàng)建新的商業(yè)增長點。但是在面向電子商務(wù)的數(shù)據(jù)挖掘中也存在很多問題急需解決,比如怎樣將服務(wù)器的日志數(shù)據(jù)轉(zhuǎn)化成適合某種數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)格式,怎樣解決分布性、異構(gòu)性數(shù)據(jù)源的挖掘,如何控制整個Web上知識發(fā)現(xiàn)過程等。隨著硬件環(huán)境、挖掘算法的深入研究及應(yīng)用經(jīng)驗的積累,數(shù)據(jù)挖掘技術(shù)及在電子商務(wù)中的應(yīng)用必將取得長足的進展。
第五篇:數(shù)據(jù)挖掘教學(xué)方法研究論文
摘要:在本科高年級學(xué)生中開設(shè)符合學(xué)術(shù)研究和工業(yè)應(yīng)用熱點的進階課程是十分必要的。以數(shù)據(jù)挖掘課程為例,本科高年級學(xué)生了解并掌握數(shù)據(jù)挖掘的相關(guān)技術(shù),對于其今后的工作、學(xué)習(xí)不無裨益。著重闡述數(shù)據(jù)挖掘等進階課程在本科高年級學(xué)生中的教學(xué)方法,基于本科高年級學(xué)生的實際情況,以及進階課程的知識體系特點,提出有針對性的教學(xué)方法參考,從而提高進階課程的教學(xué)效果。
關(guān)鍵詞:數(shù)據(jù)挖掘;進階課程;教學(xué)方法研究;本科高年級
學(xué)生在本科高年級學(xué)生中開設(shè)數(shù)據(jù)挖掘等進階課程是十分必要的,以大數(shù)據(jù)、數(shù)據(jù)挖掘為例,其相關(guān)技術(shù)不僅是當前學(xué)術(shù)界的研究熱點,也是各家企事業(yè)單位招聘中重要崗位的要求之一。對于即將攻讀碩士或博士學(xué)位的學(xué)生,對于即將走上工作崗位的學(xué)生,了解并掌握一些大數(shù)據(jù)相關(guān)技術(shù),尤其是數(shù)據(jù)挖掘技術(shù),都是不無裨益的。在目前本科教學(xué)中,對于數(shù)據(jù)挖掘等課程的教學(xué),由于前序課程的要求,往往是放在本科四年級進行。如何激發(fā)本科四年級學(xué)生在考研,找工作等繁雜事務(wù)中的學(xué)習(xí)興趣,從而更好地掌握數(shù)據(jù)挖掘的相關(guān)技術(shù)是本課程面臨的主要挑戰(zhàn),也是所有本科進階課程所面臨的難題之一。
1數(shù)據(jù)挖掘等進階課程所面臨的問題
1.1進階課程知識體系的綜合性
進階課程由于其理論與技術(shù)的先進性,往往是學(xué)術(shù)研究的前沿,工業(yè)應(yīng)用的熱點,是綜合多方面知識的課程。以數(shù)據(jù)挖掘課程為例,其中包括數(shù)據(jù)庫、機器學(xué)習(xí)、模式識別、統(tǒng)計、可視化、高性能技術(shù),算法等多方面的知識內(nèi)容。雖然學(xué)生在前期的本科學(xué)習(xí)中已經(jīng)掌握了部分相關(guān)內(nèi)容,如數(shù)據(jù)庫、統(tǒng)計、算法等,但對于其他內(nèi)容如機器學(xué)習(xí)、人工智能、模式識別、可視化等,有的是與數(shù)據(jù)挖掘課程同時開設(shè)的進階課程,有的已經(jīng)是研究生的教學(xué)內(nèi)容。對于進階課程繁雜的知識體系,應(yīng)該如何把握廣度和深度的關(guān)系尤為重要。
1.2進階課程的教學(xué)的目的要求
進階課程的知識體系的綜合性體現(xiàn)在知識點過多、技術(shù)特征復(fù)雜。從教學(xué)效益的角度出發(fā),進階課程的教學(xué)目的是在有限的課時內(nèi)最大化學(xué)生的知識收獲。從教學(xué)結(jié)果的可測度出發(fā),進階課程的教學(xué)需要能夠有效驗證學(xué)生掌握重點知識的學(xué)習(xí)成果。1.3本科高年級學(xué)生的實際情況本科高年級學(xué)生需要處理考研復(fù)習(xí),找工作等繁雜事務(wù),往往對于剩余本科階段的學(xué)習(xí)不重視,存在得過且過的心態(tài)。進階課程往往是專業(yè)選修課程,部分學(xué)分已經(jīng)修滿的學(xué)生往往放棄這部分課程的學(xué)習(xí),一來沒有時間,二來怕拖累學(xué)分。
2數(shù)據(jù)挖掘等進階課程的具體教學(xué)方法
進階課程的教學(xué)理念是在有限的課時內(nèi),盡可能地提高課程的廣度,增加介紹性內(nèi)容,在授課中著重講解1~2個關(guān)鍵技術(shù),如在數(shù)據(jù)挖掘課程中,著重講解分類中的決策樹算法,聚類中的K-Means算法等復(fù)雜度一般,應(yīng)用廣泛的重要知識點,并利用實踐來檢驗學(xué)習(xí)成果。
2.1進階課程的課堂教學(xué)
數(shù)據(jù)挖掘等進階課程所涉及的知識點眾多,在課堂上則采用演示和講授相結(jié)合的方法,對大部分知識點做廣度介紹,而對需要重點掌握知識點具體講授,結(jié)合實踐案例及板書。在介紹工業(yè)實踐案例的過程中,對于具體數(shù)據(jù)挖掘任務(wù)的來龍去脈解釋清楚,尤其是對于問題的歸納,數(shù)據(jù)的處理,算法的選擇等步驟,并在不同的知識點的教學(xué)中重復(fù)介紹和總結(jié)數(shù)據(jù)挖掘的一般性流程,可以加深學(xué)生對于數(shù)據(jù)挖掘的深入理解。對于一些需要記憶的知識點,在課堂上采用隨機問答的方式,必要的時候可以在每堂課的開始重復(fù)提問,提高學(xué)習(xí)的效果。
2.2進階課程的課后教學(xué)
對于由于時間限制無法在課上深入討論的知識點,只能依靠學(xué)生在課后自學(xué)掌握。本科高年級學(xué)生的課后自學(xué)的動力不像低年級學(xué)生那么充足,可以布置需要動手實踐并涵蓋相關(guān)知識點的課后實踐,但盡量降低作業(yè)的工程量。鼓勵學(xué)生利用開源軟件和框架,基于提供的數(shù)據(jù)集,實際解決一些簡單的數(shù)據(jù)挖掘任務(wù),讓學(xué)生掌握相關(guān)算法技術(shù)的使用,并對算法有一定的了解。利用學(xué)院與大數(shù)據(jù)相關(guān)企業(yè)建立的合作關(guān)系,在課后通過參觀,了解大數(shù)據(jù)技術(shù)在當前企業(yè)實踐中是如何應(yīng)用的,激發(fā)學(xué)生的學(xué)習(xí)興趣。
2.3進階課程的教學(xué)效果考察進階課程的考察不宜采取考試的形式,可以采用大作業(yè)的形式。從具體的數(shù)據(jù)挖掘?qū)嵺`中檢驗教學(xué)的成果,力求是學(xué)生在上完本課程后可以解決一些簡單的數(shù)據(jù)挖掘任務(wù),將較復(fù)雜的數(shù)據(jù)挖掘技術(shù)的學(xué)習(xí)留給學(xué)生自己。
3結(jié)語
數(shù)據(jù)挖掘是來源于實踐的科學(xué),學(xué)習(xí)完本課程的學(xué)生需要真正理解,掌握相關(guān)的數(shù)據(jù)挖掘技術(shù),并能夠在實際數(shù)據(jù)挖掘任務(wù)中應(yīng)用相關(guān)算法解決問題。這也對教師的教學(xué)水平提出了挑戰(zhàn),并直接與教師的科研水平相關(guān)。在具體的教學(xué)過程中,發(fā)現(xiàn)往往是在講授實際科研中遇到的問題時,學(xué)生的興趣較大,對于書本上的例子則反映一般。進階課程在注重教學(xué)方法的基礎(chǔ)上,對于教師的科研水平提出了新的要求,這也是對于教師科研的反哺,使教學(xué)過程變成了教學(xué)相長的過程。
參考文獻:
[1]孫宇,梁俊斌,鐘淑瑛.面向工程的《數(shù)據(jù)挖掘》課程教學(xué)方法探討[J].現(xiàn)代計算機,2014(13).[2]蔣盛益,李霞,鄭琪.研究性學(xué)習(xí)和研究性教學(xué)的實證研究———以數(shù)據(jù)挖掘課程為例[J].計算機教育,2014(24).[3]張曉芳,王芬,黃曉.國內(nèi)外大數(shù)據(jù)課程體系與專業(yè)建設(shè)調(diào)查研究[C].2ndInternationalConferenceonEducation,ManagementandSocialScience(ICEMSS2014),2014.[4]郝潔.《無線傳感器網(wǎng)絡(luò)》課程特點、挑戰(zhàn)和解決方案[J].現(xiàn)代計算機,2016(35).[5]王永紅.計算機類專業(yè)剖析中課程分析探討[J].現(xiàn)代計算機,2011(04).