第一篇:大數(shù)據(jù)工程實(shí)驗(yàn)室申報(bào)書
大數(shù)據(jù)工程實(shí)驗(yàn)室申請書
1.工程實(shí)驗(yàn)室擬突破的技術(shù)方向
大數(shù)據(jù)工程實(shí)驗(yàn)室擬突破的技術(shù)方向?yàn)椋篟語言與Hadoop分布式計(jì)算平臺交互技術(shù)。
R語言是一種自由免費(fèi)軟件編程語言與操作環(huán)境,主要用于統(tǒng)計(jì)分析、繪圖、數(shù)據(jù)挖掘。R本來是由來自新西蘭奧克蘭大學(xué)的Ross Ihaka和Robert Gentleman開發(fā)(也因此稱為R),現(xiàn)在由“R開發(fā)核心團(tuán)隊(duì)”負(fù)責(zé)開發(fā)。R的源代碼可自由下載使用,可在多種平臺下運(yùn)行,包括UNIX,Linux,Windows和MacOS。R主要是以命令行操作為主,同時(shí)支持GUI的圖形用戶界面。R內(nèi)建多種統(tǒng)計(jì)學(xué)及數(shù)字分析功能,R比其他統(tǒng)計(jì)學(xué)或數(shù)學(xué)專用的編程語言有更強(qiáng)的物件導(dǎo)向功能。R的另一強(qiáng)項(xiàng)是繪圖功能,制圖具有印刷的素質(zhì),也可加入數(shù)學(xué)符號。雖然R主要用于統(tǒng)計(jì)分析或者開發(fā)統(tǒng)計(jì)相關(guān)的軟體,但也有人用作矩陣計(jì)算。其分析速度可媲美GNU Octave甚至商業(yè)軟件MATLAB。CRAN為Comprehensive R Archive Network的簡稱,它除了收藏了R的執(zhí)行檔下載版、源代碼和說明文件,也收錄了各種用戶撰寫的軟件包。全球有超過一百個(gè)CRAN鏡像站,上萬個(gè)第三方的軟件包。R的行業(yè)應(yīng)用非常廣泛,例如:統(tǒng)計(jì)分析,應(yīng)用數(shù)學(xué),計(jì)量經(jīng)濟(jì),金融分析,財(cái)經(jīng)分析,人文科學(xué),數(shù)據(jù)挖掘,人工智能,生物信息學(xué),生物制藥,全球地理科學(xué),數(shù)據(jù)可視化。
Hadoop是一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu),由Apache基金會(huì)開發(fā)。用戶可以在不了解分布式底層細(xì)節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力高速運(yùn)算和存儲(chǔ)。Hadoop實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有著高容錯(cuò)性的特點(diǎn),并且設(shè)計(jì)用來部署在低廉的硬件上。而且它提供高傳輸率來訪問應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集的應(yīng)用程序。HDFS放寬了可移植操作系統(tǒng)接口的要求,這樣可以以流的形式訪問文件系統(tǒng)中的數(shù)據(jù)。自2006年,Hadoop以MapReduce和HDFS獨(dú)立發(fā)展開始,到今年2013年不過7年時(shí)間,Hadoop的家族已經(jīng)孵化出多個(gè)Apache的頂級項(xiàng)目。特別是最近1-2年,發(fā)展速度越來越快,并且融入了很多新技術(shù)(YARN, Hcatalog, Oozie, Cassandra)。
Hadoop家族的強(qiáng)大之處,在于對大數(shù)據(jù)的處理,讓原來的不可能(TB,PB數(shù)據(jù)量計(jì)算)成為了可能。R語言的強(qiáng)大之處,在于統(tǒng)計(jì)分析,在沒有Hadoop之前,我們對于大數(shù)據(jù)的處理,要取樣本,假設(shè)檢驗(yàn),做回歸,長久以來R語言都是統(tǒng)計(jì)學(xué)家專屬的工具。所以,hadoop重點(diǎn)是全量數(shù)據(jù)分析,而R語言重點(diǎn)是樣本數(shù)據(jù)分析。兩種技術(shù)放在一起,恰好是取長補(bǔ)短。以計(jì)算機(jī)開發(fā)人員的思路,所有事情都用Hadoop去做,沒有數(shù)據(jù)建模和證明,“預(yù)測的結(jié)果”一定是有問題的;以統(tǒng)計(jì)人員的思路,所有的事情都用R去做,以抽樣方式,得到的“預(yù)測的結(jié)果”也一定是有問題的。所以R語言與Hadoop的結(jié)合,是產(chǎn)界業(yè)的必然的導(dǎo)向,也是產(chǎn)界業(yè)和學(xué)術(shù)界的交集,同時(shí)也為交叉學(xué)科的人才提供了無限廣闊的想象空間。
目前,通常有兩種方法將R語言與大數(shù)據(jù)處理平臺相結(jié)合使用。第一種方法是,在Hadoop上用MapReduce處理PB、TB量級的數(shù)據(jù),縮小數(shù)據(jù)容量到GB量級,然后將其加載到R中進(jìn)行處理。在R中,GB級別的數(shù)據(jù)可以利用MPI并行處理框架構(gòu)建的集群計(jì)算。R包Rmpi、snow、snowfall都可以實(shí)現(xiàn)多種MPI支持的并行編程模式。第二種方法是,直接使用支持Hadoop的R包,在R中操作存放在HDFS中的數(shù)據(jù),并利用R語言完成MapReduce算法,用來替代Java的MapReduce實(shí)現(xiàn)。R包Rhadoop使得R語言具有處理高達(dá)TB甚至PB級的大數(shù)據(jù)的能力。在GitHub社區(qū)可以找到該項(xiàng)目與開源實(shí)現(xiàn)代碼。Rhadoop包含有三個(gè)包,分別是rhdfs,rmr以及rHBase,分別對應(yīng)Hadoop系統(tǒng)架構(gòu)中的HDFS, MapReduce和Hbase三個(gè)部分。除了Rhadoop之外,還有從R中進(jìn)行Hive查詢的Rhive包,能夠直接從Hive中進(jìn)行查詢。將R和結(jié)合起來,其既能夠利用分布式計(jì)算打破數(shù)據(jù)量的限制,又能夠利用R中的眾多優(yōu)秀的免費(fèi)擴(kuò)展包,快速實(shí)現(xiàn)所需的數(shù)據(jù)處理分析。
綜上所述,R語言與Hadoop的交互使用技術(shù)就成了本項(xiàng)目急需突破的技術(shù)方向。
2.工程實(shí)驗(yàn)室的主要功能與任務(wù) 大數(shù)據(jù)工程實(shí)驗(yàn)室的主要功能如下:
(1)為統(tǒng)計(jì)學(xué)學(xué)科與大數(shù)據(jù)有關(guān)的課程教學(xué)提供支持。統(tǒng)計(jì)學(xué)專業(yè)的就業(yè)前景非常廣闊。整個(gè)世界已經(jīng)迎來了大數(shù)據(jù)時(shí)代,就業(yè)市場對熟悉并且能夠分析大數(shù)據(jù)的應(yīng)用型人才思賢若渴,所以對《大數(shù)據(jù)挖掘》等與大數(shù)據(jù)相關(guān)的課程的理論學(xué)習(xí)和實(shí)踐操作顯得尤為重要。一個(gè)功能齊全、技術(shù)先進(jìn)的大數(shù)據(jù)工程實(shí)驗(yàn)室將對大數(shù)據(jù)的學(xué)習(xí)者提供一個(gè)良好的實(shí)踐環(huán)境,為學(xué)習(xí)者將來從事大數(shù)據(jù)處理做好充足的準(zhǔn)備。
(2)為統(tǒng)計(jì)學(xué)學(xué)科大數(shù)據(jù)相關(guān)科研課題的研究提供支撐。在保證完成學(xué)校教學(xué)任務(wù)的前提下,大數(shù)據(jù)工程實(shí)驗(yàn)室打算面向?qū)W校及社會(huì)開放,為大數(shù)據(jù)相關(guān)科研課題研究提供支持。為大數(shù)據(jù)的相關(guān)科研課題的研究提供大量、詳實(shí)的數(shù)據(jù)。為大數(shù)據(jù)的相關(guān)科研課題的研究提供數(shù)據(jù)處理與分析工具。
(3)在一定程度上為社會(huì)提供相關(guān)服務(wù)??梢詾樯鐣?huì)有關(guān)單位和個(gè)人提供大數(shù)據(jù)的采集、準(zhǔn)備、存儲(chǔ)、分析與挖掘以及大數(shù)據(jù)的展示與可視化等一系列服務(wù)??梢赃M(jìn)行大數(shù)據(jù)分析與挖掘的設(shè)計(jì)、開發(fā)、培訓(xùn),真正實(shí)現(xiàn)產(chǎn)、學(xué)、研的有機(jī)結(jié)合。
工程實(shí)驗(yàn)室的任務(wù)如下:
(1)培養(yǎng)統(tǒng)計(jì)學(xué)學(xué)科學(xué)生對大數(shù)據(jù)的分析與挖掘能力,尤其培養(yǎng)學(xué)生面對復(fù)雜大數(shù)據(jù)時(shí)分析與挖掘方法的創(chuàng)新。
(2)以實(shí)驗(yàn)室為基地建立學(xué)術(shù)氛圍濃厚的大數(shù)據(jù)分析科研團(tuán)隊(duì)。提倡科研團(tuán)隊(duì)先根據(jù)數(shù)據(jù)特點(diǎn)構(gòu)建縝密的大數(shù)據(jù)分析模型,然后依托于功能齊全的大數(shù)據(jù)工程實(shí)驗(yàn)室對模型進(jìn)行實(shí)踐驗(yàn)證,繼而最終修正完善模型。(3)把自主研發(fā)的大數(shù)據(jù)分析與挖掘的技術(shù)應(yīng)用到企業(yè)中,通過我們對模型的預(yù)測和決策確保企業(yè)的最終決策能應(yīng)對日益增加的復(fù)雜性,跟上日益加快的步伐。3.工程實(shí)驗(yàn)室的近期和中期目標(biāo)
大數(shù)據(jù)工程實(shí)驗(yàn)室的近期目標(biāo)如下:
(1)建立先進(jìn)穩(wěn)定的Hadoop與R的交互平臺;
(2)組建具有行業(yè)領(lǐng)先水平,結(jié)構(gòu)合理的大數(shù)據(jù)分析與挖掘創(chuàng)新團(tuán)隊(duì)。力爭使該團(tuán)隊(duì)成員人人熟練掌握Hadoop與R的交互技術(shù),利用R語言對復(fù)雜大數(shù)據(jù)進(jìn)行建模最終用于預(yù)測和理論上的決策;
大數(shù)據(jù)工程實(shí)驗(yàn)室的中期目標(biāo)
(1)自主研制開發(fā)基于Hadoop與R交互平臺的大數(shù)據(jù)分析與挖掘技術(shù),尤其針對復(fù)雜數(shù)據(jù),例如基于物聯(lián)網(wǎng)和云計(jì)算的大數(shù)據(jù)。主要針對不同類型的復(fù)雜數(shù)據(jù),開發(fā)基于Rhadoop的R程序包,申請國家專利,繼而把R程序包上傳國際CRAN鏡像站,為大數(shù)據(jù)R程序的開發(fā)貢獻(xiàn)自己的力量;
(2)把項(xiàng)目團(tuán)隊(duì)的研究成果應(yīng)用到產(chǎn)品銷售、服務(wù)銷售等企業(yè)的商業(yè)預(yù)測和決策之中,構(gòu)建長期有效的產(chǎn)學(xué)研合作機(jī)制,成為提高企業(yè)競爭力和創(chuàng)新能力的支撐平臺。
第二篇:數(shù)據(jù)工程與知識工程教育部重點(diǎn)實(shí)驗(yàn)室.
數(shù)據(jù)工程與知識工程教育部重點(diǎn)實(shí)驗(yàn)室 2009開放基金課題申請指南
一、總則
根據(jù)“開放、聯(lián)合、流動(dòng)、競爭”的運(yùn)行機(jī)制,數(shù)據(jù)工程與知識工程教育部實(shí)驗(yàn)室熱忱歡迎和邀請各有關(guān)領(lǐng)域的國內(nèi)外科研人員來實(shí)驗(yàn)室進(jìn)行合作研究,共同推動(dòng)數(shù)據(jù)工程與知識工程的發(fā)展,促進(jìn)我國數(shù)據(jù)工程與知識工程研究和技術(shù)自主創(chuàng)新。
二、資助對象
具有中級職稱(助研、講師或工程師)以上,或具有博士學(xué)位并在科研機(jī)構(gòu)、高等院校中有一定工作經(jīng)驗(yàn)的科研、教學(xué)及技術(shù)人員。均可在《指南》規(guī)定的范圍內(nèi)提出資助申請。資助數(shù)量:不超過10個(gè)。其中,有2項(xiàng)為定向支持合作實(shí)驗(yàn)室。
三、申請程序
1、申請人根據(jù)實(shí)驗(yàn)室開放基金的主要資助方向填寫“重點(diǎn)實(shí)驗(yàn)室開放基金課題申請書”一式二份。經(jīng)所在單位主管領(lǐng)導(dǎo)同意后,向本實(shí)驗(yàn)室提出申請。開放基金申請截止日期2009年11月30日。
2、實(shí)驗(yàn)室將組織有關(guān)專家對提交的申請書進(jìn)行評審,由實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)確定資助項(xiàng)目和金額,網(wǎng)上公布,并通知獲得資助的申請人。
3、申請書可在網(wǎng)上下載(deke.ruc.edu.cn),也可打電話、發(fā)電子郵件索取。
四、資助范圍
圍繞實(shí)驗(yàn)室目前支持的下列研究方向開展基礎(chǔ)性或者應(yīng)用基礎(chǔ)性的研究。題目自定。方向一:數(shù)據(jù)工程,包括
高性能數(shù)據(jù)庫系統(tǒng)與數(shù)據(jù)庫新技術(shù) 數(shù)據(jù)永久存儲(chǔ)與恢復(fù)遷移技術(shù) 系統(tǒng)與信息安全
方向二:知識工程,包括
數(shù)據(jù)挖掘與知識發(fā)現(xiàn) 知識網(wǎng)格 知識管理
五、經(jīng)費(fèi)額度和使用范圍
每個(gè)開放課題資助金額不超過2萬元人民幣。經(jīng)費(fèi)使用參照國家科技經(jīng)費(fèi)管理辦法進(jìn)行,包括辦公費(fèi)、差旅費(fèi)、交通費(fèi)、會(huì)議費(fèi)、出版費(fèi)等,不支持設(shè)備購置。
資助經(jīng)費(fèi)不劃撥到獲得資助人員所在學(xué)校,采取報(bào)銷的方式支付。開放基金項(xiàng)目申請人應(yīng)完成至少1篇國內(nèi)學(xué)報(bào)級或以上的學(xué)術(shù)論文,或者重要的國際會(huì)議論文。論文應(yīng)標(biāo)注本重點(diǎn)實(shí)驗(yàn)室名稱和開放課題編號。另外,結(jié)項(xiàng)后一年內(nèi),需安排一次學(xué)術(shù)成果報(bào)告會(huì)。
六、聯(lián)系人
易謙
電話:62512304,Email: deke@ruc.edu.cn,地址:北京市海淀區(qū)中關(guān)村大街59號中國人民大學(xué)數(shù)據(jù)工程與知識工程重點(diǎn)實(shí)驗(yàn)室,郵編:100872 此外,有關(guān)基金管理的信息和通知,請見實(shí)驗(yàn)室網(wǎng)站:deke.ruc.edu.cn
第三篇:工業(yè)大數(shù)據(jù)應(yīng)用技術(shù)國家工程實(shí)驗(yàn)室揭牌
工業(yè)大數(shù)據(jù)應(yīng)用技術(shù)國家工程實(shí)驗(yàn)室揭牌
“以全球發(fā)布INDICS+CMSS為起點(diǎn),航天科工將與全球工業(yè)互聯(lián)網(wǎng)平臺企業(yè)開展廣泛深入的合作,并與云端用戶一起,鍥而不舍地努力打造具有中國特色的信息化時(shí)代制造業(yè)生態(tài)系統(tǒng)發(fā)育載體,為實(shí)現(xiàn)‘中國制造2025’目標(biāo),為促進(jìn)全球制造業(yè)在信息化時(shí)代的進(jìn)步與發(fā)展,做出航天科工應(yīng)有的貢獻(xiàn)?!?017年6月15日,中國航天科工集團(tuán)公司董事長高紅衛(wèi)在中國成都舉辦的工業(yè)互聯(lián)網(wǎng)高峰論壇上闡述了建設(shè)中國工業(yè)互聯(lián)網(wǎng)的決心。
據(jù)悉,此論壇由工業(yè)和信息化部、國家國防科技工業(yè)局、中國工程院、四川省人民政府、中國航天基金會(huì)、工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟指導(dǎo),成都市人民政府、四川省經(jīng)信委、四川省國防工辦、中國航天科工集團(tuán)公司主辦。論壇以“智·造價(jià)值,聯(lián)·創(chuàng)未來”為主題,活動(dòng)共吸引了包括工信部信軟司、國防科技工業(yè)局計(jì)劃司等相關(guān)部委領(lǐng)導(dǎo)、四川省政府領(lǐng)導(dǎo),國內(nèi)外工業(yè)互聯(lián)網(wǎng)領(lǐng)域?qū)<?、學(xué)者,優(yōu)秀企業(yè)相關(guān)負(fù)責(zé)人,中央及行業(yè)媒體記者等在內(nèi)的800余人參加了。活動(dòng)現(xiàn)場,與會(huì)嘉賓們聚焦工業(yè)互聯(lián)網(wǎng)發(fā)展現(xiàn)狀及趨勢,積極探討工業(yè)互聯(lián)網(wǎng)中國模式的實(shí)踐路徑,分享在智能制造及工業(yè)大數(shù)據(jù)領(lǐng)域的實(shí)踐經(jīng)驗(yàn)。論壇開幕式由航天科工副總經(jīng)理魏毅寅主持。航天科工董事長高紅衛(wèi)在致辭中闡述了建設(shè)我國工業(yè)互聯(lián)網(wǎng)的意義,他表示,信息革命正在大幅度提升工業(yè)社會(huì)的生產(chǎn)力水平,而信息經(jīng)濟(jì)的主要特點(diǎn)是協(xié)同共享。工業(yè)互聯(lián)網(wǎng)是集互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù)、人工智能技術(shù)、大數(shù)據(jù)采集與挖掘技術(shù)于一體的全球性工業(yè)創(chuàng)新載體。通過構(gòu)建制造業(yè)“信息互通、資源共享、能力協(xié)同、開放合作、互利共贏”的公共平臺,通過促進(jìn)云端企業(yè)智能制造、協(xié)同制造、云制造能力形成,可以最終實(shí)現(xiàn)“企業(yè)有組織,資源無邊界”的目標(biāo),從而適應(yīng)信息經(jīng)濟(jì)時(shí)代制造業(yè)轉(zhuǎn)型升級的需要。
對于航天科工建設(shè)了2年的工業(yè)互聯(lián)網(wǎng)平臺——航天云網(wǎng),董事長高紅衛(wèi)這樣闡述該平臺的建設(shè)理念:航天科工把工業(yè)互聯(lián)網(wǎng)作為構(gòu)建信息化時(shí)代制造業(yè)生態(tài)系統(tǒng)的載體來對待。除了要具備工業(yè)服務(wù)、物聯(lián)網(wǎng)、制造業(yè)的互聯(lián)網(wǎng)公共服務(wù)平臺等一些基本屬性以外,還要適應(yīng)工業(yè)化時(shí)代的“標(biāo)準(zhǔn)化設(shè)計(jì)、大規(guī)模制造、同質(zhì)化消費(fèi)”模式轉(zhuǎn)換為信息化時(shí)代的“定制化設(shè)計(jì)、單件小批量生產(chǎn)、個(gè)性化消費(fèi)”模式的需求。在開幕式中,航天科工重磅發(fā)布了工業(yè)互聯(lián)網(wǎng)云平臺——INDICS(Industrialintelligentcloudsystem)。
該平臺能夠提供涵蓋IaaS、DaaS、PaaS和SaaS的完整工業(yè)互聯(lián)網(wǎng)服務(wù)功能,適合不同層次、類型、規(guī)模的企業(yè);可支持各種工業(yè)設(shè)備接入、集成各類工業(yè)應(yīng)用服務(wù),構(gòu)建良性工業(yè)生態(tài)體系,使制造管理更加便捷高效;構(gòu)建了涵蓋設(shè)備安全、網(wǎng)絡(luò)安全、控制安全、應(yīng)用安全、數(shù)據(jù)安全和商業(yè)安全的工業(yè)互聯(lián)網(wǎng)完整安全保障體系。
會(huì)議中,中國工程院院士李伯虎、中國工程院院士倪光南、工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟秘書長余曉暉分別發(fā)表了專題報(bào)告。同時(shí),當(dāng)日下午的四大分論壇同步召開,分別涉足智能工廠、工業(yè)大數(shù)據(jù)、軍民融合、合作共贏四大主題。
此外,本次高峰論壇還進(jìn)行了四川省經(jīng)濟(jì)和信息化委員會(huì)和中國信息通信研究院戰(zhàn)略合作簽約儀式、四川軍民融合在線平臺上線儀式、工業(yè)大數(shù)據(jù)應(yīng)用技術(shù)國家工程實(shí)驗(yàn)室揭牌儀式和第一屆“航天云網(wǎng)”杯工業(yè)互聯(lián)網(wǎng)APP大賽頒獎(jiǎng)典禮。
第四篇:優(yōu)質(zhì)結(jié)構(gòu)工程申報(bào)書目錄
XX市優(yōu)質(zhì)結(jié)構(gòu)工程申報(bào)書
目錄
一、《XX優(yōu)質(zhì)結(jié)構(gòu)申請表》
二、XX市優(yōu)質(zhì)結(jié)構(gòu)工程檢查打分表
三、項(xiàng)目立項(xiàng)文件、中標(biāo)通知書、開工意見書
四、工程承包合同復(fù)印件
五、質(zhì)量目標(biāo)及質(zhì)量保證預(yù)控措施
六、基礎(chǔ)、主體工程質(zhì)量驗(yàn)收報(bào)告
七、工程文件質(zhì)量匯總表
八、結(jié)構(gòu)工程施工過程自評與圖像資料
第五篇:建設(shè)工程竣工驗(yàn)收申報(bào)書
建設(shè)工程竣工驗(yàn)收申報(bào)書
江蘇省建筑工程竣工驗(yàn)收報(bào)告書
工程名稱:泗洪縣臨淮鎮(zhèn)敬老院
建設(shè)單位:泗洪縣臨淮鎮(zhèn)人民政府
江 蘇 省 建 設(shè) 廳 制
質(zhì)量監(jiān)督單位:臨淮鎮(zhèn)城管環(huán)衛(wèi)服務(wù)中心
建設(shè)單位:泗洪縣臨淮鎮(zhèn)人民政府
項(xiàng)目法人(簽字蓋章):
(公章)
年月日
結(jié) 論 意 見
一、基 本 情 況
七、竣工驗(yàn)收時(shí)間、內(nèi)容和組織型式
八、需要補(bǔ)充說明的問題