第一篇:2015屆畢業(yè)設(shè)計(jì)(論文)
日照職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)(論文)
php許愿墻系統(tǒng)
學(xué)生姓名
院 部
電子信息科學(xué)與工程學(xué)院 專 業(yè) 計(jì)算機(jī)應(yīng)用技術(shù) 指導(dǎo)老師
日 期 2015-05-19
目錄
一 許愿墻簡介..........................................................................................................................................4 二 許愿墻設(shè)計(jì)原理..................................................................................................................................4 三 四 五 PHP技術(shù)介紹...................................................................................................................................4 PHP技術(shù)優(yōu)點(diǎn)...................................................................................................................................4 MYSQL介紹......................................................................................................................................6
六 許愿墻系統(tǒng)的概要設(shè)計(jì)......................................................................................................................6(一)系統(tǒng)開發(fā)環(huán)境...............................................................................................................................6(二)php語言選擇...............................................................................................................................6(三)系統(tǒng)功能.......................................................................................................................................7 七 許愿墻詳細(xì)設(shè)計(jì)..................................................................................................................................7(一)數(shù)據(jù)庫設(shè)計(jì)...................................................................................................................................7(二)許愿墻數(shù)據(jù)庫連接 寫入和保存..................................................................................................8(三)許愿墻文件夾中文件的介紹.....................................................................................................13(四)許愿墻首頁設(shè)計(jì).........................................................................................................................13 八 總結(jié)....................................................................................................................................................15 九 許愿墻特色和不足............................................................................................................................15 參考文獻(xiàn):................................................................................................................................................15
第1頁
許愿墻系統(tǒng)
摘要:隨著Internet的發(fā)展,網(wǎng)站的作用越來越重要,被稱之為繼廣播、報(bào)紙、雜志、電視后的
第五種媒體——數(shù)字媒體,擁有眾多優(yōu)勢,所以現(xiàn)在不少企業(yè)都有或正在建設(shè)自己的網(wǎng)站。而許愿墻作為網(wǎng)站重要的一個部分,從來就是一個大家交流的平臺!許愿墻是一種最為簡單的BBS應(yīng)用,借助許愿墻,瀏覽者可以張貼留言的方式給站長、版主或其他瀏覽者進(jìn)行留言和提問。
本文主要介紹許愿墻系統(tǒng)的設(shè)計(jì)思路和制作過程,從許愿墻的重要性開始,介紹我的留言版采用的PHP技術(shù)和MYSQL數(shù)據(jù)庫,進(jìn)而闡述整個許愿墻系統(tǒng)的制作過程和具體的設(shè)計(jì)思路。該許愿墻較全面地利用PHP技術(shù)實(shí)現(xiàn)許愿墻的基本功能:留言、回復(fù)、刪除,并增加了一些特色功能。最后介紹自己在設(shè)計(jì)過程的心得體會。關(guān)鍵詞:許愿墻,PHP,MYSOL數(shù)據(jù)庫
第2頁
引言
Internet起源于20世紀(jì)60年代末、70年代初,當(dāng)時,美國國防部為了將充斥于軍事基地內(nèi)各種廠商的電腦主機(jī)互連,讓它們可以進(jìn)行數(shù)據(jù)交換以便研究工作順利進(jìn)行,于是成立了ARPA網(wǎng)絡(luò)計(jì)劃。ARPA計(jì)劃嘗試建設(shè)1個網(wǎng)絡(luò)系統(tǒng),它可將各種不同廠商的電腦連接起來。隨著這個計(jì)劃的成功,各學(xué)術(shù)單位,研究機(jī)構(gòu)也紛紛與ARPA計(jì)劃所建立的ARPANet連接。到了20世紀(jì)80年代,Internet這個名詞因勢產(chǎn)生,它代表著這10年來所構(gòu)建涵蓋全球各地的網(wǎng)絡(luò)系統(tǒng)。從1990年起,商業(yè)使用的Internet在美國急速地?cái)U(kuò)大,而Internet也從原來屬于少數(shù)人使用的網(wǎng)絡(luò)系統(tǒng)轉(zhuǎn)變?yōu)槠胀ò傩找材軌蚴褂玫木W(wǎng)絡(luò)系統(tǒng)。
最初的Internet資源服務(wù)都還停留在文本模式,1989年,量子物理實(shí)驗(yàn)室(CERN)下的1個研究小組著手開發(fā)1種全新的Internet服務(wù),它可以在網(wǎng)絡(luò)上傳送圖片、文本、影像、聲音等多媒體數(shù)據(jù)。于是由Tim Berners Lee領(lǐng)導(dǎo)的小組開發(fā)出了1種主從、分布式的網(wǎng)絡(luò)服務(wù)系統(tǒng),這就是004km.cnpile編譯或鏈接程序,可在服務(wù)器端直接執(zhí)行,這無疑是更加方便了我們的編寫過程。
2、使用編程環(huán)境方便簡單??梢允褂闷胀ǖ挠浭卤局惖奈谋揪庉嬈?,即可進(jìn)行編輯設(shè)計(jì),如:Windows的記事本、FrontPage等文本編輯器。也可以用dreamweaver和專業(yè)的Microsoft Visual InterDev開發(fā)工具。
3、瀏覽網(wǎng)頁方便,交互速度也快。PHP是運(yùn)行在服務(wù)器端,所以我們無須擔(dān)心瀏覽器是否支持PHP所使用的編程語言,用戶端只要使用可執(zhí)行HTML碼的瀏覽器,即可瀏覽Personal home pages所設(shè)計(jì)的網(wǎng)頁內(nèi)容。PHP在服務(wù)器端運(yùn)行,當(dāng)程序執(zhí)行完畢后,服務(wù)器僅將執(zhí)行的結(jié)果返回給客戶瀏覽器,這樣也就減輕了客戶端瀏覽器的負(fù)擔(dān),大大提高了交互的速度。
4、提供多種編程語言。PHP能與任何ActiveX scripting語言相容。除了可用VBScript或JScript語言來設(shè)計(jì)外,還通過plug-in的方式,使用由第三方所提供的其他腳本語言,譬如Perl等。
5、提高代碼的安全性。Personal home pages的程序代碼隱藏,已編碼的腳本在運(yùn)行時由腳本引擎解碼,因此不需要單獨(dú)的應(yīng)用程序??蛻舳松蟽H可以看到由PHP輸出的動態(tài)HTML文件。因而可以避免所寫的源程序被他人剽竊,也提高了程序的安全性。
6、功能強(qiáng)大。編程是面向?qū)ο蟮模∣bject oriented),并可擴(kuò)展ActiveX Server組件功能。Personal home page Components(ActiveX服務(wù)器組件)具有無限可擴(kuò)充性。你可以使用任何編程語言來編寫你所需要的Personal Server 組件。可以使用Visual Basic、Java、Visual C++、COBOL等編程語言來編寫你所需要的Personal Server Component。也可以使用第三方組件或自己開發(fā)的Personal Server組件。理論上說,可以實(shí)現(xiàn)任何功能。
7、訪問數(shù)據(jù)庫十分方便。可以通過PDO(Personal Data Objects,微軟的一種新的數(shù)據(jù)訪問模型,是一種可以提供WEB頁面開發(fā)者輕松存取Internet的數(shù)據(jù)庫,并可以在用戶端實(shí)現(xiàn)網(wǎng)上立即、即時更新顯示的最新WEB頁面數(shù)據(jù)庫技術(shù)。)非常方便地訪問數(shù)據(jù)庫。
總之,PHP從字面上說,包含三方面含義: 1.Personal:PHP使用了微軟的Personal技術(shù)。Personal(COM)技術(shù)是現(xiàn)在Microsoft軟件的重要基礎(chǔ)。它采用封裝對象,程序調(diào)用對象的技術(shù),簡化編程,加強(qiáng)程序間合作。PHP本身封裝了一些基本組件和常用組件,有很多公司也開發(fā)了很多實(shí)用組件。只要你可以在服務(wù)器上安裝這些組件,通過訪問組件,你就可以快速、簡易地建立自己的WEB應(yīng)用。
2.home:PHP運(yùn)行在服務(wù)器端。這樣就不必?fù)?dān)心瀏覽器是否支持PHP所使用的編程語言。PHP的編程語言可以是VBSCRIPT和JSCRIPT。VBSCRIPT是VB的一個簡集,會VB的人可以很方便的快速上手。然而NETscape瀏覽器不支持客戶端的VBSCRIPT,所以最好不要在客戶端使用VBSCRIPT。而在服務(wù)器端,則無需考慮瀏覽器的支持問題。NETscape瀏覽器也可以正常顯示PHP頁面。
3.page:PHP返回標(biāo)準(zhǔn)的HTML頁面,可以正常地在常用的瀏覽器中顯示。瀏覽者查看頁面源文件時,看到的是PHP生成的HTML代碼,而不是PHP程序代碼。這樣就可以防止別人抄襲程序。由此可以看出,PHP是在IIS下開發(fā)WEB應(yīng)用的一種簡單、方便的編程工具。在了解了VBSCRIPT的基本語法后,只需要清楚各個組件的用途、屬性、方法,就可以輕松編寫出自己的PHP系統(tǒng)。
第5頁
而我這次所開發(fā)的留言本系統(tǒng),主要是利用PHP技術(shù)的簡單和實(shí)用的特點(diǎn),以及PHP使用的廣泛性,而且非常適合于網(wǎng)絡(luò)中小型系統(tǒng)開發(fā)。
五 MYSQL介紹
MySQL是一個小型關(guān)系型數(shù)據(jù)庫管理系統(tǒng),開發(fā)者為瑞典MySQL AB公司。在2008 年1月16號被Sun公司收購。而2009年,SUN又被Oracle收購.對于Mysql的前途,沒有任何人抱樂觀的態(tài)度.目前MySQL被廣泛地應(yīng)用在Internet上的中小型網(wǎng)站中。由于其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點(diǎn),許多中小型網(wǎng)站為了降低網(wǎng)站總體擁有成本而選擇了MySQL作為網(wǎng)站數(shù)據(jù)庫。
1.使用C和C++編寫,并使用了多種編譯器進(jìn)行測試,保證源代碼的可移植性 2.支持AIX、FreeBSD、HP-UX、Linux、Mac OS、Novell Netware、OpenBSD、OS/2 Wrap、Solaris、Windows等多種操作系統(tǒng)
3.為多種編程語言提供了API。這些編程語言包括C、C++、Python、Java、Perl、PHP、Eiffel、Ruby和Tcl等。
4.支持多線程,充分利用CPU資源
5.優(yōu)化的SQL查詢算法,有效地提高查詢速度
6.既能夠作為一個單獨(dú)的應(yīng)用程序應(yīng)用在客戶端服務(wù)器網(wǎng)絡(luò)環(huán)境中,也能夠作為一個庫而嵌入到其他的軟件中提供多語言支持,常見的編碼如中文的GB 2312、BIG5,日文的Shift_JIS等都可以用作數(shù)據(jù)表名和數(shù)據(jù)列名
7.提供TCP/IP、ODBC和JDBC等多種數(shù)據(jù)庫連接途徑 8.提供用于管理、檢查、優(yōu)化數(shù)據(jù)庫操作的管理工具 9.可以處理擁有上千萬條記錄的大型數(shù)據(jù)庫
六 許愿墻系統(tǒng)的概要設(shè)計(jì)
(一)系統(tǒng)開發(fā)環(huán)境
基于微軟平臺PHP環(huán)境,使用MYSQL數(shù)據(jù)庫。適用于IE4.0以上版本瀏覽器,Win2000+APACHE 或winxp+APACHE以上運(yùn)行環(huán)境。(本人用的winxp+APACHE測試)。
(二)php語言選擇
選擇一個好的編程語言十分的重要,當(dāng)前,面對眾多的編程語言,很多人無從選擇,而本人看到PHP的以上眾多特點(diǎn),個人認(rèn)為:
MYSQL后臺數(shù)據(jù)庫+PHP服務(wù)器端程序+客戶端IE瀏覽器,是一個精練實(shí)用高效的組合模式。在這種使用模式中,PHP程序無疑是最重要的,是溝通客戶端和后臺數(shù)據(jù)庫之間的橋梁。在PHP程序中,通過數(shù)據(jù)庫語言,建立對MYSQL數(shù)據(jù)庫的連接,是客戶能夠訪問后
第6頁
臺數(shù)據(jù)庫的前提。
鑒于前面介紹PHP優(yōu)點(diǎn)的原因,又有上面組合的優(yōu)勢,本人的許愿墻使用PHP語言也是十分正確而實(shí)用的。
(三)系統(tǒng)功能
該許愿墻具有的主要功能如下:
1.可以按照發(fā)言時間的先后順序,許愿墻自動排序; 2.許愿墻的主要欄目組成圖
3.本許愿墻不需注冊,陌生人即可留言。
七 許愿墻詳細(xì)設(shè)計(jì)
有了技術(shù)和流程圖以及許愿墻要實(shí)現(xiàn)的功能,接下來就應(yīng)該進(jìn)行詳細(xì)設(shè)計(jì)了。數(shù)據(jù)庫是首當(dāng)其沖的,接下來就是用戶常接觸的首頁的設(shè)計(jì),然后就是該許愿墻特色功能的設(shè)計(jì)和實(shí)現(xiàn)。
(一)數(shù)據(jù)庫設(shè)計(jì)
我的數(shù)據(jù)庫采用的是MY SQL數(shù)據(jù)庫,采用的原因也已經(jīng)介紹了。以下就介紹許愿墻數(shù)據(jù)庫的組成。
第7頁
(二)許愿墻數(shù)據(jù)庫連接 寫入和保存
數(shù)據(jù)庫鏈接失敗!
”;
exit();} mysql_select_db(“gbook”, $con);mysql_query(“set names 'gb2312'”);date_default_timezone_set(PRC);?>
$sessSavePath = LOVE_ROOT.“data/sessions/”;if(is_writeable($sessSavePath)&& is_readable($sessSavePath)){ session_save_path($sessSavePath);} date_default_timezone_set(Singapore);$timestamp = time();require_once LOVE_ROOT.'./data/config.inc.php';require_once LOVE_ROOT.'./data/db.inc.php';require_once LOVE_ROOT.'./include/db_mysql.class.php';require_once LOVE_ROOT.'./include/template.class.php';if(defined('UC_KG')){include_once TM_ROOT.'/uc_client/client.php';} $PHP_SELF = $_SERVER['PHP_SELF'] ? $_SERVER['PHP_SELF'] : $_SERVER['SCRIPT_NAME'];
第8頁
$SCRIPT_FILENAME = str_replace('', '/',($_SERVER['PATH_TRANSLATED'] $_SERVER['PATH_TRANSLATED'] : $_SERVER['SCRIPT_FILENAME']));//$homeurl = 'http://'.$_SERVER['HTTP_HOST'].preg_replace(“//+(api|archiver|wap)?/*$/i”, substr($PHP_SELF, 0, strrpos($PHP_SELF, '/'))).'/';
? '', //實(shí)例化數(shù)據(jù)庫操作 $db = new dbstuff;$db->connect($dbhost, $dbuser, $dbpw, $dbname, $pconnect);unset($dbhost, $dbuser, $dbpw, $dbname, $pconnect);$db->query(“set names gbk”);if(getenv('HTTP_CLIENT_IP')&& strcasecmp(getenv('HTTP_CLIENT_IP'), 'unknown')){ $onlineip = getenv('HTTP_CLIENT_IP');} elseif(getenv('HTTP_X_FORWARDED_FOR')&& strcasecmp(getenv('HTTP_X_FORWARDED_FOR'), 'unknown')){ $onlineip = getenv('HTTP_X_FORWARDED_FOR');} elseif(getenv('REMOTE_ADDR')&& strcasecmp(getenv('REMOTE_ADDR'), 'unknown')){ $onlineip = getenv('REMOTE_ADDR');} elseif(isset($_SERVER['REMOTE_ADDR'])&& $_SERVER['REMOTE_ADDR'] && strcasecmp($_SERVER['REMOTE_ADDR'], 'unknown')){ $onlineip = $_SERVER['REMOTE_ADDR'];}
preg_match(“/[d.]{7,15}/”, $onlineip, $onlineipmatches);$onlineip = $onlineipmatches[0] ? $onlineipmatches[0] : 'unknown';unset($onlineipmatches);?>
var $dbhost;var $dbuser;var $dbpw;var $dbcharset;var $pconnect;var $tablepre;var $time;
var $goneaway = 5;
function connect($dbhost, $dbuser, $dbpw, $dbname = '', $dbcharset = '', $pconnect = 0, $tablepre='', $time = 0){
$this->dbhost = $dbhost;
第9頁
$this->dbuser = $dbuser;
$this->dbpw = $dbpw;
$this->dbname = $dbname;
$this->dbcharset = $dbcharset;
$this->pconnect = $pconnect;
$this->tablepre = $tablepre;
$this->time = $time;
if($pconnect){
if(!$this->link = mysql_pconnect($dbhost, $dbuser, $dbpw)){
$this->halt('Can not connect to MySQL server');
}
} else {
if(!$this->link = mysql_connect($dbhost, $dbuser, $dbpw)){
$this->halt('Can not connect to MySQL server');
}
}
if($this->version()> '4.1'){
if($dbcharset){
mysql_query(“SET character_set_connection=”.$dbcharset.“, character_set_results=”.$dbcharset.“, character_set_client=binary”, $this->link);
}
if($this->version()> '5.0.1'){
mysql_query(“SET sql_mode=''”, $this->link);
}
}
if($dbname){
mysql_select_db($dbname, $this->link);
}
}
function fetch_array($query, $result_type = MYSQL_ASSOC){
return mysql_fetch_array($query, $result_type);}
function result_first($sql){
$query = $this->query($sql);
return $this->result($query, 0);}
第10頁
function fetch_first($sql){
$query = $this->query($sql);
return $this->fetch_array($query);} function fetch_row($query){
$query = mysql_fetch_row($query);
return $query;} function fetch_fields($query){
return mysql_fetch_field($query);} function fetch_rows($sql){
$result = $this->query($sql);
$arr = array();
while($row = $this->fetch_array($result))
{
$arr[] = $row;
}
$this->free_result($result);
return $arr;} function fetch_one($sql){
$rs = $this->query($sql);
$arr = $this->fetch_array($rs,MYSQL_NUM);
$this->free_result($rs);
return $arr[0];} function fetch_all($sql, $id = ''){
$arr = array();
$query = $this->query($sql);
while($data = $this->fetch_array($query)){
$id ? $arr[$data[$id]] = $data : $arr[] = $data;
}
return $arr;}
function cache_gc(){
$this->query(“DELETE FROM {$this->tablepre}sqlcaches WHERE expiry<$this->time”);}
function query($sql, $type = '', $cachetime = FALSE){ $func = $type == 'UNBUFFERED' && @function_exists('mysql_unbuffered_query')第11頁
?
'mysql_unbuffered_query' : 'mysql_query';
if(!($query = $func($sql, $this->link))&& $type!= 'SILENT'){
$this->halt('MySQL Query Error', $sql);
}
$this->querynum++;
$this->histories[] = $sql;
return $query;}
function affected_rows(){
return mysql_affected_rows($this->link);}
function error(){
return(($this->link)? mysql_error($this->link): mysql_error());}
function errno(){
return intval(($this->link)? mysql_errno($this->link): mysql_errno());}
function result($query, $row){
$query = @mysql_result($query, $row);
return $query;}
function num_rows($query){
$query = mysql_num_rows($query);
return $query;}
function num_fields($query){
return mysql_num_fields($query);}
function free_result($query){
return mysql_free_result($query);}
function insert_id(){
return($id = mysql_insert_id($this->link))>= 0 ? $id : $this->result($this->query(“SELECT last_insert_id()”), 0);}
第12頁
function version(){
return mysql_get_server_info($this->link);}
function close(){
return mysql_close($this->link);}
function halt($message = '', $sql = ''){
$error = mysql_error();
$errorno = mysql_errno();
if($errorno == 2006 && $this->goneaway--> 0){
$this->connect($this->dbhost, $this->dbuser, $this->dbpw, $this->dbname, $this->dbcharset, $this->pconnect, $this->tablepre, $this->time);
$this->query($sql);
} else {
$s = 'Error:'.$error.'
';
$s.= 'Errno:'.$errorno.'
';
$s.= 'SQL::'.$sql;
exit($s);
} } } ?>
(三)許愿墻文件夾中文件的介紹
有了數(shù)據(jù)庫,就應(yīng)該設(shè)計(jì)許愿墻的各個頁面。本許愿墻由6個文件夾,11個文件組成,簡單介紹各文件的作用:
index.PHP:許愿墻主頁,主要功能是查看許愿,任何人都可以查看許愿信息。add.php添加愿望。footer.php頁面尾部。head.php 頁面頭部。list.php列表頁面
message.htm首頁留言貼樣式
db_mysql.class.php.許愿墻與數(shù)據(jù)庫的連接的文件。Css.css:本網(wǎng)站的樣式控制。
(四)許愿墻首頁設(shè)計(jì)
我許愿墻的首頁文件index.PHP,功能主要是為訪客留下相關(guān)的信息,并進(jìn)行留言。
第13頁
界面相對簡單,但功能很實(shí)用!許愿墻的基本功能實(shí)現(xiàn)具體如下:
圖7.1許愿首頁
圖7.2添加愿望
第14頁
圖7.3愿望列表
結(jié)束語:通過上面的介紹,相信對該許愿墻整體的構(gòu)建和各項(xiàng)功能都有了一定的認(rèn)識,最重要的是學(xué)會了許愿墻的設(shè)計(jì)以及類似網(wǎng)絡(luò)的編程,更對實(shí)際操作和具體設(shè)計(jì)流程有了清晰的認(rèn)識。該許愿墻實(shí)現(xiàn)了基本功能,并具有自己的特色,例如屏蔽關(guān)鍵字和防灌水功能。由于該許愿墻功能實(shí)用,而且界面友好,特別適合于中小型網(wǎng)站使用。對于剛剛接觸網(wǎng)絡(luò)編程人員的信心和興趣也會有很大提高。
八 總結(jié)
通過本次畢業(yè)設(shè)計(jì),我學(xué)到了很多東西,例如:編程規(guī)范,PHP技術(shù)等。這次畢業(yè)設(shè)計(jì)是對我大學(xué)三年所學(xué)知識的一次綜合應(yīng)用,讓我認(rèn)識到了自己的不足,并不斷的加強(qiáng)改進(jìn)。在系統(tǒng)不斷的完善改進(jìn)中,我學(xué)到了很多新的知識,也懂得了很多。這使我對自己的未來充滿了信心。
九 許愿墻特色和不足
特色:任何人都可以許愿,任何人都可以看到。無需注冊和登錄,完全開放。不足:沒有添加管理員功能,對后臺的管理功能較弱。
參考文獻(xiàn):
1.《PHP語言,進(jìn)階和高級應(yīng)用》 龍浩等編著 清華大學(xué)出版社
第15頁
2.《PHP & MYSQL Web數(shù)據(jù)庫應(yīng)用開發(fā)指南》 Hugh E.Williams等著 謝君英 歐陽宇譯2003年5月
3.《php程序設(shè)計(jì)》 Programming PHP 中國電力出版社 2003年7月 4.《phpmysql數(shù)據(jù)庫開發(fā)指南》焦桐順著 電子工業(yè)出版社 2001年9月 5.《php4交互網(wǎng)頁數(shù)據(jù)庫實(shí)戰(zhàn)手冊》清華大學(xué)出版社 2004年7月
第16頁
第二篇:zdh2014屆畢業(yè)生畢業(yè)設(shè)計(jì)(論文)答辯安排
自動化工程系
2014屆畢業(yè)生畢業(yè)設(shè)計(jì)(論文)答辯安排
為進(jìn)一步做好2014屆畢業(yè)設(shè)計(jì)(論文)的答辯工作,保證畢業(yè)設(shè)計(jì)答辯規(guī)范、有序進(jìn)行,我系在5月6日成立了2014屆畢業(yè)設(shè)計(jì)(論文)答辯委員會,計(jì)劃答辯時間安排在6月3日-6月8日進(jìn)行,具體情況如下:
1、答辯委員會名單
主任:宋黎
副主任:楊斌、周光萬
成員:李自成、幸晉渝、李興紅、唐克巖、王洋、易雪峰 秘書:李春花
2、答辯教師分組情況
(一)機(jī)械教研室分組
(1)組長:唐克巖秘書:王俊飛
成員:謝欣然、張建平、戢敏、彭宗峰
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生70人答辯教室:1403
(2)組長:鄭才國秘書:駱靜
成員:宋黎、周立華、向渝、殷俊文、張聆玲
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生69人答辯教室:1402
(3)組長:王振玉秘書:曠江明
成員:吳敦?fù)P、汪超臺、鄭菲、趙春雨
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生69人答辯教室:1221
(二)材料教研室分組
(1)組長:周光萬秘書:尹小燕
成員:高紅蓮、楊瑜珂、譚安平
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生62人答辯教室:1204
(2)組長:程精濤秘書:劉克威
成員:張伯奮、曹鳳紅、胡開元
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生61人答辯教室:1108
(三)電氣教研室分組:
(1)組長:李自成秘書:許麗
成員:廖犬發(fā)、汪厚新、雷永鋒
6.3-6.7早上:8:30-12:00下午:14:30-17:50答辨學(xué)生52人答辯教室:1419
(2)組長:孫莉莉秘書:趙熹
成員:王安、王笑宇、向茜
6.3-6.7 早上:8:30-12:00下午:14:30-17:50答辨學(xué)生51人答辯教室:1504
(四)自動化教研室分組:
(1)組長:王洋秘書:楊明
成員:楊斌、幸晉渝、孫抒雨、朱里紅、高炳義、韓冰
6.3-6.8早上:8:30-12:00下午:14:30-17:50答辨學(xué)生83人答辯教室:8104
(五)測控教研室分組:
(1)組長:李興紅秘書:王軍
成員:史麗華、閆智武、周熊、謝斌、崔崴
6.3-6.7早上:8:30-12:00下午:14:10-17:50答辨學(xué)生58人答辯教室:8404
(六)工業(yè)設(shè)計(jì)教研室分組:
(1)組長:易雪峰秘書:楊波
成員:王慶蓮、呂中意、聶鑫鑫
6.3-6.6早上:8:30-12:00下午:14:30-17:50答辨學(xué)生39人答辯教室:11063、答辯流程:
我系原則上實(shí)行“交叉答辯,指導(dǎo)教師回避制”,各答辯小組認(rèn)真組織安排答辯工作,嚴(yán)格答辯標(biāo)準(zhǔn),規(guī)范答辯程序。答辯時,學(xué)生先簡述畢業(yè)設(shè)計(jì)概況,重點(diǎn)介紹設(shè)計(jì)思路、特色和創(chuàng)新之處,時間控制在15分鐘左右;之后由答辯小組教師就設(shè)計(jì)情況提問(不少于3個問題),學(xué)生回答,時間控制在15分鐘左右。答辯小組成員根據(jù)學(xué)生稱述和答辯情況進(jìn)行評議、打分,答辯秘書按照要求填寫“答辯記錄表”,答辯小組組長和答辯主席簽字。
4、論文資料整理、成績匯總:
答辯當(dāng)天指導(dǎo)教師將畢業(yè)論文提交給答辯小組秘書,提交的論文要求是內(nèi)容填寫完整和資料齊全的,一旦提交將不再退還(如答辯時提出有修改意見的,指導(dǎo)教師應(yīng)督促學(xué)生及時修改并提交)。答辯結(jié)束后,答辯秘書仔細(xì)檢查論文檔案袋、封面和評語是否填寫完整,檔案袋中資料是否齊全,如發(fā)現(xiàn)問題,通知指導(dǎo)教師完善,待論文成績統(tǒng)計(jì)好后,于6月21日前將論文檔案袋交系教務(wù)辦,并同時提交電子版的畢業(yè)論文。
自動化工程系2014-5-7
第三篇:中北大學(xué)XXXX屆畢業(yè)生優(yōu)秀畢業(yè)設(shè)計(jì)(論文)摘要
中北大學(xué)XXXX屆畢業(yè)生優(yōu)秀畢業(yè)設(shè)計(jì)(論文)摘要
╳╳╳╳╳╳╳╳╳╳題目、小3號黑體、居中
╳╳╳╳學(xué)院╳╳╳╳專業(yè)╳╳╳╳班4號楷體、居中
指導(dǎo)教師:╳╳╳4號楷體、居中
1. 前言標(biāo)題:小4號黑體
2. 2.1 ╳╳╳╳╳╳
╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳————正文小4號宋體。
2.1.1 ╳╳╳╳╳╳
2.1.2 ╳╳╳╳╳╳
┅┅┅┅┅┅┅┅┅┅
2.2 ╳╳╳╳╳╳
╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳╳。
┅┅┅┅┅┅┅┅┅┅
3.2 ╳╳╳╳╳╳。
┅┅┅┅┅┅┅┅┅┅
如有插圖,按“圖
1、圖2??”格式編輯。
要求:1.用Word編輯
2.A4紙
3.頁面設(shè)置:
上:2.5cm
下: 2.0cm
左:2.0cm
右:2.0cm
頁眉:2.0cm[內(nèi)容:“中北大學(xué)XXXX屆畢業(yè)生優(yōu)秀畢業(yè)設(shè)計(jì)(論文)摘要”(5號黑體)]
頁腳:1.5cm
4.插入頁碼:
位置:頁面底端(頁腳)
對齊方式:外側(cè)
第四篇:畢業(yè)設(shè)計(jì)(論文)
四川交通學(xué)院畢業(yè)設(shè)計(jì)(論文)目錄1 VI設(shè)計(jì)綜合概述....................11.1 VI的定義.......................1
1.2 VI基礎(chǔ)要素系統(tǒng)設(shè)計(jì)表....................1
1.3 VI應(yīng)用要素系統(tǒng)設(shè)計(jì)表.....................1
1.4 VI設(shè)計(jì)的基本原則.........................設(shè)計(jì)軟件介紹.........................32.1設(shè)計(jì)軟件介紹.....................43 設(shè)計(jì)基本的思路......................53.1 牛牛啤酒有限公司VI設(shè)計(jì)基本思路....................5
3.2 牛牛啤酒有限公司VI設(shè)計(jì)的詳細(xì)介紹................5啤酒行業(yè)的現(xiàn)狀....................17中國啤酒市場的現(xiàn)狀..........................20
5.1 總述.............................20
5.2 分述...............................20外國啤酒對于我國啤酒市場的影響.....................23
參考文獻(xiàn)...........................26
致謝............................27
四川交通學(xué)院畢業(yè)設(shè)計(jì)(論文)VI設(shè)計(jì)綜合概述
1.1 VI的定義
VI即(Visual Identity),通譯為視覺識別,是CIS系統(tǒng)中最具傳播力和感染力的層面。人們所感知的外部信息,有83%是通過視覺通道到達(dá)人們心智的。也就是說,視覺是人們接受外部信息的最重要和最主要的通道。企業(yè)形象的視覺識別,即是將CI的非可視內(nèi)容轉(zhuǎn)化為靜態(tài)的視覺識別符號,以無比豐富的多樣的應(yīng)用形式,在最為廣泛的層面上,進(jìn)行最直接的傳播。設(shè)計(jì)科學(xué)、實(shí)施有利的視覺識別,是傳播企業(yè)經(jīng)營理念、建立企業(yè)知名度、塑造企業(yè)形象的快速便捷之途。
1.2 VI基礎(chǔ)要素系統(tǒng)設(shè)計(jì)表
1.企業(yè)標(biāo)識
2.產(chǎn)品商標(biāo)
3.企業(yè)標(biāo)志釋義
4.標(biāo)志制圖法
5.標(biāo)志的使用規(guī)范
6.標(biāo)志的色彩規(guī)范
8.中文標(biāo)準(zhǔn)字
9.英文標(biāo)準(zhǔn)字
10.中文指定印刷字體
11.英文指定印刷字體
12.企業(yè)輔助色
13企業(yè)象征圖案
1.3 VI應(yīng)用要素系統(tǒng)設(shè)計(jì)表
1.待客用項(xiàng)目類:洽談會、會客廳、會議廳家具、煙灰缸、坐墊、招待餐飲具、客戶用文具。商品及包裝類商品包裝設(shè)計(jì)、包裝紙、包裝箱、包裝盒、各種包裝用的徽章、封套、封緘、粘貼商標(biāo)、膠帶、標(biāo)簽等。
2.符號類
公司名稱招牌、建筑物外觀、招牌、室外照明、霓虹燈、出入口指示、櫥窗展示、活 動式招牌、路標(biāo)、紀(jì)念性建筑、各種標(biāo)示牌、經(jīng)銷商用各類業(yè)務(wù)招牌、標(biāo)示。
3.帳票類
訂單、貨單、帳單、委托單、各類帳單、申請表、通知書、確認(rèn)信、契約書、支票、收據(jù)等。
4.文具類
專用信箋、便條、信封、文件紙、文件袋、介紹信等。
5.服裝類
男女職工工作服、制服、工作帽、領(lǐng)帶、領(lǐng)結(jié)、手帕、領(lǐng)帶別針、傘、手提袋
等。
6.印刷類
股票、報(bào)告書、公司一覽表、調(diào)查報(bào)告、自辦報(bào)刊、公司簡歷、概況、獎狀等。
7.大眾傳播類
報(bào)紙廣告、雜志廣告、電視廣告、廣播廣告、郵寄廣告等。
8.SP類
產(chǎn)品說明書、廣告?zhèn)鞑?、展示會布置、公關(guān)雜志、促銷宣傳物、視聽資料、季節(jié)問候卡、明信片、各種POP類。
9.交通類
業(yè)務(wù)用車、宣傳廣告用車、貨車、員工通勤車等外觀識別。
10.證件類
徽章、臂章、名片、識別證、公司旗幟。
1.4 VI設(shè)計(jì)的基本原則
VI的設(shè)計(jì)不是機(jī)械的符號操作,而是以MI為內(nèi)涵的生動表述。所以,VI設(shè)計(jì)應(yīng)多角度、全方位地反映企業(yè)的經(jīng)營理念。VI設(shè)計(jì)不是設(shè)計(jì)人員的異想天開而是要求具有較強(qiáng)的可實(shí)施性。如果在實(shí)施性上過于麻煩,或因成本昂貴而影響實(shí)施,再優(yōu)秀的VI
也會由于難以落實(shí)而成為空中樓閣、紙上談兵。
1.風(fēng)格的統(tǒng)一性原則
2.強(qiáng)化視覺沖擊的原則
3.強(qiáng)調(diào)人性化的原則
4.增強(qiáng)民族個性與尊重民族風(fēng)俗的原則
5.可實(shí)施性原則
6.符合審美規(guī)律的原則
7.嚴(yán)格管理的原則
VI系統(tǒng)千頭萬緒,因此,在積年累月的實(shí)施過程中,要充分注意各實(shí)施部門或人員的隨意性,嚴(yán)格按照VI手冊的規(guī)定執(zhí)行,保證不走樣。企業(yè)視覺識別系統(tǒng)中的基本要素與應(yīng)用要素的內(nèi)容、形式,需要根據(jù)企業(yè)經(jīng)營的內(nèi)容與服務(wù)的性質(zhì)來決定。其內(nèi)容、項(xiàng)目的多少,一
般說來,是與企業(yè)識別系統(tǒng)開發(fā)設(shè)計(jì)工程的大小和實(shí)施程度而成正比;其風(fēng)格與特色也與企業(yè)產(chǎn)品、經(jīng)營特色及企業(yè)識別系統(tǒng)在應(yīng)用中的展開程度而不同。另外,企業(yè)在實(shí)行視覺識別系統(tǒng)時,還應(yīng)考慮到企業(yè)費(fèi)用和時間的問題,逐步改善企業(yè)的設(shè)計(jì)并使之統(tǒng)一化。因此,視覺識別系統(tǒng)的實(shí)施、設(shè)計(jì),還應(yīng)該根據(jù)企業(yè)識別系統(tǒng)逐步實(shí)行,只有這樣,才能真正發(fā)揮視覺識別的功效。為了達(dá)成企業(yè)形象對外傳播的一致性與一貫性,應(yīng)該運(yùn)用統(tǒng)一設(shè)計(jì)和統(tǒng)一大眾傳播,用完美的視覺一體化設(shè)計(jì),將信息與認(rèn)識個性化、明晰化、有序化,把各種形式傳播媒體上的形象統(tǒng)一,創(chuàng)造能儲存與傳播的統(tǒng)一的企業(yè)理念與視覺形象,這樣能集中與強(qiáng)化企業(yè)形象,使信息傳播更為迅速有效,給社會大眾留下強(qiáng)烈的印象與影響力對企業(yè)識別的各種要素,從企業(yè)理念到視覺要素予以標(biāo)準(zhǔn)化,采同一的設(shè)計(jì),對外傳播均采同一的模式,并堅(jiān)持長期一貫的運(yùn)用,不輕易進(jìn)行變動。要設(shè)計(jì)的簡化:對設(shè)計(jì)內(nèi)容進(jìn)行提煉,使組織系統(tǒng)在滿足推廣需要前提下盡可能條理清晰,層次簡明,優(yōu)化系統(tǒng)結(jié)構(gòu)。如VI系統(tǒng)中,構(gòu)成元素的組合結(jié)構(gòu)必須化繁為簡,有利于標(biāo)準(zhǔn)的施行。設(shè)計(jì)軟件介紹
2.1設(shè)計(jì)軟件介紹
本組設(shè)計(jì)主要用了兩種平面設(shè)計(jì)軟件,是PhotoshopCS ILLUSTRATOR CS 這是款很經(jīng)典的平面設(shè)計(jì)軟件,在介紹我們的具體設(shè)計(jì)之前,首先向大家大致介紹一下它:
PhotoshopCS ILLUSTRATOR CS是Adobe公司開發(fā)的,它是一款集圖形設(shè)計(jì)、文字編輯和高品質(zhì)輸出于一體的矢量圖形軟件,可以保證所繪制的圖形任意地放大或是縮小而不影響其質(zhì)量。它被廣泛地應(yīng)用于海報(bào)、包裝和排版等平面廣告設(shè)計(jì)、網(wǎng)頁圖形制作和藝術(shù)效果的處理等諸多領(lǐng)域。該軟件具有圖形繪制、圖形優(yōu)化以及藝術(shù)處理等多方面的超強(qiáng)功能,能充分滿足設(shè)計(jì)者的實(shí)際工作需要。設(shè)計(jì)基本的思路
3.1 牛牛啤酒有限公司
VI設(shè)計(jì)基本思路我們這次是為一家啤酒有限公司做VI設(shè)計(jì)。首先,我們調(diào)查了各類啤酒公司的各種廣告、宣傳等涉及到VI方面的案例,然后又在網(wǎng)上搜索了大量關(guān)于啤酒行業(yè)VI設(shè)計(jì)中所牽涉到的知識、需求;在調(diào)查中積累了一定的經(jīng)驗(yàn)后,我們開始對這家公司的性質(zhì)進(jìn)行分析:這是一家以突出青春和活力為主的啤酒公司,而且根據(jù)現(xiàn)在的市場需要,又往往都會提到“價格”這個概念,那么,我們就決定圍繞著“青春”、“活力”“環(huán)?!薄ⅰ皟r格中等”這四個中心來思考設(shè)計(jì)方案;經(jīng)過討論,然后考慮到我們的消費(fèi)對象主要是中下水平家庭,基本這種情況,所以我們基本確定了標(biāo)志的設(shè)計(jì)方向:青春、活力、環(huán)保、價格中等。我分別設(shè)計(jì)了各種標(biāo)志,然后放在一塊進(jìn)行比較、討論,最后,經(jīng)過反復(fù)討論、修改,最后確定了“beer jjan”企業(yè)標(biāo)志確定下來以后,我們就開始了整個VIS的基礎(chǔ)系統(tǒng)和應(yīng)用系統(tǒng)部分的定義和設(shè)計(jì),以下就是我們最后設(shè)計(jì)出來的樣稿。
第五篇:畢業(yè)設(shè)計(jì)論文
一、綜述..........................................................................................................................2
一、信息檢索技術(shù).....................................................................................................2
1、信息檢索技術(shù)的發(fā)展.....................................................................................2
2、信息檢索技術(shù)的簡介.....................................................................................3
3、信息檢索技術(shù)的模型.....................................................................................5
一、綜述
一、信息檢索技術(shù)
由于以因特網(wǎng)為主體的信息高速公路的不斷普及和發(fā)展,信息技術(shù)已經(jīng)滲透到我們社會生活的各個角落,正以前所未有的速度和能力改變著我們的生活的工作方式,我們真正處于一個“信息爆炸”的時代。一方面,因特網(wǎng)上面蘊(yùn)含的海量信息遠(yuǎn)遠(yuǎn)超過人們的想象;另一方面,面對信息的汪洋大海,人們往往感到束手無策,無所適從,出現(xiàn)所謂的“信息過載”和“信息迷向”的現(xiàn)象。于是一個極富挑戰(zhàn)性的課題:如何幫助人們有效地選擇和利用所感興趣的信息,盡量剔除不相關(guān)的信息。同時保證人們在信息選擇方面的個人隱私權(quán)利?成為學(xué)術(shù)界和企業(yè)界所十分關(guān)注的焦點(diǎn)。
隨著在線文本的日益增多,其中包括新聞、電子雜志、電子郵件、技術(shù)報(bào)告、文檔以及網(wǎng)上圖書館。如此眾多的信息,僅僅依靠大腦來收集和整理所需要的信息顯然是不夠的。所以,自動收集和整理所需要的各類信息成為信息產(chǎn)業(yè)面臨新的挑戰(zhàn)和新的發(fā)展契機(jī)。根據(jù)不同的應(yīng)用背景和不同的使用目的,信息處理技術(shù)已經(jīng)演化信息檢索、信息過濾、信息分類、問題回答等方向。
由于目前網(wǎng)上信息的表現(xiàn)形式大多數(shù)為文本,而且文本也是廣大用戶所習(xí)慣接收的形式。因此我們在下面主要討論中文文本檢索和相關(guān)的評價方案。
1、信息檢索技術(shù)的發(fā)展
信息檢索(Information Retrieval)是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程。
信息檢索起源于圖書館的參考咨詢和文摘索引工作,從19世紀(jì)下半葉首先開始發(fā)展,至20世紀(jì)40年代,索引和檢索成已為圖書館獨(dú)立的工具和用戶服務(wù)項(xiàng)目。1945年,Vannevar Bush的論文《就像我們可能會想的??》第一次提出了設(shè)計(jì)自動的,在大規(guī)模的存儲數(shù)據(jù)中進(jìn)行查找的機(jī)器的構(gòu)想。這被認(rèn)為是現(xiàn)在信息檢索技術(shù)的開山之作。進(jìn)入50年代后,研究者們開始為逐步的實(shí)現(xiàn)這些設(shè)想而努力。在50年代中期,在利用電腦對文本數(shù)據(jù)進(jìn)行檢索的研究上,研究者取得了一些成果。其中最有代表性的是Luhn在IBM公司的工作,他提出了利用詞對文檔構(gòu)建索引并利用檢索與文檔中詞的匹配程度進(jìn)行檢索 的方法,這種方法就是目前常用的倒排文檔技術(shù)的雛形。
在著名的國際文本檢索會議(Text Retrieval Conference,TREC)上,有兩個最重 要的研究方向:Routing Task和Ad Hoc Task。其熱點(diǎn)問題包括從早期的文本檢索、文本過濾到當(dāng)前的問題回答。
文本信息檢索就是根據(jù)用戶提出的具體查詢,在大量相對穩(wěn)定的文本源中,檢索出符合用戶查詢條件的文本,并按其滿足查詢的程度排序列出。文本檢索技術(shù)的發(fā)展已經(jīng)有四十多年的歷史,取得了很大的成就,產(chǎn)生了大批實(shí)用的檢索系統(tǒng),積累了很多成熟的技術(shù)。
1992年,NIST(美國國家標(biāo)準(zhǔn)和技術(shù)研究所)與DARPA聯(lián)合贊助了每年一次的TREC,對于文本檢索和文本過濾和問題回答等專題傾注了極大的熱忱。
目前隨著因特網(wǎng)的迅速發(fā)展,需求的不斷增加,文本檢索以及相關(guān)技術(shù)方面取得了長足的進(jìn)展,成為信息產(chǎn)業(yè)新的增長點(diǎn)。
2、信息檢索技術(shù)的簡介
信息檢索系統(tǒng)流程大致如下圖所示:
總體上,系統(tǒng)可分為四個部分:數(shù)據(jù)預(yù)處理,索引生成,查詢處理,檢索。下面我們分別對各個部分采用的技術(shù)加以介紹。
1.數(shù)據(jù)預(yù)處理
目前檢索系統(tǒng)的主要數(shù)據(jù)來源是Web,格式包括網(wǎng)頁、WORD 文檔、PDF 文檔等,這些格式的數(shù)據(jù)除了正文內(nèi)容之外,還有大量的標(biāo)記信息,因此從多種格式的數(shù)據(jù)中提取正文和其他所需的信息就成為數(shù)據(jù)預(yù)處理的主要任務(wù)。此外,眾所周知,中文字符存在多種編碼,比如GB2312、BIG5、Unicode(CJK 區(qū)),而原始數(shù)據(jù)集往往包含多種編碼,因此要正確地檢索到結(jié)果必須進(jìn)行統(tǒng)一編碼轉(zhuǎn)換。研究者們對預(yù)處理部分要提取哪些信息并沒有共識,這與后續(xù)處理所需的信息密切相關(guān),一般來說,正文、錨文本和鏈接地址都是要提取出來的。
2.索引生成 對原始數(shù)據(jù)建索引是為了快速定位查詢詞所在的位置,為了達(dá)到這個目的,索引的結(jié)構(gòu)非常關(guān)鍵。目前主流的方法是以詞為單位構(gòu)造倒排文檔表,其結(jié)構(gòu)大致如下圖所示:
每個文檔都由一串詞組成,而用戶輸入的查詢條件通常是若干關(guān)鍵詞,因此如果預(yù)先記錄這些詞出現(xiàn)的位置,那么只要在索引文件中找到這些詞,也就找到了包含它們的文檔。為了進(jìn)一步提高查詢的速度,在組織索引時還可以采用一些更復(fù)雜的方法,比如B樹、TRIE 樹、哈希表等。這個階段還需要對預(yù)處理之后的文檔進(jìn)行詞法分析,這是因?yàn)楹芏嗾Z言的文本都不宜直接把正文中的字符串用于建立索引。例如,中文里的詞與詞之間不存在分隔符,因此必須先進(jìn)行分詞,而英文中的詞存在很多變形,比如“compute”就存在“computes”、“computing”、“computed”等多種變形,應(yīng)先進(jìn)行詞根還原。此外,有些詞雖然出現(xiàn)頻率很高,但對于查詢沒有任何幫助,比如“的”、“了”等,就無需放入索引,為此需要預(yù)備一個停用詞表(stop word list)對這類詞進(jìn)行過濾。
3.查詢處理
用戶輸入的查詢條件可以有多種形式,包括關(guān)鍵詞、布爾表達(dá)式、自然語言形式的描述語句甚至是文本,但如果把這些輸入僅當(dāng)作關(guān)鍵詞去檢索,顯然不能準(zhǔn)確把握用戶的真實(shí)信息需求。很多系統(tǒng)采用查詢擴(kuò)展來克服這一問題。各種語言中都會存在很多同義詞,比如查“計(jì)算機(jī)”的時候,包含“電腦”的結(jié)果也應(yīng)一并返回,這種情況通常會采用查詞典的方法解決。但完全基于詞典所能提供的信息有限,而且很多時候并不適宜簡單地以同義詞替換方法進(jìn)行擴(kuò)展,因此很多研究者還采用相關(guān)反饋、關(guān)聯(lián)矩陣等方法對查詢條件進(jìn)行深入挖掘。
4.檢索
最簡單的檢索系統(tǒng)只需要按照查詢詞之間的邏輯關(guān)系返回相應(yīng)的文檔就可以了,但這種做法顯然不能表達(dá)結(jié)果與查詢之間的深層關(guān)系。為了把最符合用戶需求的結(jié)果顯示在前面,還需要利用各種信息對結(jié)果進(jìn)行重排序。目前有兩大主流技術(shù)用于分析結(jié)果和查詢的相關(guān)性:鏈接分析和基于內(nèi)容的計(jì)算。許多研究者 發(fā)現(xiàn),WWW 上超鏈結(jié)構(gòu)是個非常豐富和重要的資源,如果能夠充分利用的話,可以極大地提高檢索結(jié)果的質(zhì)量?;谶@種鏈接分析的思想,Sergey Brin 和Larry Page 在1998 年提出了PageRank 算法,同年J.Kleinberg 提出了HITS 算法,其它一些學(xué)者也相繼提出了另外的鏈接分析算法,如SALSA,PHITS,Bayesian等算法。這些算法有的已經(jīng)在實(shí)際的系統(tǒng)中實(shí)現(xiàn)和使用,并且取得了良好的效果。而基于內(nèi)容的計(jì)算則沿用傳統(tǒng)的文本分類方法,多采用向量空間模型、概率模型等方法來逐一計(jì)算用戶查詢和結(jié)果的相似度(相關(guān)性)。兩者各有優(yōu)缺點(diǎn),而且恰好互補(bǔ)。鏈接分析充分利用了Web 上豐富的鏈接結(jié)構(gòu)信息,但它很少考慮網(wǎng)頁本身的內(nèi)容,而直觀上看,基于內(nèi)容的計(jì)算則較為深入地揭示了查詢和結(jié)果之間的語義關(guān)系,但忽略了不同網(wǎng)頁之間的指向關(guān)系,因此現(xiàn)在很多系統(tǒng)嘗試把兩者結(jié)合起來,以達(dá)到更好的性能。
3、信息檢索技術(shù)的模型
信息檢索模型可形式化地表示成為一個四元組< D, Q, F, R(qi,dj)>,D是一個文檔集合,Q是一個查詢集合,F(xiàn)是一個對文檔和查詢建模的框架,R(qi,dj)是一個排序函數(shù),它給查詢qi和文檔 dj 之間的相關(guān)度賦予一個排序值。3.1、布爾模型
所謂布爾檢索, 就是采用布爾代數(shù)的方法, 用布爾表達(dá)式表示用戶提問, 通過對文本標(biāo)識與用戶給出的檢索式進(jìn)行邏輯比較來檢索文本。設(shè)文本集D 中某一文本i, 該文本可表示為:Di =(t1 , t2, ?, tm),其中, t1 , t 2, ?, t m 為標(biāo)引詞, 用以反映i 的內(nèi)容。另設(shè)用戶某一檢索式如下:Qj =(t1 ∧ t 2)∨(t3 ∧(t4)).對于該檢索式, 系統(tǒng)響應(yīng)并輸出的一組文本應(yīng)為: 它們都含有標(biāo)引詞t1 和t2 , 或者含有標(biāo)引詞t 3, 但不含有標(biāo)引詞t 4。
布爾檢索具有簡單、易理解、易實(shí)現(xiàn)等優(yōu)點(diǎn), 故得到廣泛的應(yīng)用。1967年后, 布爾檢索模型正式被大型文獻(xiàn)檢索系統(tǒng)采用, 并漸成為各種商業(yè)性聯(lián)機(jī)檢索系統(tǒng)的標(biāo)準(zhǔn)檢索模式, 服務(wù)信息情報(bào)界30多年, 直到現(xiàn)在, 大多數(shù)商用檢索系統(tǒng)仍采用布爾檢索。盡管布爾檢索有著種種的優(yōu)點(diǎn), 但是它的缺點(diǎn)仍然是明顯的, 它存在的主要缺陷有以下幾點(diǎn)。
(1)布爾邏輯式的構(gòu)造不易全面反映用戶的需求。用標(biāo)引詞的簡單組配不能完全反映用戶的實(shí)際需要, 用戶需要那一方面內(nèi)容的文本, 需要到多大程度, 這是檢索式無法表達(dá)清楚的, 如對上述檢索式, t1 和t2 , 究竟用戶希望能得到更多地反映t1 內(nèi)容的文本還是反映t2 內(nèi)容的文本, 傳統(tǒng)的布爾檢索無法 5 解決此問題。
(2)匹配標(biāo)準(zhǔn)存在某些不合理的地方。例如, 在響應(yīng)某個用“∧”連接的檢索時, 系統(tǒng)把只含有其中一個或數(shù)個但非全部檢索詞的文本看作與那些根本不含有其中一個檢索詞的文本一樣差, 同樣加以排除;另一方面, 用響應(yīng)某個用“∨”連接的檢索式時, 系統(tǒng)都不能把含有所有這些檢索詞的文本看作比那些只含有其中一個檢索詞的文本更好一些。
(3)檢索結(jié)果不能按照用戶定義的重要性排序輸出。系統(tǒng)檢索輸出的文本中, 排在第一位的文本不一定是文本集中最適合用戶需要的文本, 用戶只能從頭到尾瀏覽才能知道輸出文本中那些更適合自己的需要。
針對于標(biāo)準(zhǔn)的布爾模型中文獻(xiàn)表達(dá)形式過于簡單、檢索條件過于嚴(yán)格而出現(xiàn)的問題,人們對其采取了擴(kuò)充和修改,提出了擴(kuò)展的布爾模型。如Salton 于1983年提出的一種所謂的擴(kuò)展布爾檢索模型, 它是將向量檢索模型與布爾檢索模型融為一體, 并克服了傳統(tǒng)希爾模型的一些缺陷, 下面我們用矢量的方法來討論布爾檢索。設(shè)文本集中每篇文本僅由兩個標(biāo)引詞t1 和t2 標(biāo)引, 并且t1、t2允許賦以權(quán)值, 其權(quán)值范圍為[ 0, 1] , 權(quán)值越接近1, 說明該詞越能反映文本的內(nèi)容, 反之, 越不能反映文本的內(nèi)容, 在Salton 模型中, 上述情形用平面坐標(biāo)系上某點(diǎn)代表某一文本和用戶給出的檢索式, 如圖:
圖中的橫、縱坐標(biāo)用t1、t2 表示, 其中A(0, 1)表示詞t1 權(quán)值為0, 詞t 2 權(quán)值為1 的文本, B(1, 0)表示詞t 1權(quán)值為1, 詞t 2 權(quán)值為0 的文本, C(1, 1)表示詞t
1、t 2 的權(quán)值均為1 的文本, 文本集D 中凡是可以用t
1、t 2 標(biāo)引的文本可以用四邊形OACB 中某一點(diǎn)表示, 同樣, 用戶給出檢索式后, 也可用四邊形OACB 中某一點(diǎn)表示。
下面我們來看看Salton 模型中是如何構(gòu)造相似度計(jì)算式的。對于由t1 和t2 構(gòu)成的檢索式q = t1 ∨ t2 , 在圖1中只有A、B、C 3點(diǎn)所代表的各文本才是最理想的文本, 對于某一文本D 來說, 當(dāng)D 點(diǎn)離A、B、C 3點(diǎn)越接近時說明相似度越大,或者說,當(dāng)D點(diǎn)離O點(diǎn)越遠(yuǎn)時,相似度越大。因而D與O的距離
DO =(d1?0)?(d2?0)22 =
d1?d222 可以作為我們衡量一文本與查詢q 的相關(guān)程度的一個尺度, 顯然0 ≤ 2 , 為了使相似度控制在0 與1 之間, 將相似度定義為:
d1?d222DO ≤
sim(D, Q(t1 ∨ t2))= 與C 的距離
DO(1)對于由t1 和t 2 構(gòu)成的查詢q = t1 ∧ t 2, 只有C 點(diǎn)才是最理想的文本, 用D =(1?d1)?(1?d2)22
作為我們衡量一文本與查詢q 的相關(guān)程度的一個尺度, 于是, 把相似度定義為:
(1?d1)?(1?d2)22sim(D, Q(t1 ∧ t2))= 1-(2)(1)、(2)式還可推廣到對檢索標(biāo)引詞進(jìn)行加權(quán)的情形, 設(shè)檢索標(biāo)引詞t1、t2 的權(quán)值分別為a, b,0 ≤ a, b ≤ 1, 則(1)式、(2)式可進(jìn)一步推廣為:
a(1?d1)?b(1?d2)2222sim(d, Q(t1 , a)∨(t2, b))= 1?
在文本信息檢索中, 布爾檢索不僅具有簡單、易理解等特點(diǎn), 而且易于在計(jì)算機(jī)中加以實(shí)現(xiàn), 是一種最為常用的檢索方法。擴(kuò)展的布爾模索模型——Salton 模型克服了傳統(tǒng)布爾模型的一些缺陷, 更符合了用戶的需要。
3.2、向量空間模型 向量空間模型是由Salton及其學(xué)生們在六十年代末到七十年代初提出并發(fā)展起來的。這一模型將給定的文本(文章、查詢或文章中的一段等)轉(zhuǎn)換成一個維數(shù)很高,由一系列關(guān)鍵詞組成的向量。模型并沒有規(guī)定關(guān)鍵詞如何定義,但是一般來說,關(guān)鍵詞可以是字,詞或者短語。假設(shè)我們用“詞”作為Term,那么在詞典中的每一個詞,都定義向量空間中的一維。如果一篇文檔包含這個詞,那么表示這個文檔的向量在這個詞所定義的維度上應(yīng)該擁有一個非0值。這個模型最大特點(diǎn)是可以方便地計(jì)算出任意兩個向量的近似程度,即向量所對應(yīng)的文本間的相似性。用信息檢索的術(shù)語來說,如果兩個向量是相近的,則其對應(yīng)的文本是語義相關(guān)的。將所有文獻(xiàn)和查詢以向量形式表示,則針對特定的查詢向量,比較它與所有文獻(xiàn)向量的相似度,并依相似度將文獻(xiàn)降序排列,這便是現(xiàn)代信息檢索系統(tǒng)中常用的方法。Salton及其學(xué)生們還根據(jù)向量空間模型實(shí)現(xiàn)了Smart系統(tǒng)。該系統(tǒng)在過去的30多年中,對信息檢索的研究有非常重要的影響。信息檢索的許多理論和技術(shù)(如自動索引、加權(quán)技術(shù)、相關(guān)反饋、文獻(xiàn)聚類等)都是在Smart上首先實(shí)現(xiàn)或測試的。
假設(shè)表示文檔向量,而
表示查詢向量,文檔與查詢的相關(guān)性可以用余弦距離表示如下:
如果我們用進(jìn)行歸一化,即令和表示和中的第i維的值,并且對每個文檔矢量,那么上式有可以表示為
在此,究竟如何取值是一個重要的問題,其取值一般被稱為關(guān)鍵詞i在文檔D中的權(quán)重。
目前,對關(guān)鍵詞權(quán)重的確定方法一般都需要獲取一些關(guān)于關(guān)鍵詞的統(tǒng)計(jì)量,而后根據(jù)這些統(tǒng)計(jì)量,應(yīng)用某種認(rèn)為規(guī)定的計(jì)算公式來得到權(quán)重。最常用的統(tǒng)計(jì)量包括:
? ? ?
tf,Term Frequency的縮寫,表示某個關(guān)鍵詞在某個文檔中出現(xiàn)的頻率。
qtf,Query Term Frequency的縮寫。表示查詢中某關(guān)鍵詞的出現(xiàn)頻率。
N,集合中的文檔總數(shù) ? df,Document Frequency的縮寫,表示文檔集合中,出現(xiàn)某個關(guān)鍵詞的文檔個數(shù)。
? ? ? idf,Inversed Document Frequency的縮寫。dl,文檔長度 adl,平均文檔長度
權(quán)重的計(jì)算:
在向量空間模型下,構(gòu)造關(guān)鍵詞權(quán)重計(jì)算公式有三個基本原則:
1.如果一個關(guān)鍵詞在某個文檔中出現(xiàn)次數(shù)越多,那么這個詞應(yīng)該被認(rèn)為越重要。
2.如果一個關(guān)鍵詞在越多的文檔中出現(xiàn),那么這個詞區(qū)分文檔的作用就越低,于是其重要性也應(yīng)當(dāng)相應(yīng)降低。
3.一篇文檔越長,那么其出現(xiàn)某個關(guān)鍵詞的次數(shù)可能越高,而每個關(guān)鍵詞對這個文檔的區(qū)分作用也越低,相應(yīng)的應(yīng)該對這些關(guān)鍵詞予以一定的折扣。早期的權(quán)重往往直接采用tf,但是顯然這種權(quán)重并沒有考慮上述第二條原則,因此在大規(guī)模系統(tǒng)中是不適用的。目前,常用的關(guān)鍵詞權(quán)重計(jì)算公式大多基于tf和df進(jìn)行構(gòu)建,同時,一些較為復(fù)雜的計(jì)算公式也考慮了文檔長度。現(xiàn)簡要列舉如下:
TF-IDF得分。嚴(yán)格地說,TF/IDF得分并不特指某個計(jì)算公式,而是一個計(jì)算公式集合。其中TF與IDF都可以進(jìn)行各種變換,究竟何種變換較能符合實(shí)際需求,需要由實(shí)驗(yàn)和應(yīng)用來驗(yàn)證。常見的變換方法有:
其中,最后一個公式,即:
被大量系統(tǒng)證明是最有效的。
此外,較為常用的關(guān)鍵詞權(quán)重算法還包括Okapi權(quán)重和Pivoted Normalization 權(quán)重(PNW)。這些公式綜合考慮了查詢和文檔中的詞頻,以及文檔的長度。Okapi權(quán)重需要預(yù)設(shè)三個參數(shù):
? ? ? k1,在1.0-2.0之間 b,通常為0.75 k3,在0-1000之間 而PNW則需要預(yù)設(shè)一個參數(shù)s,大部分情況下取0.20。
在經(jīng)典模型中,假設(shè)索引項(xiàng)是獨(dú)立的,或者說是正交的。這個假設(shè)極大地簡化了索引項(xiàng)權(quán)值的計(jì)算過程,盡管這一假設(shè)有時不符合自然語言的實(shí)際情況,但是在這個假設(shè)下,計(jì)算權(quán)值的過程簡單快捷,因而在目前很多實(shí)用的信息檢索模型中仍被廣泛采用。向量空間模型中索引項(xiàng)權(quán)重的算法提高了檢索的性能,改進(jìn)了檢索效果,同時采用了部分匹配的策略和一定的相似度計(jì)算方法,使得模型可以根據(jù)結(jié)果文檔與檢索項(xiàng)的相似度進(jìn)行排序,檢索出與用戶查詢要求接近的文檔,從而有效地控制返回文檔的數(shù)量和質(zhì)量,檢索的結(jié)果文檔集更接近用戶的檢索需求。但是事實(shí)上,在自然語言中,有些索引項(xiàng)是相互關(guān)聯(lián)的,比如當(dāng)在一個文檔中看到“計(jì)算機(jī)”時,就非常有可能同時看到“科學(xué)”;而當(dāng)在一個文檔中看到“土豆”時,看到“計(jì)算機(jī)”的可能性就很小。再比如:“王勵勤”“乒乓球”的出現(xiàn)不是獨(dú)立的。同時,該模型丟失了句法信息(如短語結(jié)構(gòu)、詞的順序等),而權(quán)重的計(jì)算需要利用整個文檔集合的信息。
3.3、概率模型
由于信息檢索中文本信息的相關(guān)判斷的不確定性和查詢信息表示的模糊性,導(dǎo)致了人們用概率的方法解決這方面的問題。Maron和Kuhns在1960年提出了第一概率檢索模型;1976年Robertson和Sparck Jones等在此基礎(chǔ)上進(jìn)行改進(jìn)提出了第二概率檢索模型;之后,Turtle、Fuhr和Roberston又提出了統(tǒng)一化模型,即第三概率檢索模型,提高了文檔的排序精度。
信息檢索的概率模型基于概率排序原則:對于給定的用戶查詢Q,對所有文本計(jì)算概率,并從大到小進(jìn)行排序,概率公式為:P(R|D,Q)。其中,R表示文本D與用戶查詢Q相關(guān)。另外,用R’表示文本D與用戶查詢Q不相關(guān),有:
P(R|D,Q)+ P(R’|D,Q)= 1,也就是用二值形式判斷相關(guān)性。把文本用特征向量表示:x =(x1,x2,???,xn)。其中,N為特征項(xiàng)的個數(shù),xi為0或者1,分別表示特征相i在文本中出現(xiàn)或不出現(xiàn)。
在信息檢索中,估計(jì)參數(shù)是困難的,一般地并不直接地計(jì)算P,而是把計(jì)算P(R|di,qk)換為計(jì)算P(R|x,qk),這樣處理略去了公式中與文本無關(guān)的特征項(xiàng),計(jì)算的結(jié)果可能與實(shí)際不符。為了容易計(jì)算,現(xiàn)在假設(shè)包括相同特征項(xiàng)的文本,經(jīng)過計(jì)算后,它們的可能性是相同的。將所有文本按相關(guān)概率P進(jìn)行排序,等價于所有文本按特征向量排序。一個文本D的概率相關(guān)性的計(jì)算為: