第一篇:生物信息學(xué)在生物方面的應(yīng)用
生物信息學(xué)在生物方面的應(yīng)用生物信息學(xué)(bioinformaLics)是以核酸和蛋白質(zhì)等生物大分子數(shù)據(jù)庫及其相關(guān)的圖書、文獻(xiàn)、資料為主要對象,以數(shù)學(xué)、信息學(xué)、計算機(jī)科學(xué)為主要手段,對浩如煙海的原始數(shù)據(jù)和原始資料進(jìn)行存儲、管理、注釋、加工,使之成為具有明確生物意義的生物信息。并通過對生物信息的查詢、搜索、比較、分析,從中獲得基因的編碼、凋控、遺傳、突變等知識;研究核酸和蛋白質(zhì)等生物大分子的結(jié)構(gòu)、功能及其相互關(guān)系;研究它們在生物體內(nèi)的物質(zhì)代謝、能量轉(zhuǎn)移、信息傳導(dǎo)等生命活動中的作用機(jī)制。
從生物信息學(xué)研究的具體內(nèi)容上看,生物信息學(xué)可以用于序列分類、相似性搜索、DNA序列編碼區(qū)識別、分子結(jié)構(gòu)與功能預(yù)測、進(jìn)化過程的構(gòu)建等方面的計算工具已成為變態(tài)反應(yīng)研究工作的重要組成部分。針對核酸序列的分析就是在核酸序列中尋找過敏原基因,找出基因的位置和功能位點的位置,以及標(biāo)記已知的序列模式等過程。針對蛋白質(zhì)序列的分析,可以預(yù)測出蛋白質(zhì)的許多物理特性,包括等電點分子量、酶切特性、疏水性、電荷分布等以及蛋白質(zhì)二級結(jié)構(gòu)預(yù)測,三維結(jié)構(gòu)預(yù)測等。
生物信息學(xué)中的主要方法有:序列比對,結(jié)構(gòu)比對,蛋白質(zhì)結(jié)構(gòu)的預(yù)測,構(gòu)造分子進(jìn)化樹,聚類等。
基因芯片是基因表達(dá)譜數(shù)據(jù)的重要來源。目前生物信息學(xué)在基因芯片中的應(yīng)用主要體現(xiàn)在三個方面。
1、確定芯片檢測目標(biāo)。利用生物信息學(xué)方法,查詢生物分子信息數(shù)據(jù)庫,取得相應(yīng)的序列數(shù)據(jù),通過序列比對,找出特征序列,作為芯片設(shè)計的參照序列。
2、芯片設(shè)計。主要包括兩個方面,即探針的設(shè)計和探針在芯片上的布局,必須根據(jù)具體的芯片功能、芯片制備技術(shù)采用不同的設(shè)計方法。
3、實驗數(shù)據(jù)管理與分析。對基因芯片雜交圖像處理,給出實驗結(jié)果,并運用生物信息學(xué)方法對實驗進(jìn)行可靠性分析,得到基因序列變異結(jié)果或基因表達(dá)分析結(jié)果。盡可能將實驗結(jié)果及分析結(jié)果存放在數(shù)據(jù)庫中,將基因芯片數(shù)據(jù)與公共數(shù)據(jù)庫進(jìn)行鏈接,利用數(shù)據(jù)挖掘方法,揭示各種數(shù)據(jù)之間的關(guān)系。
生物信息學(xué)在人類基因組計劃中也具有重要的作用。
大規(guī)模測序是基因組研究的最基本任務(wù),它的每一個環(huán)節(jié)都與信息分析緊密相關(guān)。目前,從測序儀的光密度采樣與分析、堿基讀出、載體標(biāo)識與去除、拼接與組裝、填補(bǔ)序列間隙,到重復(fù)序列標(biāo)識、讀框預(yù)測和基因標(biāo)注的每一步都是緊密依賴基因組信息學(xué)的軟件和數(shù)據(jù)庫的。特別是拼接和填補(bǔ)序列間隙更需要把實驗設(shè)計和信息分析時刻聯(lián)系在一起.拼接與組裝中的難點是處理重復(fù)序列,這在含有約30%重復(fù)序列的人類基因組中顯得尤其突出。
人類基因組的工作草圖即將完成,因此發(fā)現(xiàn)新基因就成了當(dāng)務(wù)之急。使用基因組信息學(xué)的方法通過超大規(guī)模計算是發(fā)現(xiàn)新基因的重要手段,可以說大部分新基因是靠理論方法預(yù)測出來的。比如啤酒酵母完
整基因組(約1300萬bp)所包含6千多個基因,大約60%是通過信
息分析得到的。
當(dāng)人類基因找到之后,自然要解決的問題是:不同人種間基因有什么差別;正常人和病人基因又有什么差別。”這就是通常所說的SNPs(單核苷酸多態(tài)性)。構(gòu)建SNPs及其相關(guān)數(shù)據(jù)庫是基因組研究走向應(yīng)用的重要步驟。1998年國際已開展了以EST為主發(fā)現(xiàn)新Spps的研究。在我國開展中華民族SNPs研究也是至重要的。
總之,生物信息學(xué)不僅將賦予人們各種基礎(chǔ)研究的重要成果,也會帶來巨大的經(jīng)濟(jì)效益和社會效益。在未來的幾年中DNA序列數(shù)據(jù)將以意想不到的速度增長,這更離不開利用生物信息學(xué)進(jìn)行各類數(shù)據(jù)的分析和解釋,研制有效利用和管理數(shù)據(jù)新工具。
生物信息學(xué)在功能基因組學(xué)同樣具有重要的應(yīng)用 目前應(yīng)用最多的是同源序列比較、模式識別以及蛋白結(jié)構(gòu)預(yù)測。所謂同源序列,是指從某一共同祖先經(jīng)趨異進(jìn)化而形成的不同序列。利用數(shù)據(jù)庫搜索找出未知核酸或蛋白的同源序列,是序列分析的基礎(chǔ)[lol。如利用BLASTn和BLASTx兩種軟件分別進(jìn)行核苷酸和氨基酸序列同源性比較。同源性比較的結(jié)果大體可以分為如下幾種方式:與生化和生理功能均已知的基因具有同源性;雖與生化和生理功能均已知的基因具同源性,但對該基因功能的了解尚不深入,仍停留在表達(dá)水平~I:;與其它物種中生化和生理功能均未知的基因具同源性。同源性檢索分析方法為該DNA片段的功能提供了間接的證據(jù)。
揭示序列數(shù)據(jù)所隱含的生物學(xué)意義的另一重要方法是模式識別技術(shù)。顧名思義,模式別的基本思想是利用存在于蛋白質(zhì)序列或結(jié)構(gòu)中的某些特征模式識別相關(guān)蛋白質(zhì)的性質(zhì)。如果某一蛋白質(zhì)序列或結(jié)構(gòu)中的一部分具有保守性,種保守性或者與蛋白質(zhì)的生物活性有關(guān),或者與蛋白質(zhì)的折疊方式有關(guān);那么,這種特片模式可以用來識別該蛋白家族中的新成員。換句話說,如果將已知蛋白質(zhì)的特征序列模式和特征結(jié)構(gòu)模式
搜集起來,構(gòu)建成數(shù)據(jù)庫.則可以用來確定新測定的蛋白質(zhì)序列中是否具有某種特征模式,從而確定該未知蛋白屬于哪個蛋白質(zhì)家族。這在治療腎病問題上具有突破性進(jìn)展。
生物信息學(xué)剛剛起步,但歷史的經(jīng)驗告訴我們,未來它必將得到迅猛發(fā)展。生物學(xué)是生物信息學(xué)的核心和靈魂,數(shù)學(xué)與計算機(jī)技術(shù)則是它的基本工具。這一點必須著重指出。學(xué)習(xí)有關(guān)的生物學(xué)知識,開展多方面的生物信息學(xué)研究,逐漸使我國成為生物信息學(xué)研究強(qiáng)國。
第二篇:淺談生物信息學(xué)在生物學(xué)研究中的應(yīng)用
10生乙 尹竹10517109
淺談生物信息學(xué)在生物學(xué)研究中的應(yīng)用
生物信息學(xué)(Bioinformatics)是一門新興的、正在迅速發(fā)展的交叉學(xué)科,目前國內(nèi)外對生物信息學(xué)的定義眾說紛紜,沒有形成統(tǒng)一認(rèn)識。概括來說,現(xiàn)代生物信息學(xué)是以核酸和蛋白質(zhì)等生物大分子數(shù)據(jù)庫及其相關(guān)的圖書、文獻(xiàn)、資料為主要對象,以數(shù)學(xué)、信息學(xué)、計算機(jī)科學(xué)為主要手段,對浩如煙海的原始數(shù)據(jù)和原始資料進(jìn)行存儲、管理、注釋、加工,使之成為具有明確生物意義的生物信息。并通過對生物信息的查詢、搜索、比較、分析,從中獲得基因的編碼、凋控、遺傳、突變等知識;研究核酸和蛋白質(zhì)等生物大分子的結(jié)構(gòu)、功能及其相互關(guān)系;研究它們在生物體內(nèi)的物質(zhì)代謝、能量轉(zhuǎn)移、信息傳導(dǎo)等生命活動中的作用機(jī)制。
生物信息在生物學(xué)研究上的應(yīng)用主要包括在基因組學(xué)研究上的應(yīng)用和在蛋白質(zhì)組學(xué)研究中的應(yīng)用。
1.在基因組學(xué)研究中的應(yīng)用
基因組(genome)表示一個生物體所有的遺傳信息的總和。一個生物體基因所包含的信息決定了該生物體的生長、發(fā)育、繁殖和消亡等所有生命現(xiàn)象。有關(guān)基因組的研究稱為基因組學(xué)(Genomics),基因組學(xué)根據(jù)研究重點的不同分為序列基因組學(xué)(Sequence genomics)、結(jié)構(gòu)基因組學(xué)(Structural genomics)、功能基因組學(xué)(Functional genomics)與比較基因組學(xué)(Comparative genomics)。結(jié)構(gòu)基因組學(xué)的研究:結(jié)構(gòu)基因組學(xué)(Structural genomics)是基于基因組學(xué)的一個重要組成部分和研究領(lǐng)域,它是一門通過基因作圖、核苷酸序列分析確定基因組成、基因定位的科學(xué)口。生物信息學(xué)在結(jié)構(gòu)基因組學(xué)中的應(yīng)用主要在于:基因組作圖、核苷酸序列信息分析、基因定位、新基因的發(fā)現(xiàn)和鑒定等方面。比較基因組學(xué)的研究:借助生物信息學(xué)的手段對不同生物基因組的比較、分析,可以進(jìn)行生物進(jìn)化等方面的研究。
功能基因組學(xué)的研究:功能基因組學(xué)(Functional genomics)是指在全基因組序列測定的基礎(chǔ)上,從整體水平研究基因及其產(chǎn)物在不同時空、條件下的結(jié)構(gòu)與功能關(guān)系及活動規(guī)律的學(xué)科。功能基因組的研究是后基因組時代的關(guān)鍵點,它將借助生物信息學(xué)的技術(shù)平臺,利用先進(jìn)的基因表達(dá)技術(shù)及龐大的生物功能檢測體系,從浩瀚無垠的基因庫篩選并確知某一特定基因的功能,并通過比較分析基因及其表達(dá)的狀態(tài),確定出基因的功能內(nèi)涵,揭示生命奧秘,甚至開發(fā)出基因產(chǎn)品。
2.在蛋白質(zhì)組學(xué)的研究中的應(yīng)用
在20世紀(jì)中后期,隨著DNA雙螺旋結(jié)構(gòu)的提出和蛋白質(zhì)空間結(jié)構(gòu)的解析,生生命科學(xué)的研究進(jìn)入了分子生物學(xué)時代,而遺傳信息載體DNA和生命功能的體現(xiàn)者蛋白質(zhì)的研究,成為了其主要內(nèi)容。90年代初期啟動的龐大的人類基因組計劃,已經(jīng)取得巨大的成在20世紀(jì)中后期,隨著DNA雙螺旋結(jié)構(gòu)的提出和蛋白質(zhì)
空間結(jié)構(gòu)的解析,生生命科學(xué)的研就,人類基因組序列草圖繪制完成后,生命科學(xué)研究跨入了后基因組時代。然而,人們清醒地識到基因僅是遺傳信息的載體,而生命活動的執(zhí)行者是基因的表達(dá)產(chǎn)物—蛋白質(zhì),它是生命現(xiàn)象復(fù)雜性和多變性的直接體現(xiàn)者。
蛋白質(zhì)組一詞是澳大利亞學(xué)者馬克威爾金斯在1994年最先提出來的,它是指基因組表達(dá)的所有相應(yīng)的蛋白質(zhì),也可以說是指細(xì)胞或組織或機(jī)體全部蛋白質(zhì)的存在及其活動方式。蛋白質(zhì)組學(xué)是從整體的蛋白質(zhì)水平上,在一個更加深入、更加貼近生命本質(zhì)的層次上去探討和發(fā)現(xiàn)生命活動的規(guī)律和重要生理、病理現(xiàn)象的本質(zhì)等。蛋白質(zhì)組學(xué)的研究對揭示生命活動規(guī)律,探討重大疾病機(jī)制,疾病診斷和防治、新藥的開發(fā)提供重要的理論基礎(chǔ)。
生物信息學(xué)在蛋白質(zhì)組學(xué)中的蛋白質(zhì)數(shù)據(jù)庫的應(yīng)用
2.1蛋白質(zhì)組數(shù)據(jù)庫
蛋白質(zhì)組數(shù)據(jù)庫是蛋白質(zhì)組學(xué)研究的主要內(nèi)容之一。通過構(gòu)建不同環(huán)境條件下組織或細(xì)胞全部蛋白質(zhì)的數(shù)據(jù)庫來研究蛋白質(zhì)表達(dá)的差異情況。與其他數(shù)據(jù)庫相比, 目前大部分蛋白質(zhì)組數(shù)據(jù)庫都有以下幾個方面的特點:(1)由于蛋白質(zhì)相關(guān)數(shù)據(jù)的種類繁多,蛋白質(zhì)組數(shù)據(jù)庫的種類也多種多樣,如雙向電泳數(shù)據(jù)庫、基于蛋白序列的數(shù)據(jù)庫、蛋白質(zhì)一級或高級結(jié)構(gòu)數(shù)據(jù)庫、蛋白質(zhì)相互作用數(shù)據(jù)庫等等;(2)新速度快,網(wǎng)絡(luò)上的蛋白質(zhì)組數(shù)據(jù)庫的數(shù)據(jù)幾乎每天都在更新;(3)網(wǎng)共享程度高, 越來越多的數(shù)據(jù)庫資源與互聯(lián)網(wǎng)相互配合,使得蛋白質(zhì)相關(guān)數(shù)據(jù)的利用率空前的提高。蛋白質(zhì)組數(shù)據(jù)庫的主要內(nèi)容即集中在基于雙向電泳結(jié)果的數(shù)據(jù)庫和基于蛋白質(zhì)序列信息的數(shù)據(jù)庫。
2.1.1基于雙向電泳圖譜的數(shù)據(jù)庫
雙向電泳技術(shù)是蛋白質(zhì)組學(xué)研究中最重要的實驗技術(shù)之一,所以基于雙向電泳圖片的數(shù)據(jù)庫也成了蛋白質(zhì)組學(xué)研究中主要內(nèi)容。
2.1.2 基于蛋白質(zhì)序列信息的數(shù)據(jù)庫
基于蛋白質(zhì)序列信息的數(shù)據(jù)庫是生物信息學(xué)數(shù)據(jù)庫中最基本的數(shù)據(jù)庫,這些數(shù)據(jù)庫以氨基酸殘基順序為基本內(nèi)容,并附有注釋信息(計算機(jī)的序列分析結(jié)果和生物學(xué)家查閱文獻(xiàn)的結(jié)果)?;诘鞍踪|(zhì)序列的數(shù)據(jù)庫很多,主要有蛋白質(zhì)信息資源數(shù)據(jù)庫(PIR)、SWISS3D和 TrEMBL等等。
2.1.3 其他蛋白質(zhì)組數(shù)據(jù)庫
蛋白質(zhì)生物信息學(xué)包含很多方面的內(nèi)容:如蛋白質(zhì)大分子的結(jié)構(gòu)、相互作用等等,所以,除了上述的一些數(shù)據(jù)庫之外,還有很多關(guān)于構(gòu)象、相互作用等方面的數(shù)據(jù)庫,是基于質(zhì)譜應(yīng)用的數(shù)據(jù)庫,屬于混合數(shù)據(jù)庫。將生物信息學(xué)的實驗思路引入蛋白質(zhì)組學(xué)的實驗方案后,實驗人員可以通過互聯(lián)網(wǎng)上的信息設(shè)計實驗方
案,避免了很多重復(fù)性的勞動,少走很多彎路,為蛋白質(zhì)組學(xué)的發(fā)展提供了可靠的信息資源。值得一提的是,上文提到的大多數(shù)數(shù)據(jù)庫都能實現(xiàn)數(shù)據(jù)接收、在線查詢和空間結(jié)構(gòu)的可是化瀏覽等多種功能。而且,幾乎所有這些數(shù)據(jù)庫都是免費的,都可以免費下載或提供免費服務(wù),使得蛋白質(zhì)組學(xué)可以在生物信息學(xué)的輔助之下快速發(fā)展。
2.2生物信息學(xué)與蛋白質(zhì)分析
在蛋白質(zhì)組分析過程中,生物信息學(xué)的作用不僅僅體現(xiàn)在數(shù)據(jù)庫的查閱和資料的整合中,生物信息學(xué)軟件在蛋白質(zhì)組研究領(lǐng)域的作用根式至關(guān)重要的。蛋白質(zhì)分析軟件應(yīng)用主要集中在結(jié)合蛋白質(zhì)組研究中的分離技術(shù)和堅定技術(shù)識別蛋白質(zhì)(如2-DE)圖像分析、Edman降解的序列組合、質(zhì)譜數(shù)據(jù)的綜合分析等),對有價值的未知蛋白質(zhì)進(jìn)行分析和預(yù)測(包括序列分析、結(jié)構(gòu)預(yù)測、結(jié)構(gòu)域、電點等性質(zhì)的檢測等)、針對蛋白質(zhì)的分析預(yù)測方法應(yīng)用的工具有4個方面。
2.2.1 蛋白質(zhì)一級結(jié)構(gòu)分析
根據(jù)20中氨基酸的理化性質(zhì)可以分析電泳等實驗中的未知蛋白質(zhì),同樣也可以分析已知蛋白質(zhì)的物化性質(zhì)。設(shè)計PROPSEARCH的目的是為了通過排比方法查詢一個新的蛋白質(zhì)序列失敗時,查找公認(rèn)的蛋白質(zhì)家族而設(shè)計的。PROPSEARCH可以通過氨基酸組分來查詢,同時也可以通過其他的特性來進(jìn)行查詢,如從序列中計算所得的分子量、挑選的二肽組分的含量等。
2.2.2 蛋白質(zhì)的物理性質(zhì)預(yù)測
從蛋白質(zhì)序列出發(fā),預(yù)測蛋白質(zhì)的許多物理性質(zhì),包括等電點、分子量、酶切特性、疏水性、電荷分布等。
2.2.3蛋白質(zhì)二級結(jié)構(gòu)預(yù)測
二級結(jié)構(gòu)是指α螺旋和β折疊等規(guī)則的蛋白質(zhì)局部結(jié)構(gòu)元件。蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測的基本依據(jù)是每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。因此,進(jìn)行二級結(jié)構(gòu)預(yù)測需要通過統(tǒng)計和分析發(fā)現(xiàn)這些傾向或者規(guī)律。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的方法有3種。一是由已知結(jié)構(gòu)統(tǒng)計各種氨基酸殘基形成二級結(jié)構(gòu) 的構(gòu)象趨勢,其中最常用的是Chou和Fasman 法;二是基于氨基酸的物理化學(xué)性質(zhì),包括堆積性、疏水性、電荷性、氫鍵形成能力等;三是通過序列比對,由已知三維結(jié)構(gòu)的同源蛋白推斷未知蛋白的二級結(jié)構(gòu)。各種方法預(yù)測的準(zhǔn)確率隨蛋白質(zhì)類型的不同而變化。一般對于α螺旋預(yù)測精度較好,對β折疊差些,而對除α螺旋和β折疊等之外的無規(guī)則二級結(jié)構(gòu)則效果很差。
2.2.4蛋白質(zhì)的三維結(jié)構(gòu)
蛋白質(zhì)三維結(jié)構(gòu)是預(yù)測時最復(fù)雜和最困難的預(yù)測技術(shù)。序列差異較大的蛋白質(zhì)序列也可能折疊成類似的三維構(gòu)象。由于蛋白質(zhì)的折疊過程并不十分清晰,從理論上解決蛋白質(zhì)折疊的問題還有待進(jìn)一步的科學(xué)發(fā)展,但也有了一些有一定作
用的三維結(jié)構(gòu)預(yù)測方法。即與已知結(jié)構(gòu)的序列比較,同源模建,threading算法和 折疊識別方法。常見的預(yù)測算法有:SWISS-MODEL(自動蛋白質(zhì)同源模建服務(wù)器)、CPHmodels等。
2.3 生物信息學(xué)與蛋白質(zhì)功能
生物信息學(xué)發(fā)展到今天不僅可以對蛋白質(zhì)組數(shù)據(jù)進(jìn)行分析和預(yù)測,而且可以對已知或者未知的基因產(chǎn)物進(jìn)行功能上全面的分析和預(yù)測。
生物信息學(xué)最常用的分析方法是模式識別。主要是利用存在于蛋白質(zhì)序列結(jié)構(gòu)中的某些特殊的特征模體來識別相關(guān)蛋白質(zhì)性質(zhì)。換而言之,就是從新的蛋白序列中發(fā)現(xiàn)標(biāo)志性的序列或者結(jié)構(gòu),以此建立模式,然后在已經(jīng)建立好的已知蛋白質(zhì)數(shù)據(jù)庫中,搜集于此相似的模式,來確定未知蛋白質(zhì)的歸屬,從而預(yù)測它的功能。許多基因是在特定時期和條件下被激活,才能表達(dá)出來,在正常人工模擬的環(huán)境下根本無法表達(dá)。類似于這樣的恩未知蛋白質(zhì)也需要通過生物信息學(xué)的方法計算分析預(yù)測,以獲得它的功能信息。
生物信息學(xué)的發(fā)展將給生命科學(xué)研究帶來革命性的變革,將幫助人類認(rèn)識生命的起源、進(jìn)化、遺傳和發(fā)育的本質(zhì),揭示人體生理和病理過程的分子基礎(chǔ),為人類疾病的預(yù)測、診斷、預(yù)防和治療提供合理和有效的方法或途徑,同時還將對醫(yī)藥、衛(wèi)生、食品、農(nóng)業(yè)等產(chǎn)業(yè)產(chǎn)生巨大的推動作用,甚至可能引發(fā)新的產(chǎn)業(yè)革命。21世紀(jì)是生命科學(xué)的時代,生物信息學(xué)為生命科學(xué)的發(fā)展提供了便利和強(qiáng)有利的技術(shù)支持,推動著生命科學(xué)的迅速發(fā)展。
第三篇:數(shù)學(xué)模型在生物信息學(xué)教學(xué)中的應(yīng)用
目 錄
目錄...............................................................................................................................................i 摘要..............................................................................................................................................ii 第一部分 數(shù)學(xué)建模........................................................................................................................1 數(shù)學(xué)建模的介紹...................................................................................................................1 2 數(shù)學(xué)建模的主要內(nèi)容...........................................................................................................1 3 數(shù)學(xué)建模的流程...................................................................................................................2 4 數(shù)學(xué)建模的主要算法...........................................................................................................3 5 數(shù)學(xué)建模的軟件...................................................................................................................3 第二部分 生物信息學(xué)....................................................................................................................3 什么是生物信息學(xué)...............................................................................................................3 2 生物信息學(xué)的研究方向.......................................................................................................4 第三部分 生物信息學(xué)與數(shù)學(xué)建模的交叉.....................................................................................4 方法和技術(shù)的交叉...............................................................................................................4
1.1 數(shù)學(xué)統(tǒng)計方法............................................................................................................4 1.2 動態(tài)規(guī)劃方法............................................................................................................4 1.3 機(jī)器學(xué)習(xí)....................................................................................................................5 1.4 數(shù)據(jù)挖掘....................................................................................................................5 1.5 生物分子的計算機(jī)模擬............................................................................................5 2 目的上的相似.......................................................................................................................5 第四部分 數(shù)學(xué)建模在生物信息學(xué)中的部分應(yīng)用.........................................................................6 運用數(shù)學(xué)模型的預(yù)測...........................................................................................................6 2 運用數(shù)學(xué)模型的數(shù)據(jù)分析...................................................................................................7 參考文獻(xiàn)..........................................................................................................................................7
i 數(shù)學(xué)建模在生物信息學(xué)中的應(yīng)用研究
摘 要
本文首先介紹了數(shù)學(xué)建模和生物信息學(xué)的基礎(chǔ)知識,然后分析了數(shù)學(xué)建模和生物信息學(xué)的交叉知識點。分析顯示,數(shù)學(xué)建模和生物信息學(xué)不僅在統(tǒng)計方法和數(shù)據(jù)挖掘等使用方法和技術(shù)方面存在交叉知識點,還在目的上具有一定的相似性,即兩者都是對大量的數(shù)據(jù)進(jìn)行統(tǒng)計和分析,都以解決問題為最終目的。最后,文章重點回顧了數(shù)學(xué)建模在生物信息學(xué)中數(shù)據(jù)分析和結(jié)構(gòu)預(yù)測方面的部分應(yīng)用。
關(guān)鍵詞:數(shù)學(xué)建模 生物信息學(xué) 應(yīng)用研究
ii
第一部分 數(shù)學(xué)建模 數(shù)學(xué)建模的介紹
從航空航天領(lǐng)域中的火箭發(fā)射、武器的自動導(dǎo)航,到企業(yè)中該如何配置人力、物力和財力,進(jìn)而用最小的成本產(chǎn)生最大的利潤,再到生活中如何規(guī)劃自己有限的時間復(fù)習(xí)期末考試,等等。這都或多或少地運用到了數(shù)學(xué)建模的知識。數(shù)學(xué)建模是一個將實際問題用數(shù)學(xué)的語言、方法,去近似刻畫、建立相應(yīng)數(shù)學(xué)模型并解決科研、生產(chǎn)和生活中的實際問題的過程。數(shù)學(xué)建模的問題比較廣泛,涉及到多學(xué)科知識,它不追求解決方法的天衣無縫,不追求所用數(shù)學(xué)知識的高深,也不追求理論的嚴(yán)密邏輯,它以解決問題為主要目的。
模型的建立,即把錯綜復(fù)雜的實際問題簡化、抽象化為具有合理的數(shù)學(xué)結(jié)構(gòu)的過程。通過調(diào)查、收集數(shù)據(jù)資料,觀察和研究實際對象的固有特征和內(nèi)在規(guī)律,抓住問題的主要矛盾,建立起反映實際問題的數(shù)量關(guān)系,然后利用數(shù)學(xué)的理論和方法去分折和解決問題。
隨著科學(xué)技術(shù)的飛速發(fā)展,人們越來越認(rèn)識到數(shù)學(xué)的重要性:數(shù)學(xué)的思考方式具有根本的重要性,數(shù)學(xué)為組織和構(gòu)造知識提供了方法,將它用于技術(shù)時能使科學(xué)家和工程師生產(chǎn)出系統(tǒng)的、能復(fù)制的、且可以傳播的知識??數(shù)學(xué)對于經(jīng)濟(jì)競爭是必不可少的,數(shù)學(xué)科學(xué)是一種關(guān)鍵性的、普遍的、可實行的技術(shù)。在當(dāng)今高科技與計算機(jī)技術(shù)日新月異且日益普及的社會里,高新技術(shù)的發(fā)展離不開數(shù)學(xué)的支持,沒有良好的數(shù)學(xué)素養(yǎng)已無法實現(xiàn)工程技術(shù)的創(chuàng)新與突破。數(shù)學(xué)建模的主要內(nèi)容
數(shù)學(xué)建模理論包含統(tǒng)計回歸模型、優(yōu)化模型、圖論模型、微分模型和概率模型等【1-3】,如表1所示。
表1 數(shù)學(xué)建模的主要內(nèi)容
統(tǒng)計回歸模型 數(shù)學(xué)挖掘 聚類分析 層次分析 線性回歸 非線性回歸 主成分分析 時間序列分析 運籌與優(yōu)化模型 博弈論
圖論模型
線性規(guī)劃
最小生成樹
整數(shù)規(guī)劃
最大流問題
目標(biāo)規(guī)劃
最短路徑問題
動態(tài)規(guī)劃
最長路徑問題
非線性規(guī)劃
PERT網(wǎng)絡(luò)圖模型
多目標(biāo)決策
最小費用流問題
數(shù)據(jù)擬合與插值 存貯論模型
偏微分方程模型 灰色預(yù)測模型
馬氏鏈模型
差分方差模型
排隊論模型
穩(wěn)定性模型
決策論模型
微分方程模型
計算機(jī)模擬
GM模型
隨機(jī)模擬
圖論與網(wǎng)絡(luò)模型
微分差分模型
概率模型 數(shù)學(xué)建模的流程
圖1數(shù)學(xué)建模的流程[3] 數(shù)學(xué)建模的主要算法
蒙特卡羅算法——該算法又稱隨機(jī)性模擬算法,是通過計算機(jī)仿真來解決問題的算法,同時可以通過模擬可以來檢驗自己模型的正確性。
數(shù)據(jù)處理算法——通常會遇到大量的數(shù)據(jù)需要數(shù)據(jù)擬合、參數(shù)估計、插值等處理,通常使用Matlab作為工具。
規(guī)劃算法——遇到線性規(guī)劃、整數(shù)規(guī)劃、多元規(guī)劃、二次規(guī)劃等最優(yōu)化問題,可以用數(shù)學(xué)規(guī)劃算法來描述,通常使用Lingo軟件實現(xiàn)。
圖論算法——包括最短路、網(wǎng)絡(luò)流、二分圖等算法。動態(tài)規(guī)劃、回溯搜索、分治算法、分支定界等算法。
非經(jīng)典算法——模擬退火法、神經(jīng)網(wǎng)絡(luò)、遺傳算法為最優(yōu)化理論的三大非經(jīng)典算法。數(shù)學(xué)建模的軟件
數(shù)學(xué)建模有專用的軟件:Matlab 7,Lingo 8為其中最主要的軟件,其他重要的軟件有Mathematice,S-plus,SAS等。
第二部分 生物信息學(xué) 什么是生物信息學(xué)
生物信息學(xué)是一門新興的交叉學(xué)科,它使用數(shù)學(xué)和計算機(jī)這兩項工具,對日益增長的生物數(shù)據(jù)進(jìn)行快速、高效的組織與分析。生物信息學(xué)的近期任務(wù)是大規(guī) 3 模的基因組測序中的信息分析、新基因和新SNP的發(fā)現(xiàn)與鑒定、完整基因組的比較研究、大規(guī)?;蚬δ鼙磉_(dá)譜的分析、生物大分子的結(jié)構(gòu)模擬與藥物分析,其遠(yuǎn)期任務(wù)是非編碼區(qū)信息結(jié)構(gòu)分析、遺傳密碼起源和生物進(jìn)化的研究。2 生物信息學(xué)的研究方向
生物信息學(xué)的發(fā)展異常迅速,現(xiàn)主要包括DNA序列對比、蛋白質(zhì)結(jié)構(gòu)對比與預(yù)測、編碼區(qū)的基因識別、序列重疊群(Contigs)裝配、基于結(jié)構(gòu)的藥物設(shè)計、非編碼區(qū)的分析研究、遺傳密碼的起源、分子進(jìn)化與比較基因組學(xué)、生物系統(tǒng)的建模和仿真、生物信息學(xué)技術(shù)方法的研究等幾個研究方向【4-6】。
第三部分 生物信息學(xué)與數(shù)學(xué)建模的交叉
生物信息學(xué)是利用數(shù)學(xué)和計算機(jī)作為工具,不可避免地與數(shù)學(xué)建模,這一利用計算機(jī)和數(shù)學(xué)理論解決實際問題的學(xué)科,無論在研究方法和技術(shù)上,還是在運用目的上均產(chǎn)生一定的交叉。1 方法和技術(shù)的交叉
生物信息學(xué)所使用的方法與技術(shù)包括數(shù)學(xué)統(tǒng)計方法、動態(tài)規(guī)劃方法、機(jī)器學(xué)習(xí)與模式識別技術(shù)、數(shù)據(jù)庫技術(shù)與數(shù)據(jù)挖掘、人工神經(jīng)網(wǎng)絡(luò)技術(shù)、生物分子的計算機(jī)模擬等,而這些恰恰是數(shù)學(xué)建模領(lǐng)域的核心理論與知識。1.1 數(shù)學(xué)統(tǒng)計方法
數(shù)據(jù)統(tǒng)計、因素分析、多元回歸分析是生物學(xué)研究必備的工具,而這些是數(shù)學(xué)建模的統(tǒng)計回歸模型中最為基礎(chǔ)的知識;隱馬爾科夫模型(Hidden Markov Models)在序列分析方面有著重要的應(yīng)用,與隱馬爾科夫模型相關(guān)的技術(shù)是馬爾科夫鏈(Markov Chain),而馬爾科夫鏈模型正是數(shù)學(xué)建模中針對離散狀態(tài)按照離散時間的隨機(jī)轉(zhuǎn)移而建立的模型??傊?,生物信息學(xué)和數(shù)學(xué)建模有的第一個共同點是,都有對海量數(shù)據(jù)進(jìn)行統(tǒng)計分析的過程。1.2 動態(tài)規(guī)劃方法
動態(tài)規(guī)劃(Dynamic Programming)是一種解決多階段決策過程的最優(yōu)化方法,在每個階段做出一定的決策并影響后續(xù)的決策,最終選擇一個最優(yōu)決策。
當(dāng)兩個DNA序列長度較小時,采用動態(tài)規(guī)劃算法可以很好地解決兩個序列的相似性問題。當(dāng)序列長度太長時,改進(jìn)的BALST和FASTA算法也是基于動態(tài)規(guī)劃 的思想。同時,動態(tài)規(guī)劃在數(shù)學(xué)建模領(lǐng)域也被用來解決最短路線、庫存管理、資源分配等生產(chǎn)和生活中的現(xiàn)實問題。1.3 機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)一般采用遺傳算法、神經(jīng)網(wǎng)絡(luò)或聚類分析等,模擬人類的學(xué)習(xí)過程,以計算機(jī)為工具獲取知識、積累經(jīng)驗,在擁有大樣本、多向量數(shù)據(jù)的數(shù)據(jù)分析中發(fā)揮著日益重要的作用。比如,聚類分析已經(jīng)運用于癌癥類型的分類,神經(jīng)網(wǎng)絡(luò)和隱馬爾可夫模型對于缺乏完備理論體系的生物領(lǐng)域也同樣奏效。以上聚類分析、神經(jīng)網(wǎng)絡(luò)和隱馬爾可夫模型均為數(shù)學(xué)建模中的重點方法。1.4 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘又被稱作數(shù)據(jù)庫中的知識發(fā)現(xiàn),在此意義上,生物信息學(xué)也是在海量的生物數(shù)據(jù)中發(fā)掘生命的奧秘?;蛐蛄邪ㄍ怙@子和內(nèi)含子,其中外顯子只占其中的一小部分。大部分的內(nèi)含子序列的作用并不為人知,如何從這些簡單的ACGT序列中發(fā)現(xiàn)內(nèi)含子如何參與基因的轉(zhuǎn)錄與翻譯變得異常重要。比如,利用一階和二階馬爾可夫鏈的方法偵測密碼區(qū)。1.5 生物分子的計算機(jī)模擬
所謂生物分子的計算機(jī)模擬就是從分子或者原子水平上的相互作用出發(fā),建立分子體系的數(shù)學(xué)模型,利用計算機(jī)進(jìn)行模擬實驗,預(yù)測生物分子的結(jié)構(gòu)和功能,預(yù)測動力學(xué)及熱力學(xué)等方面的性質(zhì),常用的方法是蒙特卡羅法和模擬退火方法。2 目的上的相似
數(shù)學(xué)建模與生物信息學(xué)都會對大量的數(shù)據(jù)進(jìn)行統(tǒng)計和分析,都以解決問題為最終目的,并且以求得滿意解為重點,因為有時全局最優(yōu)解難以得到。另外,數(shù)學(xué)建模和生物信息學(xué)的研究都更強(qiáng)調(diào)能否具有實用性。比如生物信息學(xué)的機(jī)器學(xué)習(xí)技術(shù)中運用到了神經(jīng)網(wǎng)路或隱馬氏模型,但人們目前并不清楚該算法或模型是如何到達(dá)解的,即對其具體的機(jī)理并不十分了解。但這并不妨礙我們使用這種方法,因為這種方法具有使用成功性和可用性。在這個意義上,數(shù)學(xué)建模也經(jīng)常通過此類“黑箱” 操作達(dá)到特定解。正如Cynthia Gibas和Per Jambeck在《Developing Bioinformatics Computer Skills》的前言所說,生物信息學(xué)“is often less about developing perfectly elegant algorithms than it is about answering practical questions”。從這個意義上說,數(shù)學(xué)建模與生物信息學(xué)有著目的上的相似性。
第四部分 數(shù)學(xué)建模在生物信息學(xué)中的部分應(yīng)用
1.運用數(shù)學(xué)模型的預(yù)測
1993年Rost和Sander[6]提出了三級網(wǎng)絡(luò)模型,這種神經(jīng)網(wǎng)絡(luò)方法已經(jīng)成為了蛋白質(zhì)結(jié)構(gòu)預(yù)測普遍采用的方法。2003年閆化軍等[7]人也通過神經(jīng)網(wǎng)絡(luò)算法預(yù)測蛋白質(zhì)二級結(jié)構(gòu)。2007年林衛(wèi)中等[8]人將GM(1,1)模型應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)類型的預(yù)測,把提取出的蛋白質(zhì)氨基酸的排列信息作為偽氨基酸成分,從而較大的提高了預(yù)測的成功率。2008年邱望仁等[9]人將OET-KNN算法應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)類型的預(yù)測,通過LZ復(fù)雜度的算法計算了偽氨基酸的成分,再用OET-KNN算法分類預(yù)測,從而也較大的提高了預(yù)測的成功率。
Bader等[10]人將Logistic回歸模型用來預(yù)測蛋白質(zhì)之間的生物學(xué)關(guān)系,這種運用使得通過遺傳學(xué)和基因表達(dá)數(shù)據(jù)來分析蛋白質(zhì)數(shù)據(jù)成為了可能。2006年王明會等[11]人將Markov鏈模型應(yīng)用于蛋白質(zhì)可溶性的預(yù)測,預(yù)測精度普遍好于或接近于神經(jīng)網(wǎng)絡(luò)、信息論和支持向量機(jī)法的結(jié)果,而且該模型的運算復(fù)雜度低,耗時也更短。2006年張菁晶等[12]人將隱馬爾可夫模型運用于目標(biāo)基因全基因組的預(yù)測,同量高、準(zhǔn)確度高并且操作簡單,尤其在多結(jié)構(gòu)域蛋白家族的預(yù)測上優(yōu)勢明顯。2008年劉桂霞等[13]人提出了一種帶偏差單元的遞歸神經(jīng)網(wǎng)絡(luò)模型。該模型根據(jù)BP算法得出權(quán)系數(shù)調(diào)整規(guī)則,使得收斂速度比一般的BP網(wǎng)絡(luò)更快,對于預(yù)測蛋白質(zhì)關(guān)聯(lián)圖有一定的實用價值。
2.運用數(shù)學(xué)模型的數(shù)據(jù)分析
1997年Carr等[14]研究了大鼠脊髓的基因活動,通過聚類分析證明具有已知相似功能的基因?qū)儆谝活悺?006年張文彤等[15]人綜合了聚類方法和進(jìn)化樹分析的優(yōu)點,通過先聚類將數(shù)據(jù)拆分,然后根據(jù)聚類的類別構(gòu)建進(jìn)化樹,這種方法可以很好地在大樣本數(shù)據(jù)中應(yīng)用,并以甲型流感病毒的H3A1序列作為實例,構(gòu)建拼接出了完整的進(jìn)化樹結(jié)果。
2006年徐麗等[16]人針對Viterbi算法和Baum-Welch算法在隱馬爾可夫模型(Hidden Markov Model)的參數(shù)估計中無法找到全局最優(yōu)解,提出了基于遺傳算法的HMM參數(shù)估計,這種方法用于多序列對比研究時可以更好的避免局部最優(yōu)解。2007年周曉彥等[17]人通過綜合模糊數(shù)學(xué)和核判別方法的優(yōu)點,提出了一種基于模糊核判別分析的基因表達(dá)數(shù)據(jù)分析方法,并以多發(fā)性骨髓瘤的基因表達(dá)數(shù)據(jù)為例證實了這種方法的可行性和精確性。2007年劉萬霖等[18]人介紹了構(gòu)建基因調(diào)控網(wǎng)絡(luò)的多種算法和方法,比如馬爾可夫鏈可以用于分析時間序列微陣列表達(dá)數(shù)據(jù);將隨機(jī)和概率等引入布爾網(wǎng)絡(luò)模型,可以增強(qiáng)基因網(wǎng)絡(luò)調(diào)控的精確性;貝葉斯網(wǎng)絡(luò)模型在Friedman和Pe’er等人做出了開拓性的工作后,在基因表達(dá)數(shù)據(jù)和調(diào)控網(wǎng)絡(luò)方面得到了快速的發(fā)展。
參考文獻(xiàn)
[1] 馮杰等.數(shù)學(xué)建模原理與案例.科學(xué)出版社,2007.[2] 高隆昌,楊元著.數(shù)學(xué)建?;A(chǔ)理論.科學(xué)出版社,2007.[3] 戴朝壽,孫世良.數(shù)學(xué)建模簡明教程.高等教育出版社,2007.[4] 陶士珩.生物信息學(xué).科學(xué)出版社,2007.[5] DAVID W.MOUNT.生物信息學(xué):中文版.高等教育出版社,2003.[6] Rost B, Sander C.Proc.Natl.Acad.Sci.USA, Biothysics, 1993,90:7558-7562 [7] 閆化軍,傅
彥,章
毅等.神經(jīng)網(wǎng)絡(luò)方法預(yù)測蛋白質(zhì)二級結(jié)構(gòu).計算機(jī)科學(xué).2003,30(11):48-52 [8] 林衛(wèi)中, 肖絢.基于GM(1,1)模型的蛋白質(zhì)二級結(jié)構(gòu)類型預(yù)測.計算機(jī)工程與應(yīng)用, 2007, 43(34): 41-45 [9] 邱望仁, 肖絢, 林衛(wèi)中.基于OET-KNN算法的蛋白質(zhì)二級結(jié)構(gòu)類型預(yù)測.計算機(jī)工程與應(yīng)用, 2008, 44(29): 204-210 [10] Bader JS,Chaudhuri A,Rothberg JM,et al.Gaining confidence in high-throughput protein interaction network.Nat Biotechnol,2004,22: 78-85 [11] 王明會, 李 驁, 王嫻等.Markov鏈模型在蛋白質(zhì)可溶性預(yù)測中的應(yīng)用.生物醫(yī)學(xué)工程學(xué)雜志, 2006, 23(5): 1109-1113 [12] 張菁晶,馮
晶,朱英國.全基因組預(yù)測目標(biāo)基因的新方法及其應(yīng)用.遺傳.2006,28(10):1299-1305 [13] 劉桂霞, 于哲舟, 周春光.基于帶偏差遞歸神經(jīng)網(wǎng)絡(luò)蛋白質(zhì)關(guān)聯(lián)圖的預(yù)測.吉林大學(xué)學(xué)報(理學(xué)版), 2008, 46(2): 265-270 [14] Carr DB, Somogyi R, Michaels G.Templates for looking at gene expression clustering.Statistical Computing & Statistical Graphics Newsletter, 1997,8:20-29 [15] 張文彤, 姜慶五.聚類技術(shù)在大樣本序列進(jìn)化樹分析中的應(yīng)用.中國衛(wèi)生統(tǒng)計.2006,23(5):393-396 [16] 徐麗,康瑞華.基于遺傳算法的HMM參數(shù)估計.湖北工業(yè)大學(xué)學(xué)報.2006,21(4):68-71 [17] 周曉彥,鄭文明.基于模糊核判別分析的基因表達(dá)數(shù)據(jù)分析方法.華中科技大學(xué)學(xué)報(自然科學(xué)版), 2007, 35(I): 173-176 [18] 劉萬霖,李
棟,朱云平等.基于微陣列數(shù)據(jù)構(gòu)建基因調(diào)控網(wǎng)絡(luò).遺傳,2007,29(12):1434-1442 8
第四篇:生物信息學(xué)小結(jié)
1. 什么是(基因)生物信息學(xué)?
目前一般意義的生物信息學(xué)是基因?qū)哟蔚?/p>
它是一個包含著基因組信息的獲取、處理、存儲、分配、分析和解釋的所有方面學(xué)科領(lǐng)域。
生物信息學(xué)是把基因組DNA序列信息分析作為源頭,破譯隱藏在DNA序列中的遺傳語言,特別是非編碼區(qū)的實質(zhì);同時在發(fā)現(xiàn)了新基因信息之后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測。
他是近年來發(fā)展并完善起來的交叉學(xué)科。這門學(xué)科是綜合運用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計算機(jī)科學(xué)等諸多學(xué)科的理論方法的嶄新交叉學(xué)科。
生物信息學(xué)已成為整個生命科學(xué)發(fā)展的重要組成部分,成為生命科學(xué)研究的前沿?;蚪M信息
蛋白質(zhì)的結(jié)構(gòu)模擬 藥物設(shè)計
它們是生物信息學(xué)的三個重要組成部分,生物信息學(xué)目前已在理論生物學(xué)領(lǐng)域占有了核心地位,它廣泛地應(yīng)用在生物、醫(yī)藥、農(nóng)業(yè)、環(huán)境等學(xué)科。
2.廣義生物信息學(xué)主要包括哪幾個方面? 廣義生物信息學(xué)主要包括如下幾個方面:
一、生物的遺傳信息
DNA―RNA―蛋白質(zhì),遺傳信息—轉(zhuǎn)錄—翻譯,遺傳信息生物信息學(xué)。
二、生命活動的調(diào)控
基因的功能、表達(dá)和調(diào)控(表觀遺傳學(xué))。蛋白的結(jié)構(gòu)、功能和調(diào)控;細(xì)胞活動(分化、發(fā)育、衰老、死亡)的調(diào)控,器官、系統(tǒng)、整體活動的調(diào)控;節(jié)律、生物鐘、分蘗、生長、開花、結(jié)果、營養(yǎng)的吸收、傳輸、轉(zhuǎn)化、對外界信號的反應(yīng):含羞草、抗逆性。
三、生物電磁學(xué)與電磁生物學(xué)
生物電磁學(xué):生命活體在不同層次(電子、離子、原子、基因、細(xì)胞、組織、整體等)的活動和不同屬性(包括思維、精神)活動時以及和外界環(huán)境(生命體周圍直至宇宙)相互作用時反映出來的各種電磁信息。人體的電磁輻射(包括發(fā)光):頻率、強(qiáng)度、頻譜。人體信號的調(diào)制方式:調(diào)幅、調(diào)頻、編碼。
電磁生物學(xué):電磁輻射對生物體的影響,電磁場導(dǎo)致DNA突變,體內(nèi)細(xì)胞電離、極化狀態(tài)變化導(dǎo)致疾病。
四、視覺系統(tǒng)與光信息處理
視網(wǎng)膜神經(jīng)元回路與信息處理、彩色視覺及彩色圖像的編碼、變換機(jī)制、眼動成象機(jī)制及寬視場、消色差動態(tài)成象系統(tǒng)、視覺認(rèn)知機(jī)制及其圖像信息的智能模式識別、不同狀態(tài)立體視覺機(jī)制和靜態(tài)、動態(tài)立體視銳度。
五、腦和神經(jīng)系統(tǒng)與信息
腦的感知覺信息處理原理及其應(yīng)用,學(xué)習(xí)、記憶、思維,邏輯思維和形象思維,思維模型與信息處理系統(tǒng)新原理的研究,新的計算模型、新型計算機(jī)、如:神經(jīng)計算機(jī)。
六、生物體結(jié)構(gòu)與微光機(jī)電系統(tǒng)
DNA驅(qū)動的微細(xì)機(jī)器人,生物大分子到細(xì)胞基本結(jié)構(gòu)體系的自組裝、自組織,創(chuàng)造新物質(zhì)的分子工程學(xué)研究,分子聚集體的化學(xué)。
納米生物技術(shù)將納米技術(shù)和生物技術(shù)相集成,在生物醫(yī)學(xué)、電子學(xué)、材料學(xué)、環(huán)境科學(xué)等諸多領(lǐng)域具有良好的應(yīng)用前景。在生物芯片、分子馬達(dá)、生物探針、納米生物材料等迅速發(fā)展。
七、基因芯片、蛋白質(zhì)芯片等
目前一般意義的生物信息學(xué)是基因?qū)哟蔚?,是近年來發(fā)展并完善起來的交叉學(xué)科。這門學(xué)科是綜合運用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計算機(jī)科學(xué)等諸多學(xué)科的理論方法的嶄新交叉學(xué)科。
3.Internet有哪些基本功能?
Internet不僅向其用戶提供了全球范圍的信息交流與快速通訊手段,其本身也具有極其豐富的信息資源,包括新聞、書刊雜志、數(shù)據(jù)庫、計算機(jī)軟件、多媒體資料等,也包括大量的生物信息學(xué)資源。
4.什么是Entrez?Entrez主要包括哪幾個數(shù)據(jù)庫?
Entrez(http://www.ncbi.nim.nih.gov/entraz)是美國國立醫(yī)學(xué)圖書館國家生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)建立的生物醫(yī)學(xué)數(shù)據(jù)庫集成檢索系統(tǒng)。系統(tǒng)中的數(shù)據(jù)庫包括核酸序列數(shù)據(jù)庫、蛋白質(zhì)序列數(shù)據(jù)庫、大分子三維結(jié)構(gòu)數(shù)據(jù)庫、全部基因組、孟德爾人類遺傳及通過PubMed檢索的MEDLINE。Entrez集成系統(tǒng)的最大特點是通過任何一個數(shù)據(jù)庫檢索出的信息可直接鏈接到Entrez其它數(shù)據(jù)庫并找到相關(guān)的檢索結(jié)果。
5.PubMed的一般檢索方法有幾種檢索途徑?
通過NCBI首頁(http://www.ncbi.nlm.nih.gov/)或NCBI的Entrez檢索系統(tǒng)(http://www.ncbi.nlm.nih.gov/Entrez/)選擇PubMed鏈接選項或直接在瀏覽器地址欄(URL)中輸入“http://www.ncbi.nlm.nih.gov/entrez/query.fcgidb=PubMed”即可進(jìn)入
PubMed檢索界面。PubMed有多種檢索途徑,包括自由詞、文獻(xiàn)作者、規(guī)范主題詞(MeSH)、期刊名稱、文獻(xiàn)出版年代、文獻(xiàn)類型、文獻(xiàn)語種、物質(zhì)名稱、記錄入檔日期、文獻(xiàn)出版日期等。既可以單一字段檢索,又可以利用高級布爾邏輯表達(dá)式多字段組配檢索。
6.國際上三大DNA數(shù)據(jù)庫是什么數(shù)據(jù)庫? ,國際三大DNA數(shù)據(jù)庫:NCBI的GenBank,歐洲分子生物學(xué)實驗室(European Molecular Biology Laboratory, EMBL)、日本DNA數(shù)據(jù)庫(DNA Data Bank of Japan,DDBJ)
7.簡述進(jìn)行基因搜索時的基本步驟 ?
在進(jìn)行基因搜索時的基本步驟:
1、尋找DNA序列中基因不可能出現(xiàn)的區(qū)域,并將此遮蔽起來。
2、在啟動子區(qū)尋找一致的模式,找出轉(zhuǎn)錄因子識別DNA結(jié)合區(qū)域。
3、尋找轉(zhuǎn)錄的起始密碼、終止密碼和剪切位點。
4、找出編碼區(qū)。然后將全部收集到的信息匯總整理成總體上盡可能連貫的譜圖。注意進(jìn)行不同的分析時使用不同的軟件工具以及程序適用的物種選擇和應(yīng)用范圍等。
8.BLAST的主要功能都包括什么 ?
1、核酸數(shù)據(jù)庫搜索
組合基因組檢索;分為標(biāo)準(zhǔn)的核酸與核酸數(shù)據(jù)庫搜索;MEGABLAST提供大量長序列的比較;完全匹配的短序列搜索;特殊搜索。
2、蛋白數(shù)據(jù)庫搜索
分為標(biāo)準(zhǔn)的蛋白與蛋白數(shù)據(jù)庫搜索;PSI-and PHI-BLAST,其中PSI用于搜索證實遠(yuǎn)源進(jìn)化關(guān)系的存在與否和進(jìn)一步獲取這個蛋白家族中的功能信息,而PHI用于搜索蛋白基序;同樣包括蛋白的完全匹配的短序列搜索。
3、已翻譯蛋白的BLAST搜索
包括[blastx],[tblastn],[tblastx]
4、保守區(qū)域的搜索:主要使用RPS-BLAST程序完成。
5、配對序列的兩兩比較:用于核酸和蛋白的兩兩比較分析。
6、針對特定數(shù)據(jù)庫的搜索:比如人類基因組、微生物基因組等。
9.利用核酸序列進(jìn)行基因結(jié)構(gòu)預(yù)測的基本步驟是什么?(不確定)一個全面的基因搜索方案,無論是通過單個集成的程序?qū)崿F(xiàn),還是通過多個程序分步實現(xiàn),基本的思路是相同的:
1、通常如果一個序列中某一區(qū)域出現(xiàn)重復(fù)序列,該區(qū)域不大可能處于調(diào)控區(qū)域和編碼區(qū)域。
2、如果某一片段與其它基因或基因產(chǎn)物有序列相似性,該片段是外顯子的可能性極大。
3、一段序列上存在著統(tǒng)計的規(guī)則性,表現(xiàn)為顯著的“密碼子偏好”,是蛋白編碼區(qū)最明顯的標(biāo)志之一。
4、與模板模式相符可能指出DNA上功能性位點的位置。這類分析可以基于很簡單的模式(例如,眾所周知的“TATA box”和剪接點的保守序列)或基于相當(dāng)復(fù)雜的推理(例如,在后面將提到的啟動子搜尋算法中)。
10.根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測其空間結(jié)構(gòu)主要預(yù)測方法有哪兩類?
預(yù)測方法主要有兩類:
一、采用分子力學(xué)、分子動力學(xué)的方法,根據(jù)物理化學(xué)的基本原理,從理論上預(yù)測蛋白質(zhì)分子的空間結(jié)構(gòu)。
二、通過對已知空間結(jié)構(gòu)的蛋白質(zhì)進(jìn)行分析,找出一級結(jié)構(gòu)與空間結(jié)構(gòu)的關(guān)系,總結(jié)出規(guī)律,用于新的蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測。本章介紹利用分析蛋白質(zhì)氨基酸的組成來確認(rèn)未知蛋白的計算工具、蛋白翻譯后修飾、蛋白功能預(yù)測。
組成蛋白質(zhì)的氨基酸序列為蛋白質(zhì)的一級結(jié)構(gòu),蛋白質(zhì)的一級結(jié)構(gòu)決定了蛋白質(zhì)的性質(zhì)。組成蛋白質(zhì)的氨基酸的物理和化學(xué)性質(zhì)早已被人熟知。構(gòu)成蛋白質(zhì)的20種氨基酸由于化學(xué)構(gòu)造不同,在結(jié)構(gòu)和功能上具有多樣性,任一殘基對蛋白質(zhì)的物理和生化性質(zhì)都會產(chǎn)生影響,即序列決定構(gòu)象。由于蛋白質(zhì)空間結(jié)構(gòu)的基礎(chǔ)是一級結(jié)構(gòu),近年來根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測其空間結(jié)構(gòu),受到科學(xué)家的關(guān)注。
11.談?wù)剬W(xué)習(xí)生物信息學(xué)的體會(自己發(fā)揮吧)
有點粗糙,見諒
六哥
第五篇:生物材料在骨科的應(yīng)用進(jìn)展
生物材料在骨科的應(yīng)用進(jìn)展
[摘要] 生物材料在骨科的應(yīng)用十分廣泛,目前用于骨組織修復(fù)與替代的材料主要有醫(yī)用金屬材料、醫(yī)用高分子材料和醫(yī)用無機(jī)非金屬材料等。
[關(guān)鍵詞] 生物材料 骨科
應(yīng)用
生物材料是指“以醫(yī)療為目的,用于和活組織接觸以形成功能的無生命材料”,包括具有生物相容性的材料。本文總結(jié)近年來用于骨組織修復(fù)的骨科生物材料的種類以及其在骨科臨床實踐中的應(yīng)用。
醫(yī)用金屬材料
骨科生物金屬材料是指能夠植入人體,治療骨骼疾病、替換骨組織,恢復(fù)骨骼的正常生理功能的一種生物惰性材料,由于具有較高的強(qiáng)度和韌度,金屬材料是骨科中應(yīng)用最多的植入材料,主要用于制造鋼板,螺釘,髓內(nèi)釘?shù)葍?nèi)固定物,廣泛用于各類骨折的治療。醫(yī)用金屬材料要求具有足夠的力學(xué)強(qiáng)度和抗疲勞性能;極好的耐腐蝕性能,無磁性;無毒、無致癌性與過敏反應(yīng);良好的光潔度[1]?,F(xiàn)在常用于臨床的醫(yī)用生物金屬材料主要包括醫(yī)用不銹鋼、鈷基合金、醫(yī)用形狀記憶合金等。
1.1醫(yī)用不銹鋼:醫(yī)用不銹鋼的材料有多種,最好的不銹鋼合金是316L型,比重約是人體骨骼的2倍,一直作為器具材料廣泛使用。具有較好的機(jī)械性質(zhì),易于加工制造且價格便宜,但同鈷基合金相比有較大的局部腐蝕敏感性,主要用于接骨板、骨螺釘、人工關(guān)節(jié)等。
1.2 合金類:主要包括①鈷基合金:鈷基合金包括鈷鉻鎢鎳合金、鈷鉻鉬合金[2]。其優(yōu)點是耐腐蝕性和機(jī)械性能較好,乃腐蝕性比不銹鋼高40倍,是目前綜合性能最好的材料之一,已列入ISO國際標(biāo)準(zhǔn),但缺點是機(jī)械性能低于不銹鋼,而且加工困難、產(chǎn)量低、價格貴,常被選擇為永久性植入材料。多用于骨折固定和制作人工關(guān)節(jié)。②鈦合金:具有優(yōu)于前兩種材料的機(jī)械性能,質(zhì)輕,組織相容性良好,生物界面結(jié)合牢固,在機(jī)體內(nèi)有極高的惰性和抗腐蝕性,是理想的植入材料,缺點是耐磨損性差和難以加工。鈦合金微型鋼是頜骨骨折復(fù)位內(nèi)固定的首選內(nèi)固定物[3],目前對膝、髖等大的人工關(guān)節(jié)多使用鈦合金。③鎳鈦記憶合金:該材料有形狀記憶效應(yīng),其理化性能表現(xiàn)為強(qiáng)度高,耐磨、耐腐蝕、無磁、無毒等特點,而且其硬度和剛度跟人體骨組織最接近,被認(rèn)為是最理想的生物內(nèi)固定植入材料。
金屬材料普遍的缺點是植入人體后,長期存在人體,金屬中某些元素離子進(jìn)入人體組織液、血液、器官,如鉻、鎳離子對人體具有致敏作用,甚至誘導(dǎo)機(jī)體發(fā)生癌變,另外長期受力的金屬還會發(fā)生金屬受力疲勞和內(nèi)部結(jié)構(gòu)的改變,從而引起遠(yuǎn)期手術(shù)的失敗等問題,是其普遍缺陷。并且,當(dāng)前的金屬生物材料的彈性模量與正常骨組織并不十分相稱,這會導(dǎo)致應(yīng)力遮擋效應(yīng),這樣的后果是對新生骨組織產(chǎn)生和塑性的刺激減弱,并使內(nèi)植物的穩(wěn)定性下降,且必須在患者充分痊愈后行二次手術(shù)將其取出。多次手術(shù)會增加醫(yī)療過程中的費用且會造成患者死亡率的上升[4]。鎂相關(guān)材料作為輕金屬、可降解、生物相容性好且具有生物活性的骨科內(nèi)植物材料的有美好前景。醫(yī)用高分子材料
2.1非生物降解型高分子材料,如聚乙烯、聚丙烯等,具有穩(wěn)定性好,不發(fā)生降解,交聯(lián)或物理磨損等,而且有良好的機(jī)械性能,對機(jī)體不產(chǎn)生明顯毒副作用,主要用于制作組織工程軟、硬組織,人工器官等。如硅橡膠是含有硅原子的各種合成橡膠的總稱。其優(yōu)點是耐高低溫,透氣性好,便于清潔,耐腐蝕性,具有良好的生物惰性??捎糜谝鞴埽斯る烨?,還用于防止粘連。高密度聚乙烯:其用于制造人工髖臼的分子量多在200~500萬左右,其摩擦系數(shù)低,約為0.03~0.06,抗沖擊性強(qiáng),耐磨性強(qiáng),年磨損率約為0.1~0.2 mm,是目前國際上普遍用于制造人工關(guān)節(jié)的較好材料。聚酯、聚酰胺(尼龍):主要用于人工肌腱,人造血管,手術(shù)縫線。聚甲基丙烯三甲酯:即骨水泥,主要用于骨缺損的修復(fù),如人工關(guān)節(jié)假體嵌插部位使用可增加接觸面積,還用于椎體成形術(shù)。
2.2 生物降解型高分子材料 在體溫下可以在一定時間內(nèi)分解為小分子化合物,由體內(nèi)代謝排除體外。其中最主要的是聚乙交酯(PGA)、聚丙交酯(PLA)及其混聚物,聚酯類似一類親水性非常強(qiáng)的高分子降解材料。聚酯類能在體內(nèi)降解,最終被分解代謝成CO2和H2O2從人體排出。PLA具有一定機(jī)械強(qiáng)度和良好的加工性能。PGA可支架誘導(dǎo)促進(jìn)成骨細(xì)胞的黏附增殖和分化,但其降解過快,且降解產(chǎn)物積聚會造成局部PH值下降,導(dǎo)致細(xì)胞中毒死亡。PGA與PLA形成的混聚物可通過二者的比例來調(diào)節(jié)其機(jī)械強(qiáng)度和降解速率[5]。聚酯類生物降解材料可以制成棒、針、螺釘、接骨板等,受其降解速度限制,固定部分在愈合期間不能承受較大的應(yīng)力。是目前組織工程中廣泛應(yīng)用的支架,臨床上多用于固定骨折愈合相對較快的骨骼,亦可用于關(guān)節(jié)鏡下膝前十字韌帶的損傷后重建、半月板損傷的修復(fù),在骨組織工程學(xué)領(lǐng)域也是一種很有前景的細(xì)胞培養(yǎng)支架材料[6],但不適于長骨干骨折固定,因其臨床愈合所需時間較長,骨折斷端應(yīng)力大。生物降解材料作為內(nèi)固定材料,在手術(shù)操作過程中不易割傷軟組織,即使在加壓情況下也不會損傷松質(zhì)骨,在所固定的組織愈合之前能夠保持足夠的強(qiáng)度,可隨著骨組織的愈合機(jī)械強(qiáng)度適當(dāng)衰減,使骨折斷端得到正常的應(yīng)力刺激,沒有金屬材料存在的應(yīng)力遮擋、腐蝕反應(yīng)等缺點,可使患者避免清除植入物的第2次手術(shù),亦不影響MR或CT等影像學(xué)復(fù)查,使用起來比金屬制品要安全和方便。但如果內(nèi)植物的降解產(chǎn)物超過組織的清除能力,可發(fā)生遲發(fā)性無菌性炎癥,局部突然發(fā)紅、疼痛、腫脹、有波動感,反應(yīng)嚴(yán)重者,可發(fā)生廣泛性皮膚壞死,降解速度快的PCA比降解速度慢的PIA炎癥發(fā)生率高,血運不佳的部位更易并發(fā)炎癥反應(yīng),因此應(yīng)權(quán)衡利弊,謹(jǐn)慎選擇。
醫(yī)用無機(jī)非金屬材料
3.1生物活性陶瓷,主要有磷酸鈣陶瓷、生物活性骨水泥及生物活性玻璃等,生物活性陶瓷具有骨傳導(dǎo)性,它作為一個支架,成骨在其表面進(jìn)行,還可作為多種物質(zhì)的外殼或填充骨缺損。目前最常用的主要有羥基磷灰石(HA)、磷酸三鈣(TCP)及兩者結(jié)合使用3種。骨水泥很少引起免疫反應(yīng),系統(tǒng)毒性也微不足道,具有良好的生物相容性,并能和骨直接融合,在骨科臨床上已經(jīng)應(yīng)用于股骨頸骨折的內(nèi)固定增強(qiáng)和橈骨遠(yuǎn)端骨折內(nèi)固定等。由于此類材料在生物學(xué)上缺乏有效的骨誘導(dǎo)性,脆性較大,抗張、抗扭和抗剪力差,為保證固化正常進(jìn)行,應(yīng)用時要求受區(qū)相對干燥,因此單純此類材料臨床應(yīng)用較少,仍需進(jìn)一步改進(jìn)。
3.2 生物惰性陶瓷 氧化鋁:氧化鋁是一種生物陶瓷,其硬度大,耐磨,生物相容性好,單晶氧化鋁可用于骨折內(nèi)固定,多晶氧化鋁即剛玉,可制作人工關(guān)節(jié)。研究發(fā)現(xiàn)將氧化鋁晶體納米化合物團(tuán)塊浸在與生物體液相似的溶液中,其表面可生成骨樣磷灰石層,提示在活體內(nèi)可能形成生物陶瓷如HAP、TCP等[7]。此外氧化鋯陶瓷的高強(qiáng)度和韌性降低了破裂的風(fēng)險,故被做成人工股骨頭用于全髖關(guān)節(jié)置換。最近還報道研制出一種結(jié)合了氧化鋁的生物特性及鎧氧化鋯的機(jī)械特性的新型物質(zhì),這種混合陶瓷比氧化鋁陶瓷的磨損率低,在模擬人上進(jìn)行的初步實驗結(jié)果具有一定的應(yīng)用前景[8]。
3.3碳素材料:碳纖維有利于生物組織攀附生長,可用于人工肌腱和韌帶的置換[14]。低溫裂解碳又稱各向同性碳,是將烴類氣體在高溫下炭化,可以直接蒸鍍在人工關(guān)節(jié)的運動磨損表面,作為減磨涂層。類金剛石膜(DLC)亦稱金剛石樣碳素膜,是一種非結(jié)晶的碳?xì)浠衔铮哂辛己玫募?xì)胞相容性、血液相容性及高耐磨性高硬度等特點,可以沉積于人工關(guān)節(jié)表面。作為聚乙烯的對抗面,DLC同氧化鋁、鈷基合金的耐磨相當(dāng),可顯著改善矯形裝置的磨損,是一種很有發(fā)展前景的膜材料。
納米生物材料在骨科領(lǐng)域研究最廣泛的是用作組織工程支架材料。理想的基質(zhì)支架材料不僅需要具備良好的生物相容性、適度的生物降解性、良好的結(jié)構(gòu)相容性、良好的表面相容性以及特定的生物活性,還必須使材料表面能夠促進(jìn)種子細(xì)胞的黏附與生長,并能通過表面修飾、控釋生物分子或?qū)Νh(huán)境刺激做出響應(yīng)等機(jī)制對種子細(xì)胞的黏附和生長進(jìn)行調(diào)控。納米生物材料的開發(fā)為這種高度仿生或“智能”型基質(zhì)支架材料的研制提供了可能[9]。
近年來,隨著生物醫(yī)學(xué)工程、醫(yī)學(xué)分子生物學(xué)、基因工程、組織工程學(xué)、材料科學(xué)、納米技術(shù)的的迅速發(fā)展,利用不同的生物材料復(fù)加工,組配成理想中具有多種生物活性的人工骨將成為現(xiàn)實。
參 考 文 獻(xiàn)
[1] 胥少汀,葛寶豐,徐印坎.實用骨科學(xué).第2版.北京:人民軍醫(yī)出版社,2003.357-360.
[2]朱肖奇.生物材料在骨科中的臨床應(yīng)用.中國組織工程研究與臨床康復(fù).2009:5738.[3] 李青.鈦合金表面涂層應(yīng)用生物骨的研究.生物骨科材料與臨床研究,2004,3(4):46-49.
[4]王義生,王建儒.可降解鎂合金作為骨科應(yīng)用生物材料的研究進(jìn)展.河南醫(yī)學(xué)研究.2009,18(1):75-77.[5] Valentin J E,Badylak J S,McCabe G P, et al.Extracellar matrix bioscaffolds for orthopaedic applications.A comparative histologic study [J].J Bone Joint Surg Am,2006,88(12):2673-2686.
[6] Jeon O.Song S J.Kang S W Enhancement of ectopic bone formation by bone morphogenetic protein-2 released from a heparin-conjugated poly(l-lactic-co-glycolic acid)scaffold [J].Biomaterials, 2007,28(17):2763-2771.
[7] Ozturk A.Yetkin H.Memis L Demineralized bone matrix andhydroxyapatite/tri-calcium phosphate mixture for bone healing in rats[J].Int Orthop,2006,30(3):147-152.[8] Kim H.Camata R P.Vohra Y K Control of phase composition in hydrox-yapatite/tetracalcium phosphate biphasic thin coatings for biomedical applications [J].J Mater Sci Mater Med, 2005,16(10):961-966.[9]鄭啟新,潘海濤,郭曉東.骨科納米生物材料的研究現(xiàn)狀與展望.中華實驗外科雜志.2007,24(6):646-648.