亚州av综合色区无码一区,午夜一区二区三区亚洲影院电影网,天堂а√在线地址,性人久久网av,无码内射成人免费喷射

曉木蟲
學術數(shù)據(jù)庫客戶端

識別致病基因的革新技術

 找回密碼
 注冊新賬號

QQ登录

微信登录

識別致病基因的革新技術

摘要:   癌癥是對人類生命構成嚴重威脅的主要疾病之一,是由各種致癌因素導致的某些部分組織的細胞克隆性異常,在基因水平上失去對其生長的正常調(diào)控從而增生而成的新生物。癌癥的早診斷是提高癌癥患者成活率的關鍵!  ...

  癌癥是對人類生命構成嚴重威脅的主要疾病之一,是由各種致癌因素導致的某些部分組織的細胞克隆性異常,在基因水平上失去對其生長的正常調(diào)控從而增生而成的新生物。癌癥的早診斷是提高癌癥患者成活率的關鍵。
  腫瘤組織無論在細胞形態(tài)上還是組織結構上,都與其發(fā)源的正常組織有不同程度的差異。腫瘤在本質上是基因病。各種環(huán)境的和遺傳的致癌因素以協(xié)同或序貫的方式引起DNA 損害,從而激活原癌基因和滅活腫瘤抑制基因,加上凋亡調(diào)節(jié)基因和DNA 修復基因的改變,繼而引起表達水平的異常,使靶細胞發(fā)生轉化。被轉化的細胞先多呈克隆性的增生,經(jīng)過一個漫長的多階段的演進過程,其中一個克隆相對無限制的擴增,通過附加突變,選擇性地形成具有不同特點的亞克。ó愘|化),從而獲得浸潤和轉移的能力(惡性轉化),形成惡性腫瘤。腫瘤在所占據(jù)的組織中形成腫塊,其大小、外形、界限、硬度、表面情況、與鄰近組織關系等可作為檢查與診斷腫瘤的依據(jù)。
  目前的癌癥診斷方法,主要是通過觀察顯微鏡下細胞的大小、顏色和形狀來確定腫瘤的類型。這種診療方法建立在形態(tài)學之上,存在很大的缺陷,同一類型的腫瘤可能會出現(xiàn)臨床上的差異,對治療的敏感性不夠。
  腫瘤是由各種致癌因素導致的某些部分組織的細胞克隆性異常,在基因水平上失去對其生長的正常調(diào)控從而增生而成的新生物。腫瘤一般可分為良性和惡性兩大類。惡性腫瘤又稱為癌癥。在2012年,全球約有1410萬新發(fā)癌癥病例,820萬患者死于癌癥。其中57%的癌癥患者以及65%的癌癥死亡患者來自于發(fā)展中國家。作為人類健康的第一殺手,惡性腫瘤已經(jīng)成為我國主要的公共衛(wèi)生問題之一。所以,對腫瘤的預防和治療是全世界關注的焦點。
  按現(xiàn)在的醫(yī)療水平,對早期癌癥患者的治療有80%以上的治愈率;但是,晚期的癌癥患者在治療后很少能生存5年以上。因此,早發(fā)現(xiàn)、早預防、早治療是挽救患者的重要手段。目前的腫瘤診斷方法,主要是通過觀察顯微鏡下細胞的大小、顏色和形狀來確定腫瘤的類型。這種診療方法建立在形態(tài)學之上,存在很大的缺陷,如同一類型的腫瘤可能會出現(xiàn)臨床上的差異,對治療的敏感性不夠。癌癥的發(fā)生是一個多階段逐步演變的過程,在這一過程中,常伴隨著多種基因的改變。從分子生物學水平發(fā)現(xiàn)、識別與癌癥相關的重要基因是生物信息學學習的一個重要課題,對癌癥患者早期診斷和進行個性化治療具有重要意義。它不僅能提高患者的生存率,而且能提高患者的生存質量。
  目前,民眾迫切追求高質量醫(yī)療服務,但是醫(yī)療成本處于單調(diào)遞增狀態(tài),因此提高質量和降低成本已成為醫(yī)療服務業(yè)關注的焦點。一方面,我國醫(yī)院長期以來將重點放在質量管理方面,并取得了較大進步;另一方面,醫(yī)院還需要加強對疾病診斷和治療過程的科學管理,盡量避免治療的隨意性、用藥的盲目性、過度檢查等現(xiàn)象。如今,許多醫(yī)院已經(jīng)意識到該問題,并不斷尋找解決之道。許多嚴重的遺傳病、絕癥等無法用藥物進行有效的治療,唯有探索人類基因的秘密,從基因入口進行學習,才可能從根本上進行解決。



  由于人類基因組(測序)計劃的穩(wěn)步實施以及分子生物學等相關學科的迅速發(fā)展,基因序列數(shù)據(jù)快速增長,更多的微生物與動植物的基因組序列能夠得到測定。所以,如何學習不同基因在生命過程中所擔負的各種功能就成了全球生命科學工作者共同關注的課題。
  基因芯片的出現(xiàn)使同時檢測成千上萬個基因在生物體內(nèi)活性的夢想成為現(xiàn)實。目前,DNA微陣列技術已廣泛應用于醫(yī)學、生物學和信息學學習的各個領域,成為生命科學學習的基本工具,如基因序列分析、癌癥診斷及新藥研發(fā)等。1999年,Golub等在Science上發(fā)表了關于采用基因芯片技術學習癌癥分類問題的文章之后,該學習方向逐漸成為生物信息學領域的學習熱點之一,醫(yī)學、計算機科學、控制科學、生物醫(yī)學等領域的很多學習人員都在該方向做了大量學習,并根據(jù)各自的領域知識提出了大量有效的技術與方法。



  基因芯片技術為解決腫瘤分類問題拓展了新的思路。通過基因芯片獲取腫瘤相關基因表達數(shù)據(jù),對腫瘤進行分類,是腫瘤診斷的一個全新手段,也是計算機科學、生物信息學、生物醫(yī)學等的一個重要交叉學習領域,其可以正確分類組織形態(tài)相似的腫瘤亞型,不僅能發(fā)現(xiàn)腫瘤的致病基因,還能夠挖掘腫瘤發(fā)生的本質。
  基因表達數(shù)據(jù)具有高維、小樣本、分布不平衡和高噪聲等特點。如何對此類數(shù)據(jù)進行模式研究和數(shù)據(jù)挖掘,是當前模式識別和機器研究領域內(nèi)的一個學習熱點和亟待解決的問題。
  基因表達數(shù)據(jù)的模式識別過程為:首先進行原始數(shù)據(jù)預處理,然后進行特征選擇-提取,最后基于特征進行分類。然而在實際環(huán)境下,訓練樣本集的分布通常是不平衡的,即在含有若干個類別的訓練樣本集中每個類別的樣本數(shù)量不相等,甚至相差很多。這種不平衡會使分類器訓練、預測偏向于大類樣本的類別,從而對決策產(chǎn)生不良影響。因此,在實際應用中必須考慮樣本集分布對分類器訓練、預測產(chǎn)生的偏向性。
  為了有效處理基因表達數(shù)據(jù),主要采用神經(jīng)網(wǎng)絡(Neural Networks,NN)、支持向量機(Support Vector Machine,SVM)、超限研究機(Extreme Learning Machine, ELM)以及決策樹(Decision Tree,DT)來設計分類器。為了提高分類系統(tǒng)的穩(wěn)定性,擬利用分類器集成技術,來改進相關算法。分類器集成可以顯著地提高分類器系統(tǒng)的泛化能力和輸出穩(wěn)定性,且已經(jīng)成功地應用到了很多領域,如地震波分類、光學字符識別、人臉識別等。該技術在計算機輔助醫(yī)療診斷方面也具有很好的應用前景。
  具體學習內(nèi)容從數(shù)據(jù)集和分類器兩個方面入手。在數(shù)據(jù)集方面,利用適當?shù)姆椒ㄟM行特征選擇,選擇與分類目標密切相關的基因提高分類器模型的泛化性能;創(chuàng)造性地結合兩種不同的特征選擇算法對基因數(shù)據(jù)集進行特征選擇,能夠有效地克服傳統(tǒng)特征選擇算法的弊端。在分類器方面,構建訓練集,利用集成方法提高旋轉森林(Rotation Forest,RoF)算法的分類精度和穩(wěn)定性;利用改進后的粒子群算法優(yōu)化核超限研究機的內(nèi)權參數(shù),提高分類器的分類精度;根據(jù)輸出不一致測度,進行相異性集成,提高分類模型的分類精度和穩(wěn)定性;通過在超限研究機模型中嵌入誤分代價因素, 實現(xiàn)對腫瘤的代價敏感分類(Cost-Sensitive Classification,CSC)等。



  圖1  學習內(nèi)容框架圖
  上述學習內(nèi)容,構建了一種適用于基因表達數(shù)據(jù)分類問題的算法框架,如 圖1 所示,提高了腫瘤基因表達數(shù)據(jù)的分類精度,一定程度上解決了該學習領域的難點問題,對推進高維、不平衡數(shù)據(jù)的學習具有重要理論意義和實用價值。另外,可將學習成果應用于臨床腫瘤分類診斷,深入學習腫瘤的發(fā)生發(fā)展機理及相關致癌基因的表達與調(diào)控,促進腫瘤的預測和預防工作,提高人類健康水平。更進一步,可以將不平衡數(shù)據(jù)挖掘技術推廣到信用卡欺詐檢測、網(wǎng)絡入侵檢測、故障診斷等眾多應用領域,這將對社會經(jīng)濟的發(fā)展產(chǎn)生重要的推動作用。

識別致病基因的革新技術  |  責任編輯:蟲子
返回頂部