加入VIP 上傳考博資料 您的流量 增加流量 考博報班 每日簽到
   
主題 : 2009年全國優秀博士論文:數據挖掘的建模及在生物信息學中的應用研究
級別: 總版主
顯示用戶信息 
樓主  發表于: 2009-10-10   

2009年全國優秀博士論文:數據挖掘的建模及在生物信息學中的應用研究

作者姓名:沈紅斌   us U6,  
  論文題目:數據挖掘的建模及在生物信息學中的應用研究 K7,Sr1O `  
  作者簡介:沈紅斌,男,1979年8月出生,2004年4月師從于上海交通大學楊杰教授,于2007年3月獲博士學位。 r+a0.  
cVaGgP}\  
  中文摘要 rLp0)Go  
  隨著科學技術的飛速發展,經濟和社會都取得了極大的進步,與此同時,在各個領域產生了大量的數據,如何從這些數據中發現有價值的知識及規律,成為目前理論與實踐研究的熱點與難點。與此同時,生命科學技術的快速發展也產生了大量的生物數據,單純地利用傳統的生物實驗方法將很難快速且全面的處理如此多生物數據,從而必然制約了生命科學及制藥工程的快速發展。在這種情況下,生物信息學應運而生。生物信息學是一門生物學與信息科學交叉而形成的年輕學科,旨在運用信息學、物理學、化學、數學、計算機科學、系統科學的理論和方法來研究生物系統和生物過程的信息量和信息流,在已有數據的基礎之上發現相應的規律和知識并進而用來進一步指導與解釋生物實驗與生命現象,加速對生命本質特征的認識。本論文在數據挖掘及生物信息學理論與方法上進行了深入的研究與探索。 [KEw5-=i@  
  聚類分析是數據挖掘研究中的重要內容,成為各學科研究中的重要工具。但在現實生活中,常常遇到高維數據集的處理且在大多數情況下,這些數據集對于各個聚類存在屬性不平衡的現象。根據這一點,本文創新性提出了在核特征空間中的屬性加權核聚類算法,實驗表明新聚類算法能很好地反映各屬性對于各個聚類的重要性,因而取得了比傳統聚類算法更好的結果。傳統聚類算法的應用對象往往局限于單一獨立的數據集,但在很多情況下一個數據集要和其他數據集相互發生關聯。基于信息理論,本文首先提出了一合作聚類算法,反映了數據集間的相互作用關系,結果表明聚類結果將受到其他數據集的影響。我們同時也從理論上證明了這兩個算法的收斂性。 5hDm[*83  
  蛋白折疊是比蛋白的三維結構更深層次的知識信息,因而是更加困難的研究課題,同時,從蛋白序列預測蛋白折疊類型能夠進一步為預測該蛋白的三維結構提供極有價值的信息。本文從生物系統的復雜性角度出發,創新性地提出了基于集成分類器框架的蛋白折疊預測系統,從多個生物特征角度對序列信息源及特征進行融合決策預測,結果證明所得到的集成預測系統是非常有效的,把蛋白折疊的預測精度提高了6-21%。 s亚洲国产精品va在线观看麻豆