2017年3月8日 星期三

利用電腦深度學習「基因文法」 發現導致疾病遺傳因子

在本世紀初,科學家第一次完成人類完整的 DNA 序列排序。十多年以來,科學家及研究者一直試圖從這些 DNA 序列中,嘗試找出究竟是何種基因突變會造成疾病的產生?而現今這個令人類上下求索的問題,似乎有望得到解答。


一群加拿大多倫多的研究團隊,利用一項新的電腦運算技術,從中發現了過往無法預測的疾病決定因子,像是自閉症、遺傳性疾病等。這群科學家把 DNA 當做一門困難的、陌生的語言,這種語言具有數以億計的字母,每個字母的組合,都像是未知的祕密等待人們去破解。他們解讀這種語言的切入點,首先是去研究人類細胞讀取 DNA 的方式,並且將所有基因突變的可能性排列出來,以便瞭解這些變化所會造成的疾病。研究團隊認為過往的科學家似乎見樹不見林,只找出會造成疾病的基因突變,但問題是——— 為什麼基因突變就會導致疾病呢?

過往的研究已經得知,在把 DNA 轉換成蛋白質的「RNA 剪接(RNA splicing)」過程裡,若發生中斷或者混亂就會產生疾病。而多倫多的研究團隊卻採取不同的路徑,他們首先檢視由內含子 (intron) 主導的 RNA 剪接過程。過往的的研究只把焦點放在 轉譯為蛋白質的外顯子(exon)突變,卻遺忘雖未被轉譯,但也決定蛋白質生成過程的內含子(intron)。

這項艱難的研究受惠於電腦「深度學習(deep learning)」的技術,讓電腦在掃描 DNA 的片段後,讀取相關的基因指令,理解蛋白質的拼貼過程,以及隨後生產的特定蛋白質。「深度學習」夠解讀複雜的生物及藥理關係。研究團隊利用電腦的「深度學習」去尋找 RNA 剪接過程中所產生的錯誤及突變,並且發現預測準確度高達 9 成。包括過去那些已經被完整研究的疾病,像是直腸癌、脊髓性肌肉萎縮症,並且還能預測過去未被了解過的突變。

未來研究團隊預計繼續研究「自閉症光譜(autism spectrum)」。過往已經知道的自閉症光譜基因突變,只有寥寥十幾個,採用深度學習後,多倫多的研究團隊新發現 39 個自閉症光譜的基因突變可能性。而深度學習還能夠被運用在調查不同的疾病以及在個體之間非疾病的特徵等,這項深度學習的電腦調查就像一台新一代的翻譯機,未來或許將能在醫學療程中提供提供個人化藥物一些不可或缺重要訊息與幫助,給予醫學療程中不可或缺的幫助。


文章來源:利用電腦深度學習「基因文法」 發現導致疾病遺傳因子

沒有留言:

張貼留言