柳州市中小企業協會
搜索

KISTI,世界上最大的全長基因組連鎖分析并行化

發表時間:2022-04-01 09:14作者:孫英珠來源:KISTI ??


- 通過并行計算技術實現全基因組統計糾錯計算的優化 -


A. )MPI-GWAS 算法示意圖:用于快速計算隨機排列組合(N-Permutations)

通過 MPI-Rank 進行同步/并行分析


性能評估結果:(B)確認通過增加并行處理節點來減少總計算時間

(C) 由于數據和并行處理節點的同時增加,確認執行時間的可伸縮性


20220330090432290_7O4YAXFA.jpg


韓國科學技術信息研究所(Jae-soo Kim 院長,以下簡稱 KISTI)宣布,它已開發出一種大型超級計算軟件(SW),以糾正全基因組關聯研究(GWAS)的統計錯誤*。


* 這是指根據大規模全基因組分析的統計顯著性計算結果報告為假陽性的現象。GWAS領域的假陽性是一個代表性案例,據報道,與疾病相關性低的基因突變與疾病發病高度相關。

   

使用 KISTI 國家超級計算機 No. 5 Nurion 開發的 SW,通過 GWAS 計算,根據 7,523 個韓國隊列和 4,242 個英國隊列中報告的 84,295 個基因突變,得出與糖尿病和高血壓相關的基因突變,并得出高達 70 億的統計誤差。通過執行一個以上的隨機排列來糾正。


這個超級計算模擬軟件同時使用了國家超級計算機5號Nurion的多達2500個節點*,與現有的統計程序相比,可以將計算速度提高300%以上。


* 是能夠進行約 7.5 pataflops(1 pataflops = 1000 萬億次計算/秒)的高性能計算的級別,約占 KISTI Supercomputer Unit 5 性能的 25%。


GWAS分析結果旨在篩選與表型(病害或果重等)相關的基因突變,發現重大疾病相關基因突變被認為是實現個體化醫療保健和新品種改良的重要指標。牲畜和畜場。有。因此,必須糾正 GWAS 分析結果的統計誤差。


由于其廣泛的計算,GWAS 分析的統計誤差校正仍然是該領域的研究挑戰。KISTI 已經證實,通過基于大規模超級計算的 pataflops 規模計算,可以通過計算并行化技術來糾正現有的統計錯誤。使用 KISTI 的國家超級計算機 No. 5 Nurion 以世界上最大的規模(7.5 petaflops)執行 GWAS。


Oh-Kyung Kwon 博士和 Hyo-Jeong Baek 博士說:“這個與 GWAS 相關的并行化軟件已經發布了源代碼*,以便各種基因組研究人員可以自由使用它,因此在基因組領域使用超級計算機的研究效率是值得期待的。 ” 相關研究將于 3 月 31 日發表在國際期刊 Genomics & Informatics** 上。


* https://github.com/hypaik/proj_MPIGWAS


** Paik 等人,MPI-GWAS:一種用于全基因組關聯研究的超級計算輔助排列方法(將于 2022 年 3 月 31 日出版,Genomics & Informatics)


KISTI 超級計算應用中心主任 Jeong Min-joong 說:“KISTI 為需要大規模計算的超級計算機用戶提供最佳的并行化*技術和計算資源。預計分布式超級計算仿真軟件將能夠提高生物和醫學領域的研究效率?!?/span>


* 最佳并行化是一種通過開發可以由超級計算機中的數千個 CPU 同時執行的代碼來解決難題的技術。




(編輯:李成義)