登錄
微信登錄
打開手機微信,掃描二維碼
掃描成功
請勿刷新本頁面,按手機提示操作
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您的微信還未注冊
中科曙光不會以任何理由要求您轉賬匯款,謹防詐騙
您可以同時關注中科曙光微信公眾號
使用微信掃一掃即可登錄! 查閱資料更方便、 快捷!
您已經注冊賬號和
關注微信公眾號
2025年1月
服務熱線:400-810-0466
發布時間: 2018-06-20
2018年5月8日,闡述我國科研人員在棉花變異基因組研究中取得重大進展的兩篇論文同時在國際學術權威刊物《Nature Genetics》在線發表,中國農科院棉花研究所(棉研所)、安陽工學院重點參與了兩篇論文的研究項目。這兩項研究成果為棉花遺傳研究和分子育種奠定了科研基礎,為深化作物基因組研究提供了重要依據。這其中離不開現代技術對樣本基因的深入研究。
在其中一篇論文所闡述的“亞洲棉多樣性及演化的遺傳學基礎研究”項目中,曙光針對項目特點,為其提供了總體運算峰值13.248 TFLOPS(13.248萬億次浮點運算/秒)、總存儲容量2PB(聚合帶寬15GBps以上)的基礎環境,充分支撐了對243份二倍體棉花種質材料的重測序,研究結果加深了我們對中國亞洲棉群體進化的認識,為將二倍體棉花優良抗逆性狀導入廣泛種植四倍體棉花奠定了重要的遺傳基礎,同時也會加快棉花育種進程。曙光自主研發的ParaStor系統在該研究的基礎環境中發揮了重要作用。
性能高效,縮短測序時間的利器
在基因數據的應用過程中,科研人員都希望能夠在盡可能短的時間內完成測序工作,使結果盡早實現科研或商業化應用。但在測序過程中會產生大到GB,小到KB的數以十億計的業務數據。如何在隨機讀、并發讀、順序讀等多種讀寫模式下從海量存儲中快速獲取基因數據成了科研人員要面臨的挑戰。
曙光ParaStor系統通過獨有的小文件聚合技術,將眾多較小的block聚合成一個較大的數據流,充分利用ParaStor數據節點10Gb的帶寬性能,滿足快速存儲與讀寫需求。在文件分布策略上,ParaStor通過文件切片及N+M糾刪碼的冗余機制,能夠把單個文件系統擴展到EB級規模,極大地改善了磁盤子系統的性能。ParaStor在研究過程中連續多次擴容,實現了存儲性能和容量的線性增長,大幅提升了業務計算性能。ParaStor的緩存加速功能,則自動將熱點基因數據存放在快速訪問上,實現訪問加速。多項技術共同造就了ParaStor的卓越性能,幫助科研人員完成挑戰,實現重測序工作的高效進行。
運行穩定,保證測序業務的不中斷
大量重測序數據的處理,對存儲系統造成了非常大的訪存壓力。同時,任何的IO中斷都會影響測序計劃。而在使用過程中,硬盤、節點、網絡等硬件設備卻是“故障高發地”,如何保證基因測序工作穩定進行顯得尤為重要。
ParaStor在設計時就把重要部件發生問題作為常態考慮在內,在控制器、網絡、磁盤等層面都設計了冗余保護,可容忍多塊硬盤或多個節點同時失效,且失效后業務不中斷、數據不丟失,大大提高了系統的可靠性,為重測序工作的穩步推進提供了有力保障。
管理自動化,簡化測序工作的復雜度
在研究過程中,科研人員更愿意將精力投入到數據處理和分析中,盡可能減少在IT設施運維上的精力分散,ParaStor易管理的特點則充分滿足其需求。
ParaStor內置的自動管理機制極大簡化了管理員的操作,多樣的報警機制則可及時可靠地將故障通知給管理員,減少運維時間成本。利用ParaStor的管理工具,管理員可通過瀏覽Web頁面輕松完成系統的部署、監控、管理和維護。管理工具的架構同樣具有良好的擴展性,使管理員的工作量不會因數據的增加而加大。
曙光ParaStor分布式存儲系統有效提升了基因測序的工作效率,保證了測序工作的順利進行,減輕了運維人員的壓力,為科研人員專注于核心工作,取得成果突破提供了有力支撐。曙光將充分發揮在信息技術領域積累的豐富經驗與技術優勢,為前沿科學技術研究提供強有力的IT支持,助力建設創新型國家和世界科技強國目標的早日實現。