曰批免费视频播放免费,一区二区三区四区无码日韩,无码不卡免费v片在线观看,久久婷婷人人澡人人9797

 
 

生物醫(yī)學(xué)大數(shù)據(jù)發(fā)展的新挑戰(zhàn)與趨勢

發(fā)布時(shí)間:2018-09-07 11:49:40  |  來源:中國網(wǎng)·中國發(fā)展門戶網(wǎng)  |  作者:張國慶 李亦學(xué) 王澤峰 趙國屏  |  責(zé)任編輯:趙斌宇
關(guān)鍵詞:生物醫(yī)學(xué),大數(shù)據(jù),整合,交互,數(shù)據(jù)挖掘

 

中國網(wǎng)/中國發(fā)展門戶網(wǎng)訊  人類基因組計(jì)劃啟動(dòng)以來,以新一代測序技術(shù)和質(zhì)譜技術(shù)為代表的各類組學(xué)技術(shù)的飛速發(fā)展,推動(dòng)了基因組、轉(zhuǎn)錄組、表觀遺傳組、蛋白質(zhì)組、代謝組等海量生命科學(xué)組學(xué)數(shù)據(jù)的指數(shù)級的增長。一方面,機(jī)器學(xué)習(xí)和人工智能技術(shù)極大提升了醫(yī)學(xué)影像和分子影像技術(shù)的分析能力,正在改變以影像組、放射組為代表的醫(yī)學(xué)影像數(shù)據(jù)的應(yīng)用方式。高通量實(shí)驗(yàn)技術(shù)的突破,直接把生物醫(yī)學(xué)數(shù)據(jù)從以基因組為代表的?PB?量級時(shí)代推升到多組學(xué)融合的?EB?量級時(shí)代。另一方面,人群隊(duì)列研究、分子流行病學(xué)研究產(chǎn)生了大量長時(shí)間、廣空間的數(shù)據(jù),表型組從分子、細(xì)胞、組織、器官、個(gè)體等多層面描述了高維數(shù)據(jù),真實(shí)世界數(shù)據(jù)(real world data)回顧性地匯總分析海量的臨床信息數(shù)據(jù),這些數(shù)據(jù)構(gòu)成了復(fù)雜的高維度生物醫(yī)學(xué)大數(shù)據(jù)。

我們已經(jīng)進(jìn)入了具備相當(dāng)深度和廣度的生物醫(yī)學(xué)大數(shù)據(jù)時(shí)代。生物醫(yī)學(xué)臨床數(shù)據(jù)呈現(xiàn)數(shù)量巨大、增長迅速、質(zhì)量控制困難、來源廣泛繁雜、難以標(biāo)準(zhǔn)化與結(jié)構(gòu)化等特點(diǎn),生物醫(yī)學(xué)研究數(shù)據(jù)呈現(xiàn)種類繁多、內(nèi)部結(jié)構(gòu)高維復(fù)雜、內(nèi)涵豐富、數(shù)據(jù)相對分散、難以高維度多層次交匯共享等特點(diǎn),生物醫(yī)學(xué)數(shù)據(jù)總體表現(xiàn)為數(shù)據(jù)零散分布、難以有效整合分析,從而導(dǎo)致難以挖掘生物醫(yī)學(xué)大數(shù)據(jù)的潛在高價(jià)值。對我國生物醫(yī)學(xué)而言,數(shù)據(jù)無匯交機(jī)制,導(dǎo)致存儲碎片化、管理分散、流失損耗嚴(yán)重;數(shù)據(jù)無安全保障,無國際交流窗口,被迫持續(xù)成為世界最大組學(xué)數(shù)據(jù)輸出國;數(shù)據(jù)無共享平臺,標(biāo)準(zhǔn)化管理混亂,質(zhì)量參差不齊,開放共享受國際、國內(nèi)的政策與技術(shù)的雙重限制。

生物醫(yī)學(xué)研究正在發(fā)生面向數(shù)據(jù)密集型的第四科學(xué)范式的深刻變革,如何實(shí)現(xiàn)從“組學(xué)”到臨床與健康人群數(shù)據(jù)的生物醫(yī)學(xué)大數(shù)據(jù)的交匯、綜合管理、利用和共享,將多層次臨床與研究數(shù)據(jù)進(jìn)行深度挖掘和高維度、全方位的有機(jī)整合,將大數(shù)據(jù)迅速轉(zhuǎn)化為新知識,成為我們所面臨的挑戰(zhàn),其中研究建設(shè)下一代生物醫(yī)學(xué)大數(shù)據(jù)存儲、共享和轉(zhuǎn)化中心的關(guān)鍵要素(圖?1)。

以遞交為基礎(chǔ)、以整合為導(dǎo)向的數(shù)據(jù)存儲

早在?20?世紀(jì)?80—90?年代,美國、歐洲和日本即已分別建立世界三大生物數(shù)據(jù)中心,即美國國家生物技術(shù)信息中心(NCBI)、歐洲生物信息研究所(EBI)和日本DNA?數(shù)據(jù)庫(DDBJ)。這三大數(shù)據(jù)中心經(jīng)過近?3?0年的建設(shè),已經(jīng)形成了完備的數(shù)據(jù)匯交技術(shù)體系,在基因組、轉(zhuǎn)錄組、蛋白質(zhì)組等領(lǐng)域發(fā)揮著重要影響力。國內(nèi)機(jī)構(gòu)也已經(jīng)開始按照數(shù)據(jù)類型建設(shè)了?GSA[12]、iPROX、WDCM[13]等基因組、蛋白質(zhì)組、微生物資源等組學(xué)數(shù)據(jù)中心。我國健康醫(yī)療大數(shù)據(jù)中心的“1+5+X”規(guī)劃已經(jīng)落地,即國家數(shù)據(jù)中心與江蘇、福建、山東、安徽、貴州的東、南、西、北、中?5?個(gè)健康醫(yī)療大數(shù)據(jù)區(qū)域中心已經(jīng)形成,將容納全體公民健康醫(yī)療大數(shù)據(jù)。

各類已建、在建的生命科學(xué)和健康醫(yī)療數(shù)據(jù)中心,極大地豐富了生命科學(xué)、臨床醫(yī)療等生物醫(yī)學(xué)大數(shù)據(jù)的采集能力。但是隨著數(shù)據(jù)規(guī)模的增加,如何更加有效地利用數(shù)據(jù)成了挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)模型和數(shù)據(jù)組織方式,已經(jīng)無法滿足海量數(shù)據(jù)的結(jié)構(gòu)、數(shù)量快速增長以及數(shù)據(jù)結(jié)構(gòu)不斷變化的管理需求,難以按照實(shí)際情況動(dòng)態(tài)調(diào)整。對于已有或者將要建設(shè)的綜合性生物醫(yī)學(xué)大數(shù)據(jù)平臺而言,有必要突破傳統(tǒng)的嚴(yán)格按照一類數(shù)據(jù)建設(shè)一個(gè)數(shù)據(jù)庫的模式,采用新的倉儲式的數(shù)據(jù)倉庫模式,在底層數(shù)據(jù)結(jié)構(gòu)上以整合為導(dǎo)向,按照樣本、宿主、環(huán)境等信息,以及時(shí)間、空間信息,預(yù)留不同類型的數(shù)據(jù)之間的聯(lián)系,形成彈性的數(shù)據(jù)結(jié)構(gòu),支持?jǐn)?shù)據(jù)結(jié)構(gòu)動(dòng)態(tài)調(diào)整,為后期數(shù)據(jù)集成與整合工作奠定堅(jiān)實(shí)的基礎(chǔ)。

1  2  3  >  


返回頂部