|
中國網/中國發展門戶網訊 2007?年圖靈獎得主吉姆?·?格雷(Jim Gray)發表了著名演講《科學方法的革命》,將科學研究分為?4?類范式(paradigm),即實驗歸納、模型推演、仿真模擬和數據密集型科學發現(data-intensive scientific discovery),從而提出了被廣泛稱為“第四范式”的“科學大數據”新視角。經過10年的技術發展,深度學習等先進技術在圖像、語音、自然語言等人工智能領域均取得突破進展。在自然科學領域,近年來科學家們也緊跟趨勢,基于科學大數據驅動的新模式,采用深度學習等新技術,取得了一批重大科學發現成果,發表在?Science、Nature等權威學術刊物。然而,大數據驅動的科學研究工作因為嚴重依賴于先進的信息技術,對于大多數科學家團隊而言仍具有一定門檻。
多學科、跨領域交叉背景下的科學大數據挖掘分析與知識發現,依賴于構建一套高效、易用、可擴展的科學大數據智能分析軟件系統,為復雜數據處理、分析、模式提取和知識發現提供學習模型、算法及開發工具支持。通過分析該領域發展現狀,我們發現,一些分析軟件因為運行在單機環境而無法處理大規模數據,一些分析軟件因需要較高的編程開發技能而令科學家團隊望而卻步。隨著云計算、大數據和人工智能技術的發展,利用云計算平臺承載人工智能技術進行大數據智能分析已經成為趨勢,而開放共享與個性化定制也成為軟件發展的主流方向。從中可以總結出科學大數據智能分析軟件的五大發展趨勢:AI?賦能、一體化、云服務、開放共享和可定制。
筆者通過對眾多科學家進行需求調研,結合大數據智能分析技術及軟件的發展趨勢,提出了一個面向科學大數據的一體化、可定制的智能分析框架,支持科學家交互式的構建智能分析模型,并基于云平臺分布式計算引擎實現分析模型的高效執行,為快速開展科學發現研究提供系統和工具支撐。期望通過該智能分析框架的研發與應用,為下一代科學大數據智能分析軟件提供參考方案。