|
數據保存及再利用
前沿物理大科學裝置的建造、維護和數據采集消耗了大量的人力、物力,因此實驗數據是極其寶貴的。科學家對數據的利用不會隨著數據采集的結束而立即停止,很多實驗在數據采集結束后的若干年內,仍然在進行數據分析研究并有相關的論文發表。不同大科學裝置的數據具有唯一性,隨著理論研究的進步和分析手段的提高,舊的實驗數據中可能會有新的科學發現。另外,對不同實驗的新、舊數據的聯合分析和交叉驗證,能夠提高科學發現的精度和可信度。大科學裝置的數據的另一個重要用途是提供給大專院校和中小學校用于教學和科普。由此可見,前沿物理大科學裝置的數據的長期保存具有極其重要的意義。
數據的保存不僅僅是實驗采集的數據,還應該包括知識庫。所謂知識庫包含描述實驗條件的參數、分級數據所用的軟件、文檔以及其他數據分析所需的資料。所以這些信息是保證正確進行數據再利用和分析的必要條件。后續數據分析的類型不同,有些數據分析需要使用實驗的原始數據,有些只需使用經過處理的高級數據,這對數據的長期保存提出不同要求。以高能物理為例,國際高能物理領域成立了數據長期保存合作組?DPHEP?(中國科學院高能物理研究所是發起單位之一),并編寫了數據長期保存技術白皮書。該白皮書對數據和知識庫的保存、相關技術及策略進行了詳盡的描述。我國前沿物理大科學裝置的數據策略缺乏系統的數據長期保存及再利用的規劃及策略,因此該白皮書對國家制定相關政策具有很好的參考意義。此外,我國的經費資助基本是針對項目的,當大裝置運行結束后,很難得到對數據保存給予支持的后續經費。因此,應建立相應的資助機制,以確保大科學裝置運行結束后數據的長期保存和高效再利用。