與相關概念的關係
科研大數據再生(簡稱“再生”)與科研大數據共享(簡稱“共享”)的關係:首先,“共享”是較為泛化和籠統的概念,其範疇更為廣泛,而“再生”則更為具體;其次,“共享”體現的是科研大數據的“環境本質”,體現的是一種“氛圍”,而“再生”體現的是科研大數據的“目的本質”和“過程本質”,是“共享”的核心過程;第三,“共享”是“再生”的前提,“再生”是“共享”的成果;“共享”是基礎,而“再生”是升華,是科研數據價值的體現,沒有科研大數據的“共享”難以有科研大數據的“再生”活動,但是沒有“再生”則難以發揮出“共享”的應有價值,“再生(數據)”是科研創新價值的直接體現。
特性
在科研大數據“再生”過程具有以下特性:
1.修復性(Repairability):“再生”的數據是對原來數據的完善性修復。在生態學中,“修復”是指機體一部分損傷後重新生長出與原來部分生態與功能相同的結構,與此類似,科研大數據再生也是對原來數據進行完善、修復,並產生新的數據,由此體現出“修復性”。在實際中,修復的程度可能存在一定的差異,由此形成了不同形式的數據再生(如後面分析)。修復性是科研大數據再生的首要特性。
2.重用性(Reusability):科研大數據再生過程生成的數據是“可重用的”,亦即在原來數據的基礎上其他主體可以進行數據的再利用,從而進一步地發揮數據的價值。重用則主要是指“橫向(同代)數據”的再使用。另外,在實際中,重用可能是“內部的”(即科研主體機構內部再次重用),也可能是“外部的”(即數據被外部科研主體機構重用),無論是哪種“重用”都進一步發揮了數據的價值。重用性是科研大數據再生過程的基本特性。
3.繼承性(Inheritance):科研大數據再生產生的數據繼承了原來數據的結構與功能,從而實現科研數據的功能延續。繼承後的“子代數據”必然具有“父代數據”的特徵,同時又有一些新的特徵,其特點是“縱向”的,這一點與重用性有著顯著不同。繼承性實現了科研數據“生命”的延續,因此該特性是科研大數據再生過程的關鍵特性和拓展特性。
4.可溯源性(Provenance):科研大數據再生過程可以通過相關技術(如區塊鏈技術等)實現科研數據的追本溯源形成完整的科研數據世系(Data Lineage),並確保數據的安全、可靠和完整,以防數據的扭曲和失真。可溯源性可以看成是繼承性的衍生特性(從子代數據可以溯源其父代數據),也是科研大數據再生的過程特性。
5.增值性(Accretion):在科研大數據再生過程中,由於融入了科研創新主體的智慧而使得“舊”數據衍生而成結構、功能更“新”的數據,使得原本可能束之高閣的源數據的價值進一步提升和增值。增值性是科研大數據特性的目標特性。
6.動態演化特性( Dynamic Evolution):科研大數據再生活動並不是靜止不變的,而是隨著環境的變化,參與科研大數據再生活動的“主體”的數量、質量等以及參與科研大數據再生活動的“客體”(一般指數據)的結構、功能、標準、時間、空間等都可能會發生變化,由此使得科研大數據再生活動呈現出動態演化特性。動態演化特性是科研大數據再生的另一個過程特性。
類型
科研大數據再生包括以下類型:
1.從“結構”維度來看,科研大數據再生包括“延續性再生”和“重構性再生”兩類活動:① 延續性再生:即再生的科研數據與原來的結構、功能等基本類似(類似於生態學中的“完全再生”),與源數據相比其“結構”變化較小,其目的是實現科研數據的延續性重用。 ②重構性再生:即新生成的科研數據在“結構”上發生了“重構”,“功能”上雖與源數據有相似之處,但有了質的改變(與生態學中的“不完全再生”類似)。重構性再生數據“結構變化較大”,常常是“父代à子代”的“縱向繼承”。
2.“層級維”再生活動包括“單級再生”和“多級再生”兩類:①單級再生是指由原來的科研數據進行“單次”再生,並產生有價值的新數據的過程。單級再生的過程相對簡單,複雜性較低,但是其他科研數據再生活動的基礎。②多級再生是指科研機構的相關人員在原來科研數據的基礎上,進行了多次數據再生,並產生相應級別的再生數據的過程。相比於單級再生,多級再生更能發揮源數據的價值。
3.“空間維”再生包括“內部再生”和“外部再生”兩類:①內部再生:即科研機構內部相關人員在原來數據的基礎上生成新的有價值的科研數據的再生現象。②外部再生:是指由於科研主體內部科研力量不足,而與外部主體進行合作後進行的科研大數據再生現象。與內部再生相比,外部再生常常給原來的“舊數據”注入新的活力,當然無論是內部再生還是外部再生都進一步發揮了數據的價值。
4.“時間維”再生活動科研大數據永久性再生和臨時性再生:①永久性再生是指在科研創新活動過程中產生的數據需要“永久”存續的再生現象。一般而言,此類再生數據都是重要的需要長期保存的檔案型科研數據。②臨時性再生是指在科研創新過程中產生的數據只是臨時生成的再生現象。臨時性再生產生的數據一般為“中介數據”,常常是服務於永久性再生。
5.“關聯維”再生包括科研大數據強關聯再生和弱關聯再生兩類:①強關聯再生是指再生後的科研數據與原來的數據在功能、結構上存在很“強”的關聯關係。②弱關聯再生是指再生產生的科研數據與原來的數據在功能、結構上關聯程度較“弱”。無論是哪種關聯程度的再生都是可溯源的,只是可溯源的程度存在差異。
6.“利益維”再生涉及利他性再生和他損性再生兩類:①利他性再生即對原來的科研主體或後續的科研主體的科研大數據再生現象。利他性再生是科研大數據發揮價值的重要保障。②他損性再生即對其他科研主體會造成不同程度損壞的科研大數據再生現象。他損性再生常常會造成科研數據的泄露,從而給科研大數據初生主體造成物質上或精神上的損害。