《數據領域名詞解釋》是國家數據局於2024年11月發布的檔案。
《數據領域名詞解釋》對數據資源、數據要素、數據產品、數據資產、數據交易、公共數據、數據倉庫、數據湖、隱私計算、多方安全計算、區塊鏈等數據領域名詞給出了官方釋義。
基本介紹
- 中文名:數據領域名詞解釋
- 發布單位:國家數據局
發展歷史,相關名詞,
發展歷史
2024年10月21日至2024年11月20日,國家數據局微信公眾號就《數據領域名詞解釋》向社會公開徵求意見建議。
2024年11月,國家數據局發布公開徵求意見情況的通告,期間共收到150位社會各界人士的779條意見建議,我們將認真研究,在修改完善時予以充分考慮。感謝社會各界的關心與支持。
相關名詞
1.數據。是指任何以電子或其他方式對信息的記錄。數據在不同視角下表現為原始數據、衍生數據、數據資源、數據產品、數據資產、數據要素等形式。
2.原始數據。是指初次或源頭收集的、未經加工處理的數據。
3.數據資源。是指具有使用價值的數據,是可供人類利用的新型資源。
4.數據要素。是指能直接投入到生產和服務過程中的數據,是用於創造經濟或社會價值的新型生產要素。
5.數據產品。是指基於數據加工形成的,可滿足特定需求的數據加工品和數據服務。
6.數據資產。是指特定主體合法擁有或者控制的,能進行貨幣計量的,且能帶來直接或者間接經濟利益的數據資源。
7.數據要素市場化配置。是指通過市場機制來配置數據這一新型生產要素,旨在建立一個更加開放、安全和高效的數據流通環境,不斷釋放數據要素價值。
8.數據處理。包括數據的收集、存儲、使用、加工、傳輸、提供、公開、刪除等活動。
9.數據處理者。是指在數據處理活動中自主決定處理目的和處理方式的個人或者組織。
10.受託數據處理者。是指接受他人委託處理數據的個人或者組織。
11.數據流通。是指數據在不同主體之間流動的過程,包括數據開放、共享、交易、交換等。
12.數據交易。是指數據供方和需方之間進行的,以數據或者數據各類形態為標的的交易行為。
13.數據互動。是指主體之間以數據的形式進行交流和協作的過程。
14.數據治理。是指提升數據的質量、安全、合規性,推動數據有效利用的過程,包含組織數據治理、行業數據治理、社會數據治理等。
15.數據安全。是指通過採取必要措施,確保數據處於有效保護和合理利用的狀態,以及具備保障持續安全狀態的能力。
16.公共數據。是指各級黨政機關、企事業單位依法履職或提供公共服務過程中產生的數據。
17.數字產業化。是指新一代移動通信、人工智慧等數位技術向數字產品、數字服務轉化,數據向資源、要素轉化,形成數字新產業、新業態、新模式的過程。
18.產業數位化。是指傳統的農業、工業、服務業等產業通過套用數位技術、採集融合數據、挖掘數據資源價值,提升業務運行效率,降低生產經營成本,進而重構思維認知,整體性重塑組織管理模式,系統性變革生產運營流程,不斷提升全要素生產率的過程。
19.數字經濟高質量發展。圍繞加快培育新質生產力,以數據要素市場化配置改革為主線,協同完善數據基礎制度和數字基礎設施,全面推進數位技術和實體經濟深度融合,持續提升數字經濟治理能力和國際合作水平,實現數位技術革命性突破、數據要素創新性配置、傳統產業數位化轉型和適數化改革,通過數字經濟創新發展賦能經濟社會高質量發展。
20.數字消費。是指數字新技術、新套用支撐形成的消費活動和消費方式,既包括對數智化技術、產品和服務的消費,也包括消費內容、消費渠道、消費環境的數位化與智慧型化,還包括線上線下深度融合的消費新模式。
21.產業網際網路。是指利用數位技術、數據要素推動全產業鏈數據融通,賦能產業數位化、網路化、智慧型化發展,推動業務流程、組織架構、生產方式等重組變革,實現產業鏈上下游協同轉型、線上線下融合發展、全產業降本增效與高質量發展,進而形成新的產業協作、資源配置和價值創造體系。
22.城市全域數位化轉型。是指城市以全面深化數據融通和開發利用為主線,綜合利用數位技術套用和制度創新工具,實現技術架構重塑、城市管理流程變革和產城深度融合,促進數位化轉型全領域增效、支撐能力全方位增強、轉型生態全過程最佳化的城市高質量發展新模式。
23.“東數西算”工程。是把東部地區經濟活動產生的數據和需求放到西部地區來計算和處理,對數據中心在布局、網路、電力、能耗、算力、數據等方面進行統籌規劃的重大工程,比如人工智慧模型訓練推理、機器學習等高時延業務場景,可以通過“東數西算”的方式讓東部業務向西部風光水電豐富的區域遷移,實現東西部協同發展。加快推動“東數西算”工程建設,將有效激發數據要素創新活力,加速數字產業化和產業數位化進程,催生新技術、新產業、新業態、新模式,支撐經濟高質量發展。
24.高速數據網。是指面向數據流通利用場景,依託網路虛擬化、軟體定義網路(SDN)等技術,提供彈性頻寬、安全可靠、傳輸高效的數據傳輸服務,具有高頻寬、低延遲、高可靠性、高安全性、可擴展性、靈活性等特點。
25.全國一體化算力網。是指以信息網路技術為載體,促進全國範圍內各類算力資源高比例、大規模一體化調度運營的數字基礎設施。作為“東數西算”工程的2.0版本,具有集約化、一體化、協同化、價值化四個典型特徵。
26.元數據。關於數據或數據元素的數據(可能包括其數據描述),以及關於數據擁有權、存取路徑、訪問權和數據易變性的數據。
27.結構化數據。一種數據表示形式,按此種形式,由數據元素匯集而成的每個記錄的結構都是一致的並且可以使用關係模型予以有效描述。
28.半結構化數據。不符合關係型資料庫或其他數據表的形式關聯起來的數據模型結構,但包含相關標記,用來分隔語義元素以及對記錄和欄位進行分層的一種數據化結構形式。
29.非結構化數據。是指不具有預定義模型或未以預定義方式組織的數據。
30.數據分析。是指利用技術手段,對數據進行分析,發揮數據作用、釋放數據價值的過程。
31.數據挖掘。是數據分析的一種手段,是從大量數據中通過算法搜尋隱藏於其中信息的過程。
32.數據可視化。是指將數據以圖表、圖形、地圖等可視化形式展示,以便更好地理解和分析數據。
33.數據倉庫。是指一個面向主題的、集成的、相對穩定的、反映歷史變化的數據集合,通常用於支持企業或組織的決策分析處理。
34.數據湖。是指一種高度可擴展的數據存儲架構,它專門用於存儲大量原始數據,這些數據可以來自各種來源並以不同的格式存在,包括結構化、半結構化和非結構化數據。
35.湖倉一體。是指一種新型的開放式的存儲架構,打通了數據倉庫和數據湖,將數據倉庫的高性能及管理能力與數據湖的靈活性融合起來,底層支持多種數據類型並存,能實現數據間的相互共享,上層可以通過統一封裝的接口進行訪問,可同時支持實時查詢和分析,為企業進行數據治理帶來了更多的便利性。
36.隱私計算。是指在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算的一類信息技術,保障數據在產生、存儲、計算、套用、銷毀等數據流轉全過程的各個環節中“可用不可見”。隱私計算的常用技術方案有多方安全計算、聯邦學習、可信執行環境、密態計算等;常用的底層技術有混淆電路、不經意傳輸、秘密分享、同態加密等。
37.多方安全計算。是指在無可信第三方的條件下,通過特殊設計的密碼學算法和協定,允許多個參與方在不泄露各自隱私數據的前提下,協同完成計算任務。
38.聯邦學習。是指多個參與方在不共享原始數據的情況下協作完成機器學習任務的方法。
39.可信執行環境。是指提供基於硬體級的系統隔離和可信根,支持基於技術信任的數據安全保障能力,保證在安全區域內部載入的代碼和數據在保密性和完整性方面得到保護。
40.密態計算。是指通過綜合利用密碼學、可信硬體和系統安全的可信隱私計算技術,其計算過程實現數據可用不可見,計算結果能夠保持密態化,以支持構建複雜組合計算,實現計算全鏈路保障,防止數據泄漏和濫用。
41.區塊鏈。是指使用密碼連結將共識確認的區塊按順序追加形成的分散式賬本。