FOREXBNB獲悉,11月22日,國家數據局發布向社會公開徵求《國家資料基礎建設指引(徵求意見稿)》意見的公告。其中提到,2027—2028年,建成支撐資料規模化流通、互聯互通的資料基礎設施,數網、數算相關設施充分融合,基本形成跨層級、跨地域、跨系統、跨部門、跨業務的規模化資料可信賴流通利用格局,實現全國大中型城市基本覆蓋。
到2029年,基本上建成國家資料基礎設施主體結構,初步形成橫向聯通、縱向貫通、協調強大的國家數據基礎設施基本格局,建構協同聯動、規模流通、高效利用、規範可信賴的資料公共服務體系,協同構築資料基礎設施技術與產業良好生態,國家資料基礎建設與運作體制機制基本建立。
意見稿也提到,推動東中西部算力協同。加強新興網路技術創新應用,優化網路計費方式,降低東西部資料傳輸成本,促進東部中高延遲業務向西部轉移。建構算力多層調度策略引擎,實現跨平台、跨層級、跨區域的算力資源混合部署和統一調度,促進算力資源高效對接,提升資料匯聚、處理、流通、交易效率。推動國家樞紐節點與需求地之間400G/800G高頻寬全光連接,引導電信業者提升“公共傳輸通道”效能,推進算網深度融合。
原文如下:
國家資料基礎建設指引(徵求意見稿)
前 言
黨的十八大以來,以習近平同志為核心的黨中央,敏銳掌握新一輪科技革命與產業變革的新機遇,統攬中華民族偉大復興的戰略全局與世界百年未有之大變局,對發展數位經濟做出重大部署,擘畫了新時代數位中國建設的宏偉藍圖。
黨的二十屆三中全會明確提出“建設和運營國家數據基礎設施,促進數據共享”。各地區各部門認真貫徹落實習近平總書記重要指示精神,積極探索數據基礎設施建設,為資料要素市場化配置改革、建構全國一體化資料市場奠定了良好基礎。同時也要看到,數位經濟蓬勃發展對數據流通利用和價值釋放提出了新的更高的要求,迫切需要更好發揮有為政府和有效市場作用,建構兼顧效率與公平、適應資料要素特徵、發揮數據價值效用的國家數據基礎設施。
依照黨中央、國務院決策部署,國家發展與改革委員會、國家數據局、工業和資訊化部在充分調查的基礎上,組織編制了《國家資料基礎建設指引》,力爭在當前情況下,說清楚數據基礎設施的概念、發展願景和建立目標,指導推動數據基礎建設,推動形成橫向聯通、縱向貫通、協調強大的國家數據基礎設施基本格局,打通資料流通動脈,暢通資料資源循環,促進數據應用開發,培養全國一體化數據市場,夯實數位經濟發展基礎,為數位中國建設提供有力支撐。
一、概念內涵
縱觀人類經濟發展史,每一輪產業變革都會孕育新的基礎設施。農業經濟時代,基礎設施主要是農田水利設施。工業經濟時代,公路、鐵路、港口、機場、電力系統等成為新的基礎設施。數位經濟時代,網路設施、算力設施、應用設施等建構了數位基礎設施。目前,數據成為關鍵生產要素,催生新的技術—經濟範式,重塑產業發展方式,推動數位基礎設施向數據基礎設施延伸和拓展。建設和運營國家數據基礎設施,進一步促進數據“供得出、流得動、用得好、保安全”,對於支撐數據基礎制度落地、建構全國一體化數據市場、培育發展新質生產力具有重要意義。
國家資料基礎設施是從資料要素價值釋放的角度出發,面向社會提供數據採集、匯聚、傳輸、加工、流通、利用、營運、安全服務一類的新型基礎設施,是整合硬體、軟體、模型演算法、標準規範、機制設計等在內的有機整體。國家數據基礎設施在國家統籌下,由區域、產業、企業等各類資料基礎設施共同構成。網路設施、算力設施與國家資料基礎設施緊密相關,並透過迭代升級,不斷支撐資料的流通和利用。
二、發展願景
(一)主要目標
國家資料基礎設施是資料基礎制度和先進技術落地的重要載體。在數據流通利用方面,建成支持全國一體化數據市場、保障資料安全自由流動的流通利用設施,形成協同聯動、規模流通、高效利用、規範可信賴的資料流通利用公共服務體系;在算力底座方面,建構多元異構、高效調度、智能隨需、綠色安全的高品質算力供給體系;在網路支撐方面,建置泛在靈活接入、高速可靠傳輸、動態彈性調度的資料高速傳輸網絡;在安全方面,建構整體、動態、內生的安全防護體系;在應用方面,支援傳統產業轉型升級,賦能人工智慧等新興產業發展。整體實現“匯通大量數據,惠及千行百業,慧見數位未來”的美好願景。
(二)推進路徑
目前,我國資料基礎建設處於起步建設階段,圍繞流通利用業務場景,各地方各行業各領域探索形成多種有針對性的技術方案和解決路徑,並不斷迭代發展。在推動技術設施化過程中,要注重發揮有為政府和有效市場雙重作用,堅持自上而下佈局、由下而上探索雙向協同,鼓勵大膽創新,支援先行先試,加快科技收斂,推動技術規模化部署、系統化應用,為建構高速互聯、高效調度、開放普惠、安全可靠的國家資料基礎設施奠定堅實基礎。
2024—2026年,利用2—3年左右時間,圍繞重要產業領域和典型應用場景,進行數據基礎設施技術路線試點試驗,支援部分地方、產業、領域先行先試,豐富解決方案供給。制定統一目錄標識、統一身分登記、統一介面要求的標準規範,夯實資料基礎設施互聯互通技術基礎。完成國家資料基礎建設頂層設計,明確國家資料基礎建設的技術路線與實務路徑。
2027—2028年,建成支撐資料規模化流通、互聯互通的資料基礎設施,數網、數算相關設施充分融合,基本形成跨層級、跨地域、跨系統、跨部門、跨業務的規模化資料可信賴流通利用格局,實現全國大中型城市基本覆蓋。
到2029年,基本上建成國家資料基礎設施主體結構,初步形成橫向聯通、縱向貫通、協調強大的國家數據基礎設施基本格局,建構協同聯動、規模流通、高效利用、規範可信賴的資料公共服務體系,協同構築資料基礎設施技術與產業良好生態,國家資料基礎建設與運作體制機制基本建立。
三、整體功能
數位中國、數位經濟、數位社會建構提出了數據要素化、資源化、價值化要求,國家數據基礎設施圍繞打造高速互聯、高效調度、可信賴流通、安全可靠的體系化能力,持續賦能各產業數據融合與智慧化發展。
(一)資料可信賴流通:開放普惠的資料流通
國家資料基礎設施需要打造低成本、高效率、可信賴的流通環境,方便人、物、平台、智慧體等快速接入,在符合統一目錄標識、統一身分登記、統一介面規範的基礎上,實現數據在不同組織、產業之間安全有序流動,精準匹配數據供需關係,面向電子商務、金融支付、跨境物流、航運貿易等典型場景創新融合數據應用,同時符合相關法規、社會倫理、個人隱私保護等要求。
(二)高效算力供給:多元異構的算力協同
算力資源多元異構、異地分佈、動態變化,給大規模運算任務的統一調度與任務協同帶來挑戰。面向“東數西算”等場景中對異體異構異地算力的調度需求,需要建立多元異構算力統籌調度的能力,實現算力和運力的高度融合,實現算力資源之間的無縫對接與協同計算,提高整體運算效率與資源利用率,實現算力最優配置與動態調整。
(三)資料高速傳輸:高效率的資料傳輸網絡
高效有彈性的傳輸網路可為數位金融、智慧醫療、交通物流、大模型訓練和推理等核心場景資料傳輸流動提供高速穩定服務。國家資料基礎設施在高效率彈性傳輸網路的支撐下,能够显著提升数据交换性能,降低資料傳輸成本,為資料大規模共享流通提供高品質通道。
(四)全程安全可靠:動態全面的安全保障
數據採集、匯聚、傳輸、加工、流通、利用、營運等多樣化活動,涉及多方主體、多個環節,需要在開放環境下對資料進行整體、動態保護。國家數據基礎設施需要建構標準化、多層次、全方位的安全防護框架,推动安全防护由静态保护向動態保護、由邊界安全向內生安全、由封閉環境保護向開放環境保護轉變,形成貫穿資料全生命週期各環節的動態安全防護能力,系統保障與資料基礎設施相關的網絡、算力、資料安全。
四、整體架構
(一)技術架構
圖1 国家数据基础设施总体架构圖
國家數據基礎設施具有數據採集、匯聚、傳輸、加工、流通、利用、營運、安全八大能力。在數據採集方面,支援透過感測器、業務系統等手段擷取相關數據。在数据匯聚方面,透過標識編碼解析、數據目錄等,對資料進行高效率接入、合理編目,实现数据广泛匯聚、儲存和發布。在数据傳輸方面,支援節點即時群組網、数据高效傳輸。在數據加工方面,為參與者提供高效便捷、安全可靠的資料清洗、計算服務,建立數據品質控制和評估能力,提高資料處理環節效率。在數據流通方面,透過資料分類分級策略實現共享、交易等流通功能,為不同行業、不同地區、不同機構提供可信賴流通環境。在數據利用方面,為數據應用方提供數據分析、數據視覺化等能力,進一步降低數據應用門檻。在数据營運方面,提供資料登記、監督管理、資料認證、合規保障等功能,有效支撐資料要素市場有序運行。在資料安全方面,提供動態全過程資料安全服務,包括防竊取、防洩漏、防破壞等。在賦能方面,促進數據多場景應用、跨主體復用,賦能工業製造、現代農業、跨國數位貨幣、數位金融、智慧醫療、智慧交通、跨境物流、航運貿易、綠色低碳等產業領域。
其中,資料流通利用設施是國家資料基礎設施的重要組成部分,為跨層級、跨地域、跨系統、跨部門、跨業務資料流通利用提供安全可信任環境,包括可信任資料空間、數場、資料元件、數聯網、區塊鏈網絡、隱私保護運算平台等技術設施。網路設施、算力設施適應數據價值釋放需要,向資料高速傳輸、算力高效供給方向升級發展。安全保障體係是國家資料基礎設施安全可靠運作的保障,包括監測預警、資訊通報、緊急處置等相關制度、能力和隊伍建設。
(二)主要構成
國家數據基礎設施以產業、區域資料基礎設施為主體,以企業資料基礎設施為重要組成。企業資料基礎設施是指服務業生產、營運、管理的數據平台,包括採集、儲存、處理、管理等相關硬體和軟體系統,以及企業整合、協同關聯資料方所形成的資料服務平台。產業數據基礎設施是指覆蓋某一產業領域,服務業內企業、使用者及利害關係人,實現資料要素化、資源化、價值化的各類設施,包括產業數據流通交易平台、產業數據歸集平台、產業數據公共服務平台等。區域資料基礎設施是指覆蓋本地區,服務區域內企業、使用者及利害關係人,實現資料要素化、資源化、價值化的各類設施,包括資料歸集平台、資料資源管理服務平台、公共数据營運平台等。國家在企業、產業、區域數據基礎設施的基礎上,組織建設基於統一目錄標識、統一身分登記、統一介面要求的資料流通利用底座,建構資料流通利用基礎設施管理平台,以及建設數據產權登記、公共数据營運、資料資源管理、數據流通交易、算力資源監測調度等基礎公共服務的平台。這些設施相互貫通、協同推進,共同促進國家數據基礎建設發展。
五、重點方向
(一)建設資料流通利用設施底座
依照統一目錄標識、統一身分登記、統一介面要求,建設資料流通利用設施底座。建立覆蓋政府、產業、企業等主體及國家、省、市、縣等層級的全國一體化的分散式資料目錄,形成全國數據“一本帳”,支撐跨層級、跨地域、跨系統、跨部門、跨業務的資料有序流通和共享應用。建立全國一體化的分散式數位身分體系,規範身份識別生成、身份註冊和認證機制。建立統一的資料憑證、交易憑證結構、生成與驗證機制,支援利用區塊鏈、加密技術、智能合約等手段提高憑證的可溯性和信任性。建構標準化、規範化的交互接口,實現資料基礎架構的互聯互通。建設資料泛在接取體系,支援數據資源、參與主體、第三方服務更大規模接入。建立與IPv6等網路標識相容的資料標識體系。建立資料目錄分類分級管理機制,加強資料分類管理與分級保護。
(二)建設數據高效供給體系
在數據標註產業的生態建構、能力提升和場景應用等方面先行先試。連結各類公共數據、企業數據、個人資料以及各類高品質資料集,對社會形成統一的資料資源開放目錄。研究制定高品質資料集建置相關標準,從數據生成、註釋定義到資料管理的整個過程,確保資料標註的準確性和資料模型的專業性。制定高品質資料標註與交付規則,提升訓練資料品質。支持農業、工業、金融、自然資源、衛生健康、教育、科技、民航、氣像等產業領域打造高品質數據集。因地制宜推動公共資料營運平台集約化、標準化建設,推動公共資料的規模化、常態化供給。推動資料資源管理服務平台互聯互通,完善平台標準,促進平台間互通,實現全國數據資源的跨領域、跨層級、跨區域流通利用。支持各地積極建設政務服務大模型,推動政務服務智能化。
(三)建設資料可信賴流通體系
建立高效率便利且可信賴的資料流通機制,促進數據大規模、低成本、安全自由流通。支持建構企業可信數據空間、產業可信任數據空間,探索建設城市可信資料空間、個人可信任資料空間、跨境可信任資料空間。支持基礎好、有條件、意願強的行業和城市,先行先試數場建設。鼓勵業界、地方積極探索建設區塊鏈、隱私保護運算等新技術設施。支持因地制宜,探索數聯網、資料元件等資料流通基礎設施建設。支援建置資料流通交易公共服務平台。支持探索建置資料跨境流動基礎設施。建立資料流通准入標準規則,鼓勵探索資料流通安全保障技術、標準、方案。
(四)建置數據便捷交付體系
加強資料交易場所體系設計,統籌數據交易場所最佳化佈局。支持數據交易場所創新發展,鼓勵各類數據進場交易。建構集約、高效率的資料交付基礎設施,為場內集中交易和場外分散交易提供低成本、高效率、可信賴的數據交付環境。促進各類交易所、交易平台互聯互通。推動數據價值貢獻度評估、資料集推薦匹配、數據產品差異性分析等技術創新,實現供需精準匹配和便利交付。鼓勵各地提升數據加工、測試、建模驗證、安全實驗等社會化服務能力,打造產學研用“一公里”工作圈。
(五)建構產業數據應用體系
加強場景牽引,建設面向工業製造、現代農業、數位金融、智慧醫療、智慧交通、跨境物流、航運貿易、衛生健康、綠色低碳等重點產業領域的數據應用基礎設施,促進產業數據應用創新。培育以資料要素為基礎的新產品和新服務,促進數據多場景應用、跨主體復用,實現知識擴散、價值倍增。
六、算力底座
(一)推動算力資源科學佈局
加快推動通用算力、智能算力、超級算力等多元異構算力的綠色發展、有機協同。促進各類新增算力向國家樞紐節點集聚,強化樞紐節點國家算力高地定位。建置全國一體化算力網監測調度平台。探索採用存算分離架構建置新型智算中心及新材料大數據中心。
(二)推動東中西部算力協同
加強新興網路技術創新應用,優化網路計費方式,降低東西部資料傳輸成本,促進東部中高延遲業務向西部轉移。建構算力多層調度策略引擎,實現跨平台、跨層級、跨區域的算力資源混合部署和統一調度,促進算力資源高效對接,提升資料匯聚、處理、流通、交易效率。推動國家樞紐節點與需求地之間400G/800G高頻寬全光連接,引導電信業者提升“公共傳輸通道”效能,推進算網深度融合。
(三)推進算力與數據、演算法融合創新
推動實現“瓦特”產業向“位元”產業轉化,不斷壯大數算產業生態體系,協助打造具有國際競爭力的數位產業群聚。推動產業數據和算力協同,實現資料可信賴流通,提升資料處理能力與治理水平。建立健全演算法開發利用機制,積極進行大模型創新演算法及關鍵技術研究,提升數據分析能力,降低大模型計算的算力消耗水平。
(四)推進算力與綠電融合
強化樞紐節點與非樞紐節點的協同連結,支持綠電資源豐富的非樞紐節點融入全國一體化算力網建設。加強大型風光基地和算力樞紐節點協同連動,把綠色電力轉換成綠色算力。積極推動風光綠電資源消納,助力實現碳達峰碳中和。支持利用“源網荷儲”等新型電力系統模式。加強資料中心智慧能源管理,進行資料中心用能監測分析與負載預測,優化資料中心電力系統整體運作效率。探索綠電直供新模式,有序開展綠電、綠證交易。
(五)推動算力發展與安全保障協同
推動建置國家算力網基礎安全服務保障平台,打造一體化的安全保障服務能力。打造網路與資料安全攻防演習靶場,推動國家樞紐節點地區定期進行網路和資料安全攻防演習。建設算力網安全應用技術試驗場。強化國家樞紐節點自主防護能力,統一緊急處置、統一安全監測、統一運作監控,構築全生命週期的安全管控措施。
七、網路支撐
建置高速資料傳輸網,實現不同終端、平台、專網之間的資料高效彈性傳輸和互聯互通,解決資料傳輸能力不足、成本較高、難以互聯等問題。支援基礎電信業者疊加虛擬化組網、網路協定創新與智慧化任務調度等雲端網路融合技術,形成多方快速組網和資料交換能力,支援面向資料傳輸任務的彈性頻寬和多量綱計費。
推動傳統網路設施優化升級,有序推進5G網路向5G-A升級演進,全面推進6G網路技術研發創新。在東中西部地區均衡佈局國際通訊出入口局,加快擴展國際海纜、陸纜資訊通道方向。建設時延確定、頻寬穩定保障、傳輸品質可靠的確定性網絡。佈局“天地一體”的衛星互聯網。
八、安全防護
國家資料基礎設施安全保障體系建置重點在於建構多層次、全方位、立體化的國家資料基礎設施安全保障框架,貫穿資料生命週期全流程,協助各參與方提升資料安全保障能力,確保數據的可信度、完整性和安全性。
在國家資料基礎設施安全保障層面,實現可信任接入、安全互聯、跨域管控和全端防護等安全管理,建立網路安全風險和威脅的動態發現、即時告警、全面分析、協同處置、跨域追溯與態勢掌控能力,提供晶片、軟體、硬體、協議等內置後門、漏洞安全威脅的內生防護能力。加強對合作夥伴、維運人員、平台用戶等資料安全內部風險的防範應對。加強入侵滲透、拒絕服務、資料竊取、勒索投毒等外部威脅的緊急應變。
在資料流通利用安全層面,綜合利用隱私保護計算、區塊鏈、數據使用控制等技術手段,保證資料的可信賴採集、加密傳輸、可靠儲存、受控交換共享、銷毀確認及存證溯源等,規避資料隱私洩露、違規濫用等風險。加強演算法、模型、資料的安全審計,增強模型穩健性和安全性,保證高價值、高敏感數據“可用不可見”“可控制可計量”“可溯可審計”,確保貫穿資料全生命週期各環節安全。
九、組織保障
(一)健全政策保障體系
建立健全資料基礎制度體系,加速推出數據產權、流通交易、收益分配、安全治理等政策文件。在新型基礎建設規劃安排下,研究制定國家資料基礎建設規劃。加大中央投資對國家數據基礎建設的支持力度。各地區、各部門要在數據基礎設施規劃佈局、資金安排、課題研究方面給予重點支持。積極引導社會資本力量參與國家數據基礎建設。
(二)加速科技創新探索
支持有條件的產業和地區進行先行先試探索建設資料基礎設施。鼓勵企業及科研機構加大研發投入,加速資料流通利用關鍵技術攻關與重大成果轉化。透過國家重點研發項目課題立項、揭榜掛帥、數據技術創新競賽等方式推動技術創新。
(三)強化標準和人才支撐
強化標準支撐,研究制定資料基礎設施相關標準規範。鼓勵企業、社會團體、科學研究機構參與資料基礎設施國際標準的製定工作。加強與ISO、IEC、IEEE、ITU、3GPP等國際標準化組織的合作,推動數據領域高水準專家在國際組織任職。推動人才隊伍建設,建立數據人才評估標準與評選機制。
附錄:
技術術語解釋
(一)數據流通利用技術
在資料流通利用領域,目前常用的技術路線主要包括隱私保護計算、區塊鏈、數據使用控制等。
1.隱私保護計算
隱私保護計算指在保證資料提供者不洩露原始資料的前提下,對資料進行分析計算的一類資訊技術,保障數據在產生、儲存、計算、應用、銷毀等資料流轉全過程的各環節中“可用不可見”。隐私保护計算的常用技术方案有安全多方計算、聯邦學習、可信執行環境、密态計算等;常用的底層技術有混淆電路、不經意傳輸、秘密分享、同態加密等。
2.區塊鏈
區塊鏈是分散式網絡、加密技術、智能合約等多種技術整合的新型資料庫軟體,具有多中心化、共識可信、不可篡改、可追溯等特性,主要用於解決資料流通過程中的信任與安全問題。
3.數據使用控制
資料使用控制是指在資料的傳輸、儲存、使用和銷毀環節以技術手段進行控制,如透過智能合約技術,將資料權益主體的資料使用控制意願轉化為可機讀處理的智慧合約條款,解決資料可控的前置性問題,實現對資料資產使用的時間、地點、主體、行為和客體等因素的控制。
(二)數據流通利用實踐方案
在資料流通利用領域,目前業界的實踐方案主要包括可信任資料空間、數場、數聯網、資料元件等。
1.可信任資料空間
可信任資料空間是指資料資源開放互聯、可信賴流通的一類資料流通利用設施,其以資料使用控制為核心,以連接器為技術載體,以實現資料可信任交付,保障資料流通中“可用不可見”“可控制可計量”為目標,具備數據可信管控、資源交互、價值創造三大核心能力。
圖2 可信数据空间架构圖
2.數場
數場是依托開放性網路及算力和隱私保護計算、區塊鏈等各類關聯功能設施,提供資料要素線上線下資源登記、供需匹配、交易流通、開發利用、存證溯源等功能,支援多情境應用的一種綜合資料流通利用設施。以高效率流通、價值釋放、繁榮生態為核心,實現資料可見、可達、可用、可控制、可追溯,具備開放性、融合性、擴展性等特點。
數場從點、線、面、場、安全五個維度建構標準化技術框架。点是数据主体进入数場的接入点。線是数場内连接各主体、各平台的資料高速傳輸網,实现数場内各主体之间的互联互通。面是数場中数据主体、傳輸網路的集合,是實現資料大規模流通、高效安全利用的核心。由点到線、由線到面构成数場基础设施。場是基于数場基础设施构建的数据应用、場景化创新,以及相關能力、流程、規範的統稱。安全是覆蓋點、線、面、場的动态全流程保护措施。数場在技术架构上包括接入点、功能平台、管理平台、安全保障、網路傳輸等基礎服務平台。
圖3 数场功能架构圖
3.數聯網
數聯網由資料流通接入終端、資料流通網絡、資料流通服務平台構成,提供一點接入、廣泛連接、標準交付、安全可信、合規監管、開放相容的資料流通服務。
圖4 数联网功能架构圖
4.資料元件
資料元件提供統一標準、自主可控、安全可靠、全程監管的資料儲存與加工服務,支援採用標準化工序完成資料產品規模化加工、生產和再利用,適用於大規模資料加工和生產場景。資料元件作為連接資料供需兩端的“中間態”,將原始數據與數據應用“解耦”,基於資料元件相關組件,實現從資料歸集到資料元件加工交易全生命週期的資料要素開發與管控。
(三)資料安全技術
資料安全技術為資料收集、儲存、處理、傳輸、共享和銷毀等全生命週期提供安全保障,包括資料備份與恢復、應用資料加密、資料外洩檢測、流轉監測、身分認證與存取控制、數據脫敏、資料浮水印、資料安全態勢感知等。
本文編選自“國家數據局”微信公眾號,FOREXBNB編輯:陳筱亦。