(資料圖片僅供參考)
何為高質量數據集?
2024年12月,國家發展改革委、國家數據局等部門印發《關于促進數據產業高質量發展的指導意見》,首次明確提出“高質量數據集”概念,支持企業面向人工智能應用創新,開發高質量數據集,大力發展“數據即服務”“知識即服務”“模型即服務”等新業態。
近日發布的《高質量數據集建設指引》指出,大模型參數規模指數級增長與多模態能力的拓展,數據需求從“量級積累”轉向“量質并重”。
官方數據顯示,截至2025年6月,全國建設高質量數據集超3.5萬個、總量超400PB;數據交易機構掛牌高質量數據集3364個,作為交易流通中的關鍵商品,累計交易額近40億元,規模達246PB。
在近日舉行的一場論壇上,中國信息通信研究院院長余曉暉表示,放眼全球,有大量的私域數據,在場景、行業、政府中,這部分數據能夠釋放出來,是構成高質量數據集非常重要的一個方向。
高質量數據集和AI發展相輔相成
因為AI大模型的訓練會用到海量數據,所以,市場一直有觀點認為,未來將無數據可用,或者不得不用大量的合成數據。在這種情況下,高質量數據集無疑成為數據流通的“硬通貨”。
清華大學數字政府與治理研究院院長、教授張小勁表示,人工智能大模型走到哪里,高質量數據集就走到哪里,反之,高質量數據集走到哪里,人工智能就走到哪里,這是相輔相成的,是雙輪驅動的格局。
中國工程院院士吳世忠指出,數據集建設的質量和安全,是大模型發展的生命線,要完善分級分類的數據安全制度,強化全流程的技術防護手段,筑牢防篡改的底層技術能力。在數據集建設中,還要主動融入中華優秀傳統文化,避免模型成為利己主義的工具。
目前高質量數據集建設如火如荼,深圳市政務服務和數據管理局黨組書記、局長周劍明在國家數據局官網發文分享,深圳市結合公共數據資源授權運營和可信數據空間建設探索,支持高質量公共數據和企業數據等融合應用,已在征信金融、氣象、商保理賠等領域開展試點,取得較好成效。
關鍵詞:
凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。
資訊
- 實時:開學首日廣東各地海事部門多舉措護航學生“水上求學路”
- 向創新要新動能 愛爾眼科上半年業績穩健增長
- 湖北武漢:智能機器人為伴 喜迎“開學第一課”
- 觀察:央視熱播劇將鏡頭聚焦一群人的奔赴 《歸隊》之路 也是淬煉英雄之路
- “國球兩進”公益行活動為美好生活添彩-播報
- 2025第十五屆中國城市發展及房地產創新大會舉辦 今頭條
- 天潤工業:公司長期規劃也是要將汽車相關行業、機器人相關行業、高端制造、新材料等方面作為未來產業發展方向,將積極的在上述各領域中尋找新的機會 每日觀察
- 可圈!可點!可歌!世紀工程以驚人的“運河速度”重塑山河
- “AI+鋼鐵”鍛造新質生產力|每日快訊
- 每日速讀!能源金屬板塊持續走強,盛屯礦業觸及漲停