國內多數AI模型訓練使用的中文數據占比已超60%-每日速訊
2025-08-23 12:38:52
來源:新華網
(相關資料圖)
國家數據局局長劉烈宏表示,我國人工智能的快速發展,與我國高度重視數據工作是密不可分的。作為人工智能發展的核心要素之一,數據在推動“人工智能+”過程中發揮著關鍵作用,高質量數據集的建設至關重要。
“在人工智能時代,Token,也就是大家通常所說的詞元,是處理文本的最小數據單元,如同互聯網時代大家所說的‘流量’。”劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,到今年6月底,日均Token消耗量已經突破30萬億,一年半時間增長了300多倍,反映了我國人工智能應用規模的快速增長。
據介紹,截至今年6月底,我國已經建設高質量數據集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片),400PB的總量相當于中國國家圖書館數字資源總量的140倍左右。
人工智能模型的訓練也推動了數據交易需求的攀升。截至今年6月底,各地高質量數據集累計交易額近40億元,數據交易機構掛牌的高質量數據集總規模達到了246PB。
下一步,國家數據局將通過體系化布局持續推進高質量數據集建設,加快打造具身智能、低空經濟、生物制造等重點領域數據高地,推動全社會強化數據要素價值認同,加快推進數據要素價值共創,培育“為優質數據買單”的市場共識。
關鍵詞:
相關閱讀
版權和免責申明
凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。
資訊
- 焦點快看:綠聯科技: 關于股東詢價轉讓結果報告書暨持股5%以上股東權益變動觸及1%整數倍的提示性公告內容摘要
- 芯朋微:融資余額4.85億元,創歷史新高(08-22)
- 南方中證500ETF聯接(LOF)A:凈值1.9168元增1.69%
- 【快播報】寧波韻升:上半年凈利潤同比增長179.83%
- 三臺縣: 秸稈"變廢為寶" 實現環保經濟雙贏_頭條焦點
- 視焦點訊!國家能源局:截至2025年7月底 我國電動汽車充電基礎設施總數同比增長53%
- 國家外匯管理局:在16省市開展綠色外債業務試點
- 持續暴雨預警,8月下旬了華北為何還這么多雨?
- 每日關注!2025年威海市技工院校烹飪專業師資培訓舉辦
- 動態焦點:生意社:上海期貨交易所8月21日不銹鋼倉單下跌