您現在的位置:首頁
8月14日上午10時,國務院新聞辦公室舉辦關于“十四五”時期數字我國建造開展成果的新聞發布會。國家開展變革委黨組成員、國家數據局局長劉烈宏介紹,2024年頭,我國日均Token(詞元)的消耗量為1千億,到本年6月底,日均Token消耗量現已打破30萬億,1年半時刻增長了300多倍,這反映了我國人工智能運用規劃的快速增長。
他介紹,到本年6月底,我國現已建造高質量數據集超越3.5萬個,總體量超越了400PB(1PB可存儲約5億張2MB巨細的高清相片,400PB的總量相當于我國國家圖書館數字資源總量的140倍左右)。人工智能模型的練習也推動了數據買賣需求的攀升,到本在线观看亚洲美女挤奶水年6月底,各地高質量數據集累計買賣額近40億元,數據買賣組織掛牌的高質量數據集總規劃達到了246PB。以北京數交所為例,高質量數據集占買賣總量的份額從上一年的10%躍升到現在的近80%。
他介紹,上海、天津、安徽等地正在試點“數據語料作價入股”等新模式,引導企業將高質量數據集折算為股權投入到相關企業。高質量數據集的開展需要數據標示工業的支撐,咱們已布局了成都、沈陽、合肥等7個數據標示基地,助力高質量數據集的建造。
中文數據在國內大模型的練習功能提高方面發揮著重要作用。咱們都十分關懷中文數據在練習數據中的占比狀況,在线观看亚洲美女挤奶水經過一段時刻的盡力,國內大都模型練習運用的中文數據占比現已超越了60%,有的模型已達到80%。中文高質量數據的開發和供應才能繼續增強,推動我國人工智能模型功能的快速提高。
下一步,國家數據局將經過體系化布局繼續推動高質量數據集建造,加速打造具身智能、低空經濟、生物制作等要點范疇數據高地。咱們也將推動全社會強化數據要素價值認同,加速推動數據要素價值共創,培養“為優質數據買單”的商場一致。