8月14日,國務(wù)院新聞辦公室舉行“高質(zhì)量完成‘十四五’規(guī)劃”系列主題新聞發(fā)布會,介紹“十四五”時(shí)期數(shù)字中國建設(shè)發(fā)展成就。
國家發(fā)展改革委黨組成員、國家數(shù)據(jù)局局長劉烈宏在回答記者提問時(shí)表示,我國人工智能應(yīng)用規(guī)模的快速增長。2024年初,我國日均Token(處理文本的最小數(shù)據(jù)單元)的消耗量為1千億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬億,1年半時(shí)間增長了300多倍。
同時(shí),截至今年6月底,我國已經(jīng)建設(shè)高質(zhì)量數(shù)據(jù)集超過3.5萬個(gè),總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片,400PB的總量相當(dāng)于中國國家圖書館數(shù)字資源總量的140倍左右)。人工智能模型的訓(xùn)練也推動了數(shù)據(jù)交易需求的攀升,截至今年6月底,各地高質(zhì)量數(shù)據(jù)集累計(jì)交易額近40億元,數(shù)據(jù)交易機(jī)構(gòu)掛牌的高質(zhì)量數(shù)據(jù)集總規(guī)模達(dá)到了246PB。以北京數(shù)交所為例,高質(zhì)量數(shù)據(jù)集占交易總量的比例從去年的10%躍升到目前的近80%。上海、天津、安徽等地正在試點(diǎn)“數(shù)據(jù)語料作價(jià)入股”等新模式,引導(dǎo)企業(yè)將高質(zhì)量數(shù)據(jù)集折算為股權(quán)投入到相關(guān)企業(yè)。高質(zhì)量數(shù)據(jù)集的發(fā)展需要數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的支撐,我們已布局了成都、沈陽、合肥等7個(gè)數(shù)據(jù)標(biāo)注基地,助力高質(zhì)量數(shù)據(jù)集的建設(shè)。
他還提到,我國是第一個(gè)把數(shù)據(jù)作為生產(chǎn)要素的國家,多措并舉促進(jìn)數(shù)據(jù)資源的開發(fā)利用。我們強(qiáng)調(diào)“人工智能+”行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。我們大力推動高質(zhì)量數(shù)據(jù)的供給,出臺了高質(zhì)量數(shù)據(jù)集建設(shè)相關(guān)文件,多部門聯(lián)合推動相關(guān)工作。我們指導(dǎo)全國數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)委員會研究制定了相關(guān)標(biāo)準(zhǔn)和技術(shù)文件,組織了高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作和典型案例征集活動,分行業(yè)、分領(lǐng)域樹立了一批典型的解決方案。
聯(lián)系地址:陜西省西安市北關(guān)正街35號方興大廈8樓