8月19日,據(jù)2024北京人工智能生態(tài)大會(huì)發(fā)布的消息,高價(jià)值語料可信流通基礎(chǔ)設(shè)施啟動(dòng)建設(shè)。在區(qū)塊鏈、隱私計(jì)算等前沿信息技術(shù)的護(hù)航下,支撐人工智能大模型高質(zhì)量成長(zhǎng)的語料數(shù)據(jù)將告別無序流通,轉(zhuǎn)入規(guī)范運(yùn)行的“高速公路”,這對(duì)于加快形成人工智能大模型訓(xùn)練高地,推動(dòng)我國(guó)人工智能實(shí)現(xiàn)“彎道超車”和跨越式發(fā)展具有重要意義。
據(jù)悉,高價(jià)值語料可信流通基礎(chǔ)設(shè)施,是由新華社國(guó)家重點(diǎn)實(shí)驗(yàn)室、人民網(wǎng)、高等教育出版社、中國(guó)通用技術(shù)集團(tuán)等10余家我國(guó)語料數(shù)據(jù)重點(diǎn)單位共同打造。以區(qū)塊鏈、隱私計(jì)算為代表的新一代信息技術(shù),憑借可信存證、不可篡改、易確權(quán)、充分保護(hù)數(shù)據(jù)隱私安全等特點(diǎn),可以保障語料數(shù)據(jù)可信安全地流通、使用和管理,有效破解上述難題。
相關(guān)負(fù)責(zé)人介紹,高價(jià)值語料可信流通基礎(chǔ)設(shè)施將運(yùn)用我國(guó)自主可控、性能領(lǐng)先的區(qū)塊鏈軟硬件技術(shù),搭建起覆蓋全國(guó)的分布式語料數(shù)據(jù)互聯(lián)互通橋梁,鏈接語料供給方、加工方、需求方,實(shí)現(xiàn)全國(guó)分布式語料數(shù)據(jù)可信接入,跨地域可發(fā)現(xiàn)、可訪問,形成高質(zhì)量語料數(shù)據(jù)集。同時(shí),運(yùn)用創(chuàng)新隱私計(jì)算技術(shù),通過“數(shù)據(jù)不出域、可用不可見”的方式,保障大模型高價(jià)值語料數(shù)據(jù)在處理加工和模型訓(xùn)練過程中無法二次非授權(quán)傳播。此外,該基礎(chǔ)設(shè)施還將通過智能合約開展鏈上激勵(lì),為語料資源供給與流轉(zhuǎn)提供持續(xù)性的內(nèi)生動(dòng)力。
據(jù)了解,在高價(jià)值語料可信流通基礎(chǔ)設(shè)施的支撐下,國(guó)家語料數(shù)據(jù)的重點(diǎn)單位還將開展基于區(qū)塊鏈與隱私計(jì)算的語料數(shù)據(jù)可信安全流通規(guī)范制定,形成高價(jià)值語料數(shù)據(jù)流通與增值的可持續(xù)生態(tài)。
來源:人民郵電報(bào)記者 伍樹
評(píng)論