這些人工智能(AI)生成的“胡言亂語(yǔ)”雖是網(wǎng)友們茶余飯后的笑談,但提醒我們要清醒認(rèn)識(shí)到其背后折射出的問(wèn)題:數(shù)據(jù)質(zhì)量是大模型應(yīng)用成敗的關(guān)鍵。以個(gè)性化推薦AI系統(tǒng)為例,一些企業(yè)在開(kāi)發(fā)過(guò)程中,雖然收集了大量的用戶(hù)行為數(shù)據(jù),但數(shù)據(jù)中充斥著錯(cuò)誤的標(biāo)注、重復(fù)的數(shù)據(jù)以及相互矛盾的信息,數(shù)據(jù)的量增加了,但系統(tǒng)推薦的準(zhǔn)確性并沒(méi)有顯著提升。《自然》雜志(Nature)刊登的一篇有關(guān)大模型可靠性研究的文章指出,一個(gè)西班牙研究團(tuán)隊(duì)發(fā)現(xiàn),包括OpenAI公司的GPT在內(nèi)的幾個(gè)大模型升級(jí)后,雖然參數(shù)量更大了,誤答情況卻更嚴(yán)重了。因此,大模型長(zhǎng)得壯不壯,不僅取決于“食量”(即數(shù)據(jù)的數(shù)量),更在于食物的“質(zhì)量”(即數(shù)據(jù)的質(zhì)量)——吃得飽并不等同于吃得好。
數(shù)據(jù)是大模型的基石,在數(shù)據(jù)質(zhì)量不高、可靠性缺失的情況下,一味追求大模型參數(shù)量的增加,不僅無(wú)法提升模型性能,反而會(huì)放大偏差和謬誤,產(chǎn)生更多不可信數(shù)據(jù)。如此一來(lái),勢(shì)必造成計(jì)算與存儲(chǔ)資源的浪費(fèi),增加開(kāi)發(fā)和維護(hù)成本,降低用戶(hù)信任度。更為嚴(yán)重的是,這種“大模型幻覺(jué)”和“災(zāi)難性遺忘”現(xiàn)象如果發(fā)生在精確性要求極高的工業(yè)生產(chǎn)領(lǐng)域中,還可能引發(fā)不可預(yù)測(cè)的風(fēng)險(xiǎn)和隱患。以油氣勘探為例,基于大模型給出的錯(cuò)誤預(yù)測(cè)進(jìn)行開(kāi)采可能導(dǎo)致數(shù)億元的資金損失,并對(duì)自然環(huán)境造成不可逆轉(zhuǎn)的破壞。
提升大模型性能,關(guān)鍵是處理好數(shù)據(jù)“質(zhì)”和“量”的關(guān)系,構(gòu)建大規(guī)模、高質(zhì)量的數(shù)據(jù)集。應(yīng)建立完善的數(shù)據(jù)收集、清洗、驗(yàn)證和存儲(chǔ)機(jī)制,加強(qiáng)對(duì)數(shù)據(jù)質(zhì)量的監(jiān)控和評(píng)估,確保數(shù)據(jù)的準(zhǔn)確性、完整性和一致性。此外,還應(yīng)注重跨領(lǐng)域合作,引入數(shù)據(jù)科學(xué)家、AI算法工程師等多方力量,開(kāi)展大模型算法合作、制定數(shù)據(jù)共享和隱私安全保密協(xié)議,推動(dòng)大模型產(chǎn)學(xué)研用生態(tài)建設(shè)。
如今,大模型的發(fā)展已邁入多模態(tài)融合階段。通過(guò)加強(qiáng)數(shù)據(jù)治理,優(yōu)化人工智能學(xué)習(xí)、訓(xùn)練和驗(yàn)證的“基礎(chǔ)食材”,端上大規(guī)模、高質(zhì)量、多模態(tài)數(shù)據(jù)集的“豐盛大餐”,必將助力大模型能力的提升,讓人工智能更好地賦能千行百業(yè)、造福人類(lèi)社會(huì)。
關(guān)鍵詞:
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來(lái)源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 環(huán)比增幅的衡量標(biāo)準(zhǔn)是什么?環(huán)比增長(zhǎng)率怎么算?
- 2025中國(guó)生物發(fā)酵產(chǎn)業(yè)技術(shù)大會(huì)舉辦 業(yè)內(nèi)熱議AI接入生物制造
- 三個(gè)“首次”見(jiàn)證中國(guó)外貿(mào)新動(dòng)能
- 全國(guó)人工智能機(jī)器人創(chuàng)新大賽啟動(dòng) 專(zhuān)家力薦高校參賽
- 西安鐵路局2025年首趟跨省“環(huán)秦嶺”銀發(fā)旅游專(zhuān)列開(kāi)行
- 推動(dòng)健康數(shù)據(jù)互聯(lián)互通
- 金價(jià)不斷沖高 金店現(xiàn)飾品“貼金調(diào)換”熱潮!記者探訪(fǎng)
- 建行舉辦科技金融推進(jìn)會(huì)暨創(chuàng)業(yè)投資二級(jí)市場(chǎng)基金戰(zhàn)略合作協(xié)議簽約儀式
- 安徽蕭縣:從"一刷一鏟"到百億集群
- 車(chē)門(mén)刮壞后應(yīng)如何進(jìn)行修復(fù)?車(chē)門(mén)下邊的橫梁刮壞了修好多少錢(qián)?
資訊
- 北京金融監(jiān)管局:堅(jiān)定不移推進(jìn)金融高水平開(kāi)放
- 鮮花爭(zhēng)“鮮”綻放帶暖美麗經(jīng)濟(jì) “賞花+”扮“靚”經(jīng)濟(jì)新增長(zhǎng)點(diǎn)
- 廈門(mén)航空新開(kāi)福州往返河內(nèi)直飛航線(xiàn)
- 衢州綜合保稅區(qū)獲批 浙江開(kāi)放型經(jīng)濟(jì)發(fā)展再添新引擎
- 如何理解市場(chǎng)中的價(jià)格調(diào)整機(jī)制??jī)r(jià)格機(jī)制對(duì)經(jīng)濟(jì)的調(diào)節(jié)作用有哪些?
- 業(yè)內(nèi)探討暖通舒適系統(tǒng)創(chuàng)新發(fā)展 助力“好房子”建設(shè)
- 北汽集團(tuán)發(fā)布“品牌摯友計(jì)劃” 首批13位內(nèi)外部摯友亮相
- 以科技創(chuàng)新培育增長(zhǎng)新動(dòng)能
- 中國(guó)大百科全書(shū)出版社成立品牌與文化出版中心
- 北京推出12項(xiàng)舉措推動(dòng)廣告業(yè)高質(zhì)量發(fā)展
焦點(diǎn)
- 2025年上海頭腦奧林匹克創(chuàng)新大賽開(kāi)幕 AI時(shí)代青少年創(chuàng)想無(wú)限
- 最新一期中國(guó)國(guó)家男子足球隊(duì)集訓(xùn)名單公布
- 西平縣應(yīng)急管理局舉辦“執(zhí)法業(yè)務(wù)大講堂”——《生產(chǎn)安全事故應(yīng)急預(yù)案管理辦法》專(zhuān)題培訓(xùn)
- (經(jīng)濟(jì)觀察)用機(jī)器人養(yǎng)老,真的走進(jìn)現(xiàn)實(shí)了嗎?
- 中國(guó)旅游研究院聯(lián)合馬蜂窩發(fā)布“魅力小城報(bào)告”
- 智慧農(nóng)業(yè)為農(nóng)業(yè)現(xiàn)代化插上“科技的翅膀” 讓科學(xué)種田從夢(mèng)想照進(jìn)現(xiàn)實(shí)
- 鄧州稅務(wù):穰稅無(wú)憂(yōu)送春風(fēng) 稅惠賦能促發(fā)展
- 寧夏召開(kāi)企業(yè)家創(chuàng)新精神培育暨企業(yè)科技創(chuàng)新工作現(xiàn)場(chǎng)培訓(xùn)會(huì)
- 百余件麥積山石窟壁畫(huà)藝術(shù)精品亮相蘭州:呈最美“東方微笑”
- 支持科技創(chuàng)新和制造業(yè) 中國(guó)民營(yíng)經(jīng)濟(jì)受惠減稅政策