網(wǎng)站地圖 - 關(guān)于我們
您的當前位置: 首頁 > 科技 > 業(yè)內(nèi) 正文

AI為何會“一本正經(jīng)地胡說八道”

作者:admin 時間:2023-11-24 06:28 點擊:
導讀:

  ◎本報記者 羅云鵬

  想象一下,向人工智能(AI)聊天機器人詢問一個不存在的歷史事件,比如“誰贏得了1897年美國和南極洲之間的戰(zhàn)斗?”即使沒有這樣的戰(zhàn)斗,AI聊天機器人也可能會提供一個虛構(gòu)的答案,例如“1897年的戰(zhàn)斗是由美國贏得的,約翰?多伊將軍帶領(lǐng)部隊取得了勝利。”這種AI編造信息“一本正經(jīng)地胡說八道”的情況屢見不鮮。

  在專業(yè)領(lǐng)域,AI“一本正經(jīng)地胡說八道”這種現(xiàn)象被稱為AI幻覺。“AI幻覺指的是AI會生成貌似合理連貫,但同輸入問題意圖不一致、同世界知識不一致、與現(xiàn)實或已知數(shù)據(jù)不符合或無法驗證的內(nèi)容。”近日,長期從事自然語言處理、大模型和人工智能研究的哈爾濱工業(yè)大學(深圳)特聘校長助理張民教授在接受科技日報記者采訪時表示。

  AI幻覺普遍存在

  記者梳理發(fā)現(xiàn),AI幻覺具有普遍性。

  今年2月,谷歌發(fā)布的AI聊天機器人Bard在視頻中,對詹姆斯?韋布空間望遠鏡曾做出不真實陳述;3月,美國的兩名律師向當?shù)胤ㄔ禾峤涣艘环萦肅hatGPT生成的法律文書,這份文書格式工整、論證嚴密,但其中的案例卻是虛假的……

  OpenAI研究人員雖曾在今年6月初發(fā)布報告稱“找到了解決AI幻覺的辦法”,但也承認,“即使是最先進的AI模型也容易生成謊言,它們在不確定的時刻會表現(xiàn)出捏造事實的傾向。”

  總部位于紐約的人工智能初創(chuàng)公司和機器學習監(jiān)控平臺Arthur AI也在今年8月發(fā)布研究報告,比較了OpenAI、“元宇宙”Meta、Anthropic以及Cohere公司開發(fā)的大語言模型出現(xiàn)幻覺的概率。研究報告顯示,這些大模型都會產(chǎn)生幻覺。

  目前國內(nèi)大語言模型雖無產(chǎn)生AI幻覺相關(guān)披露,但也可從相關(guān)公開報道中找到端倪。

  今年9月,騰訊混元大語言模型正式亮相。騰訊集團副總裁蔣杰介紹,針對大模型容易“胡言亂語”的問題,騰訊優(yōu)化了預訓練算法及策略,讓混元大模型出現(xiàn)幻覺的概率比主流開源大模型降低了30%―50%。

  “大模型有可能‘一本正經(jīng)地胡說八道’。如果不和行業(yè)專業(yè)數(shù)據(jù)庫或者一些專業(yè)應(yīng)用插件進行對接,這可能會導致它們提供過時或者不專業(yè)的答案。”科大訊飛研究院副院長、金融科技事業(yè)部CTO趙乾在第七屆金融科技與金融安全峰會上曾表示,科大訊飛已經(jīng)推出一些技術(shù)方案,讓大模型揚長避短。

  AI幻覺源自本身

  “現(xiàn)在不同研究工作對AI幻覺的分類各不相同。”張民介紹,總體而言,AI幻覺可以分為內(nèi)在幻覺和外在幻覺兩類。

  據(jù)悉,內(nèi)在幻覺即是同輸入信息不一致的幻覺內(nèi)容,包括同用戶輸入的問題或指令不一致,或是同對話歷史上下文信息相矛盾,如AI模型會在同一個對話過程中,針對用戶同一個問題的不同提問方式,給出自相矛盾的回復。外在幻覺則是同世界知識不一致或是通過已有信息無法驗證的內(nèi)容,例如AI模型針對用戶提出的事實性問題給出錯誤回答,或編造無法驗證的內(nèi)容。

  近期,騰訊AI Lab聯(lián)合國內(nèi)外多家學術(shù)機構(gòu)發(fā)布了一篇面向大模型幻覺工作的綜述。該綜述認為,AI幻覺集中在大模型缺乏相關(guān)知識、記憶錯誤知識、大模型無法準確估計自身能力邊界等場景。

  “從技術(shù)原理上看,AI幻覺多由于AI對知識的記憶不足、理解能力不足、訓練方式固有的弊端及模型本身技術(shù)的局限性導致。”張民坦言,AI幻覺會造成知識偏見與誤解,甚至有時會導致安全風險、倫理和道德問題。

  AI幻覺尚難消除

  盡管AI幻覺短期內(nèi)難以完全消除,但業(yè)界正試圖通過技術(shù)改進和監(jiān)管評估來緩解其影響,以保障人工智能技術(shù)的安全可靠應(yīng)用。

  “現(xiàn)階段AI幻覺難以完全被消除,但卻可以試著緩解。”張民介紹,在預訓練、微調(diào)強化學習、推理生成等階段中運用適當?shù)募夹g(shù)手段,有望緩解AI幻覺現(xiàn)象。

  據(jù)介紹,在預訓練方面,需增加知識密集的數(shù)據(jù)、高質(zhì)量數(shù)據(jù)的選取和過濾;微調(diào)強化學習過程中,選擇模型知識邊界內(nèi)的訓練數(shù)據(jù)極為重要;推理生成過程中,可以采用檢索外部知識的辦法使得模型生成結(jié)果有證據(jù)可循。此外,改進解碼搜索算法也是一種可行的方案。

  騰訊AI Lab聯(lián)合國內(nèi)外多家學術(shù)機構(gòu)發(fā)布的綜述亦表明了同樣觀點,并認為諸如多智能體交互、指令設(shè)計、人在回路、分析模型內(nèi)部狀態(tài)等技術(shù)也可成為緩解AI幻覺的方式。

  值得一提的是,哈爾濱工業(yè)大學(深圳)自研的立知文本大模型和九天多模態(tài)大模型,對于上述緩解AI幻覺的方式均有深入探索,并取得了顯著效果。

  “這對于開發(fā)一個真實可信的AI大模型是十分有必要的。”張民介紹,“我們嘗試通過視覺信息增強語言模型的能力,降低語言模型的外部幻覺問題;通過多個大模型智能體進行獨立思考和分析,經(jīng)由多智能體之間的討論、博弈和合作,增強回復的客觀性,減少AI幻覺。”

  張民表示,破解AI幻覺將提高AI系統(tǒng)的實用性、可信度和可應(yīng)用性,這對人工智能技術(shù)的未來發(fā)展和社會的發(fā)展都有積極影響。同時,更可靠的AI系統(tǒng)可以更廣泛地應(yīng)用于各個領(lǐng)域,這將促進技術(shù)進步的速度,帶來更多的創(chuàng)新。未來,破解AI幻覺需要進一步在算法、數(shù)據(jù)、透明度和監(jiān)管等多個方面采取措施,以確保AI系統(tǒng)的決策更加準確可靠。

打賞

取消

感謝您的支持,我會繼續(xù)努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關(guān)推薦:

網(wǎng)友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

Copyright ? 2021 早報網(wǎng) 版權(quán)所有
蘇ICP備2024138443號

蘇公網(wǎng)安備32130202081338號

本網(wǎng)站所刊載信息,不代表早報網(wǎng)觀點。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權(quán)違法立即與我們聯(lián)系客服 106291126@qq.com 對其相關(guān)內(nèi)容進行刪除。
早報網(wǎng)登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。
《早報網(wǎng)》官方網(wǎng)站:www.www.www126mk.com互聯(lián)網(wǎng)違法和不良信息舉報中心
Top 主站蜘蛛池模板: 国产精品成人免费视频电影| 乳环贵妇堕落开发调教番号| 亚洲国产精品sss在线观看AV| 久久精品无码一区二区www| 中日韩精品无码一区二区三区 | 尤物在线视频观看| 在线小视频国产| 国产成人悠悠影院| 午夜精品在线视频| 亚洲欧美日韩中文字幕一区二区三区 | 中文无线乱码二三四区| 色窝窝无码一区二区三区成人网站| 精东影业jdav1me| 最近韩国免费观看hd电影国语| 护士撩起裙子让你桶的视频| 国内精品伊人久久久久av影院 | 成人动漫h在线观看| 国产精品19p| 免费无码黄网站在线观看| 亚洲av无码国产精品色| 一本一道中文字幕无码东京热 | 中文字幕人妻偷伦在线视频| 97av视频在线播放| 色综合网站国产麻豆| 欧美性猛交xxxx乱大交| 小草视频免费观看| 国产又长又粗又爽免费视频| 亚洲欧美成人日韩| 一本一道精品欧美中文字幕| 韩国精品一区二区三区无码视频 | 国产成人无码精品久久久露脸| 亚洲综合五月天| 丁香婷婷六月天| 被强制侵犯的高贵冷艳人妇| 欧美变态老妇重口与另类| 天堂草原电视剧在线观看免费 | 国产女人18毛片水| 亚洲天堂2016| 一级做a爱片特黄在线观看免费看| 黑人巨大战冲田杏梨| 欧美精品在欧美一区二区 |