中文字幕亚洲欧美一区二区三区_亚洲精品菠萝久久久久久久_日本成人免费视频_狠狠躁少妇一区二区三区_国产精品中文字幕久久久_国产乱子伦农村叉叉叉_麻豆tv免费在线观看_av在线这里只有精品_色吧亚洲视频_嫩草影院一二三

設置
  • 日夜間
    隨系統
    淺色
    深色
  • 主題色

研究稱GPT-4通過圖靈測試 54%參與者將其誤認為真人

2024-06-27 17:37:27 來源:

  研究稱GPT-4通過圖靈測試 54%參與者將其誤認為真人  V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  每經記者 蔡鼎 每經編輯 蘭素英V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  自英國計算機科學家阿蘭?圖靈(Alan Turing)于1950年提出關于判斷機器是否能夠思考的著名試驗“圖靈測試”以來,該測試就被視為判斷計算機是否具有模擬人類思維能力的關鍵。近期,OpenAI開發的GPT-4模型完成了這項聞名全球的測試,再度引發廣泛關注。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  加州大學圣地亞哥分校認知科學系博士生 Cameron R. Jones和教授Benjamin K. Bergen在預印本arXiv上發表的最新論文表明,越來越多的人難以在圖靈測試中區分GPT-4和人類。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  兩位研究人員以真人、初代聊天機器人ELIZA、GPT- 3.5和GPT-4為研究對象。其中,ELIZA是由麻省理工團隊在1964年至1966年期間開發的史上第一個聊天機器人,上世紀60年代曾參與圖靈測試,但宣告失敗。該機器人沒有大語言模型或神經網絡支持。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  結果顯示,多達54%的參與者將GPT-4誤認為真人,是迄今為止首次有AI模型以如此高的結果通過圖靈測試。還需要指出的是,上述研究開展之時,OpenAI尚未宣布新一代的旗艦模型GPT-4o,如果參與測試的是GPT-4o,這一比例可能還會更高。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  500名參與者進行測試V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  研究人員招募了500名參與者,讓他們與四位“對話者”進行五分鐘的交流,這四位“對話者”分別是真人、初代聊天機器人ELIZA、GPT-3.5和GPT-4。參與者在對話結束后需判斷對方是人還是機器。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  雙方將通過一個類似即時通訊應用的界面進行交流。界面底部有一個聊天輸入框,屏幕中央為對話記錄,頂部有一個計時器和觸發幫助和報告的按鈕。招募到的參與者首先發送消息,雙方交替發送,每條消息限制在一定的字符數內。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  針對AI語言模型,研究人員基于表現最好的GPT-4命令集(提示詞)進行了修改,指示其表現得像一個年輕人,不要太認真對待游戲,使用口語化表述,且不要出現拼寫和語法錯誤。此外,AI模型也不能提供太多的知識,尤其是語文和數學方面的知識。每輪測試開始時,還會添加一些額外的信息,如姓名、地點和時間戳。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  而且,為了模擬真實的交流延遲,AI的回復會根據消息的長度人為地延遲發送。這種設置旨在模擬正常的人際交流節奏,增加實驗的現實感。研究小組解釋稱,人類之所以不能百分之百地識別同類,是因為提問者認為AI的效率越來越高。這增加了他們將人類錯誤地識別為機器的可能性。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  為了深入了解影響參與者最后作出決定的定性因素,研究小組對其使用的策略和判斷的理由進行了分類。36%的參與者與“對話者”進行閑聊,詢問個人細節或他們的日常活動;第二類策略是社交和情感(25%),例如詢問“對話者”的意見、經歷并分析判斷它們的幽默感;第三類是知識和推理(13%),包括數學、邏輯和常識問題。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  結果顯示,有54%的參與者將GPT-4誤認為是真人。相比之下,預先設定好回復的ELIZA只有22%的人將其認作真人,GPT-3.5則為50%,而“真人對話者”被正確辨認的比例則為67%。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  社交情感能力是關鍵V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  《每日經濟新聞》記者注意到,研究人員在論文中對“真人對話者”被正確辨認的比例只有67%感到震驚。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  他們指出,這可能反映出參與者認為AI系統質量在不斷進化,這一結果也與近年來其他類似的圖靈測試呈現的情況類似。當AI系統能力很差時,真人是很容易被辨別出來的,而隨著參與者對AI系統能力的信心增強,他們便更有可能將真人誤認為AI。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  作者在論文中指出,他們的結果為圖靈測試提供了一些經驗性證據。就他們使用的策略和給出的決策理由而言,被招募的參與者在測試中更關注的是研究對象在對話中的風格和社交情感因素,而不是更傳統的智力類回答,例如知識和推理能力。他們認為,這可能是因為參與者認為,社交能力是機器最無法模仿的人類特征。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  GPT-4和GPT-3.5在測試中的表現雖然未達到“真人對話者”的水平,但目前AI研究者普遍認為,只要有30%的回答被誤認為是人類,那就算通過測試。不過也有觀點認為,50%的基線更加合理,因為它更能證明人類在識別AI方面并不具有偶然性。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  在上述研究中,參與者的置信度得分和決策依據都表明他們并非隨意猜測:GPT-4是人類的平均置信度為73%。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  還需要指出的是,由于研究人員在進行上述實驗時,OpenAI尚未宣布新一代的旗艦模型GPT-4o。這一全新模型可以利用語音、視頻和文本信息進行實時推理,如果參與測試,被參與者誤認為人類的概率可能就會更高。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

  圖靈測試是由英國計算機科學家阿蘭?圖靈(Alan Turing)于1950年在其論文《計算機器與智能》中提出的一個關于判斷機器是否能夠思考的著名試驗,測試某機器是否能表現出與人等同或無法區分的智能水平。1966年,美國計算機協會(ACM)還以圖靈的名字設立了圖靈獎,被譽為“計算機界的諾貝爾獎”,旨在獎勵對計算機事業作出重要貢獻的個人,每年頒發一次。V1f速刷資訊——每天刷點最新資訊,了解這個世界多一點SUSHUAPOS.COM

本文鏈接:研究稱GPT-4通過圖靈測試 54%參與者將其誤認為真人http://www.sq15.cn/show-2-7212-0.html

聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇: OpenAI稱將采取額外措施 停止其不支持的國家和地區的API使用

下一篇: OpenAI:推遲發布語音助手以保更佳處理用戶要求

熱門資訊

推薦資訊

  • 日榜
  • 周榜
  • 月榜
欧美激情一区二区三区视频| 久草免费在线观看| 国产a网| 精品久久久久久中文字幕2017| 亚洲精品永久一区| 日本在线www| 日本特黄特色aa大片免费| 国产高清在线精品一区二区| 一级女性全黄久久生活片| 欧美激情一区二区三区在线| 999久久久免费精品国产牛牛| 99热精品一区| 国产成人精品综合在线| 日本免费区| 九九久久国产精品大片| 精品视频免费看| 99久久精品国产麻豆| 可以免费看污视频的网站| 成人免费一级纶理片| 高清一级毛片一本到免费观看| 日韩一级黄色片| 台湾毛片| 亚洲 欧美 91| 国产极品白嫩美女在线观看看| 精品久久久久久中文字幕一区 | 成人高清免费| 日本特黄特黄aaaaa大片| 免费毛片播放| 国产一区二区精品| 一a一级片| 欧美电影免费| 美女免费黄网站| 可以免费看毛片的网站| 日本在线不卡免费视频一区| 精品国产一区二区三区久久久蜜臀| 欧美爱爱动态| 精品国产一区二区三区久| 国产福利免费视频| 九九久久国产精品大片| 免费一级生活片| 美女免费毛片| 精品视频在线看| 99色精品| 久久精品店| 韩国毛片免费大片| 色综合久久天天综线观看| 午夜激情视频在线观看| 久久国产影视免费精品| 日日夜夜婷婷| 久草免费资源| 国产成人欧美一区二区三区的| 国产精品1024永久免费视频| 九九免费高清在线观看视频| 久久精品店| 国产精品1024永久免费视频| 国产成人欧美一区二区三区的| 韩国三级视频在线观看| 国产视频久久久| 可以免费看毛片的网站| 日韩欧美一二三区| 国产成a人片在线观看视频| 成人高清视频免费观看| 国产精品自拍在线观看| 色综合久久手机在线| 亚洲 欧美 91| 韩国毛片免费大片| 999精品在线| 天天做日日干| 国产综合成人观看在线| 国产成a人片在线观看视频| 日韩免费在线观看视频| 韩国毛片 免费| 久久精品欧美一区二区| 国产成人啪精品视频免费软件| 国产成人啪精品视频免费软件| 精品国产亚洲一区二区三区| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 日韩中文字幕在线播放| 精品视频在线观看免费| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 99久久精品国产高清一区二区| 精品视频在线观看一区二区| 天天做日日爱夜夜爽| 精品美女| 中文字幕97| 天天做日日爱夜夜爽| 亚洲精品永久一区| 可以免费在线看黄的网站| 午夜欧美成人久久久久久| 日本在线不卡视频| 日本久久久久久久 97久久精品一区二区三区 狠狠色噜噜狠狠狠狠97 日日干综合 五月天婷婷在线观看高清 九色福利视频 | 久久精品欧美一区二区| 99热精品在线| 精品国产一区二区三区国产馆| 精品在线视频播放| 精品视频免费看| 久久国产精品自线拍免费| 99色精品| 成人免费观看的视频黄页| 台湾毛片| 精品久久久久久影院免费| 日本在线www| 可以免费看毛片的网站| 一a一级片| 国产网站麻豆精品视频| 欧美1卡一卡二卡三新区| 韩国毛片 免费| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 一a一级片| 精品视频在线观看一区二区 | 久久福利影视| 欧美a级片视频| 韩国三级视频网站| 免费的黄色小视频| 国产国语在线播放视频| 美国一区二区三区| 亚洲 激情| 精品美女| 91麻豆爱豆果冻天美星空| 精品国产亚洲人成在线| 日本特黄一级| 国产精品免费精品自在线观看| 国产麻豆精品视频| 99久久精品国产麻豆| 欧美电影免费看大全| 九九精品在线播放| 亚洲第一色在线| 欧美日本韩国| 亚洲 男人 天堂| 欧美大片a一级毛片视频| 国产一区二区精品久久91| 亚洲精品中文字幕久久久久久| 精品久久久久久免费影院| 九九免费高清在线观看视频| 欧美大片一区| 久草免费资源| 一级女性全黄久久生活片| 国产成人精品综合久久久| 成人av在线播放| 亚洲天堂一区二区三区四区| 日韩一级黄色片| 欧美a级大片| 999久久66久6只有精品| 麻豆系列国产剧在线观看| 美国一区二区三区| 你懂的日韩| 天天做日日干| 欧美另类videosbestsex久久| 国产视频一区二区在线播放| 欧美大片毛片aaa免费看| 天天色色色| 999精品视频在线| 日韩中文字幕一区二区不卡| 九九精品久久久久久久久| 国产一区免费观看| 国产成人欧美一区二区三区的| 精品久久久久久中文字幕2017| 久草免费在线视频| 99热精品在线| 成人免费高清视频| 久久久成人影院| 欧美a级成人淫片免费看| 青青青草影院| 免费国产在线观看| 麻豆网站在线免费观看| 97视频免费在线| 成人影视在线播放| 国产精品12| 一级女性全黄生活片免费| 精品久久久久久影院免费| 青青久热| 国产成+人+综合+亚洲不卡| 高清一级做a爱过程不卡视频| a级毛片免费观看网站| 麻豆系列 在线视频| 亚洲女人国产香蕉久久精品 | 可以免费看污视频的网站| 国产成人啪精品视频免费软件| 四虎影视库| 高清一级做a爱过程不卡视频| 国产美女在线一区二区三区| 日韩字幕在线| 日本在线不卡免费视频一区| 国产视频在线免费观看| 欧美1卡一卡二卡三新区| 美女免费精品高清毛片在线视| 中文字幕一区二区三区精彩视频| 韩国三级视频网站| 欧美大片a一级毛片视频| 你懂的在线观看视频| 一本伊大人香蕉高清在线观看| 日韩中文字幕在线亚洲一区| 毛片成人永久免费视频| 日本在线不卡视频| 欧美大片毛片aaa免费看| 亚洲 欧美 91| 免费毛片基地| 日本乱中文字幕系列| 久久国产一久久高清| 91麻豆精品国产自产在线|