ChatGPT可以自主調(diào)用電腦資源執(zhí)行任務(wù)了。
當(dāng)?shù)貢r(shí)間7月17日,人工智能(AI)巨頭OpenAI推出ChatGPT智能體(Agent)系統(tǒng),OpenAI CEO山姆·奧特曼(Sam Altman)和四位負(fù)責(zé)人進(jìn)行了25分鐘的直播。
據(jù)介紹,這是一套融合Operator遠(yuǎn)程瀏覽器執(zhí)行能力、Deep Research網(wǎng)絡(luò)信息整合技術(shù)以及ChatGPT對(duì)話優(yōu)勢(shì)的統(tǒng)一智能體平臺(tái),“可以思考和行動(dòng),能夠主動(dòng)從代理技能工具箱中進(jìn)行選擇,使用自己的計(jì)算機(jī)為您完成任務(wù)”。
奧特曼表示,智能體代表了AI系統(tǒng)能力的新高度。
此前,Operator和Deep Research各有優(yōu)勢(shì):Operator可以在網(wǎng)頁上處理內(nèi)容,而Deep Research則擅長分析和匯總信息。但Operator無法深入分析或撰寫詳細(xì)報(bào)告,而Deep Research無法與網(wǎng)站互動(dòng)以優(yōu)化結(jié)果或訪問需要用戶身份驗(yàn)證的內(nèi)容。此次,OpenAI直接將兩者的優(yōu)勢(shì)進(jìn)行了結(jié)合。
ChatGPT在Agent模式中會(huì)使用自己的“虛擬電腦”執(zhí)行任務(wù),基于用戶指令處理復(fù)雜的工作,用戶可以主動(dòng)與網(wǎng)站互動(dòng),或在同一聊天中直接從對(duì)話過渡到直接請(qǐng)求操作。
在發(fā)布會(huì)上,OpenAI演示了用ChatGPT Agent同時(shí)進(jìn)行買西裝、做貼紙、訂酒店等任務(wù),Agent使用數(shù)秒啟動(dòng)虛擬電腦后便會(huì)詢問用戶明確需求,再進(jìn)行衣服的挑選,Agent會(huì)滑動(dòng)網(wǎng)頁、點(diǎn)開商品詳情,并留下相應(yīng)的建議文字。此外,Agent也可以代替用戶進(jìn)行下單操作。
在“虛擬電腦”中,即使ChatGPT使用多種工具,也能保留任務(wù)所需的上下文,模型可以選擇使用文本瀏覽器或可視化瀏覽器打開頁面,從網(wǎng)絡(luò)下載文件,通過在終端中運(yùn)行命令進(jìn)行操作,然后在可視化瀏覽器中查看輸出。
同時(shí),ChatGPT在執(zhí)行重要操作之前會(huì)請(qǐng)求權(quán)限,用戶可以隨時(shí)中斷、控制瀏覽器或停止任務(wù)。用戶也可以安排已完成的任務(wù)自動(dòng)重復(fù),比如每周一早上生成每周報(bào)告。
在“人類最后一次考試”評(píng)估中,ChatGPT agent模型的SOTA(State of the arts,領(lǐng)域內(nèi)最高水準(zhǔn))得分達(dá)到了41.6,當(dāng)采用簡(jiǎn)單的并行部署策略(一次最多運(yùn)行八次嘗試,并選擇自評(píng)置信度最高的一次)進(jìn)行擴(kuò)展時(shí),得分提升至44.4。
此外,在FrontierMath等基準(zhǔn)測(cè)試中,ChatGPT Agent的準(zhǔn)確率也遠(yuǎn)超之前的模型。
Pro、Plus和Team用戶可以使用Agent模式。企業(yè)版和教育版用戶將在未來幾周內(nèi)獲得訪問權(quán)限。目前Pro用戶每月有400次使用次數(shù),其他付費(fèi)用戶每月有40次使用次數(shù),也可以付費(fèi)獲得更多使用量。
(原題:《AI能力新高度!OpenAI發(fā)布ChatGPT智能體:能自主選擇工具完成任務(wù)》)
本文鏈接:OpenAI發(fā)布ChatGPT智能體:能自主選擇工具完成任務(wù)http://www.sq15.cn/show-11-23498-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。