日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

心智理論測(cè)試:人工智能擊敗人類

AI智勝未來(lái) ? 來(lái)源:悅智網(wǎng) ? 2024-11-08 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

測(cè)試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會(huì)運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說(shuō)什么、猜測(cè)其他車輛的駕駛員將要做什么,以及與電影中的角色產(chǎn)生共鳴。一項(xiàng)最新的研究表明,ChatGPT等工具所使用的大語(yǔ)言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進(jìn)行這項(xiàng)研究之前,我們都相信大語(yǔ)言模型無(wú)法通過(guò)這些測(cè)試,特別是那些判斷不易察覺(jué)的心理狀態(tài)能力的測(cè)試?!痹撗芯康暮现呖死锼沟倌?貝奇奧(Cristina Becchio)說(shuō),她是德國(guó)漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的認(rèn)知神經(jīng)科學(xué)教授。這項(xiàng)她認(rèn)為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語(yǔ)言模型的反應(yīng)能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預(yù)印本論文中,斯坦福大學(xué)心理學(xué)家邁克爾?科辛斯基(Michal Kosinski)報(bào)告了幾個(gè)模型在幾種常見(jiàn)心智理論測(cè)試中的測(cè)試情況。他發(fā)現(xiàn),其中最好的是OpenAI的GPT-4,它正確完成了75%的任務(wù),他說(shuō),這相當(dāng)于過(guò)去研究中6歲兒童的表現(xiàn)。不過(guò),這項(xiàng)研究中的方法遭到了其他研究人員的批評(píng),他們進(jìn)行了后續(xù)實(shí)驗(yàn),并得出結(jié)論,大語(yǔ)言模型之所以能得出正確答案,往往是基于“淺顯的啟發(fā)”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭(zhēng)論?!霸谡撐闹?,我們的目標(biāo)是使用廣泛的心理測(cè)試,以更加系統(tǒng)的方式來(lái)應(yīng)對(duì)機(jī)器心智理論的評(píng)估挑戰(zhàn)。”該研究的合著者詹姆斯?斯特拉坎(James Strachan)說(shuō),他是一名認(rèn)知心理學(xué)家,目前是漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的訪問(wèn)科學(xué)家。他指出,進(jìn)行嚴(yán)謹(jǐn)?shù)难芯恳馕吨獪y(cè)試人類和大語(yǔ)言模型處理相同任務(wù)的能力,這項(xiàng)研究比較了1907個(gè)人與幾個(gè)流行的大語(yǔ)言模型的能力。

大語(yǔ)言模型和人類都完成了5種典型的心智理論測(cè)試,前3種是理解暗示、反語(yǔ)和失禮。此外,他們還回答了“錯(cuò)誤信念”問(wèn)題,這些問(wèn)題通常用于確定幼兒心智理論的發(fā)展程度。這些問(wèn)題是這樣的:如果愛(ài)麗絲在鮑勃不在房間的時(shí)候移動(dòng)了某樣?xùn)|西,那么鮑勃回來(lái)后應(yīng)該去哪里找這個(gè)東西?最后,他們回答了“奇怪故事”中一些相當(dāng)復(fù)雜的問(wèn)題,這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言,GPT-4占據(jù)了優(yōu)勢(shì)。它的得分在錯(cuò)誤信念測(cè)試中與人類相當(dāng),在反語(yǔ)、暗示和奇怪故事方面的總分高于人類,只在失禮測(cè)試中表現(xiàn)不如人類。為了理解失禮測(cè)試結(jié)果有所不同的原因,研究人員對(duì)該模型進(jìn)行了一系列后續(xù)測(cè)試,探索了幾種假設(shè)。他們得出的結(jié)論是,GPT-4能夠?qū)τ嘘P(guān)失禮的問(wèn)題給出正確答案,但在固執(zhí)己見(jiàn)方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設(shè)置了許多圍欄,“旨在保持模型真實(shí)、誠(chéng)實(shí)和正確”,他認(rèn)為,旨在防止GPT-4產(chǎn)生幻覺(jué)(即編造內(nèi)容)的策略可能會(huì)妨礙它對(duì)一些問(wèn)題輸出觀點(diǎn),比如故事角色是否在高中同學(xué)聚會(huì)上無(wú)意間侮辱了老同學(xué)。

研究人員很謹(jǐn)慎。他們沒(méi)有說(shuō)自己的研究結(jié)果表明大語(yǔ)言模型實(shí)際上擁有心智理論能力,而是說(shuō)大語(yǔ)言模型“在心智理論任務(wù)中的表現(xiàn)與人類行為沒(méi)有區(qū)別”。這就引出了一個(gè)問(wèn)題:如果一個(gè)仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說(shuō),這是一個(gè)社會(huì)科學(xué)家以前從未嘗試回答的問(wèn)題,因?yàn)閷?duì)人類的測(cè)試會(huì)假設(shè)這種品質(zhì)在某種程度上是存在的?!拔覀兡壳斑€沒(méi)有一種方法甚至是一種理念來(lái)測(cè)試心智理論的存在,這是一種現(xiàn)象學(xué)品質(zhì)?!彼f(shuō)。

華盛頓大學(xué)計(jì)算語(yǔ)言學(xué)教授艾米麗?本德(Emily Bender)因堅(jiān)持揭露人工智能行業(yè)的膨脹炒作而成為了該領(lǐng)域的傳奇人物。她對(duì)這個(gè)激勵(lì)著研究人員的問(wèn)題提出了異議?!懊鎸?duì)相同問(wèn)題,文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要?”她問(wèn)道,“我們能夠了解大語(yǔ)言模型內(nèi)部是如何運(yùn)作的嗎?它們可能有什么用處,又可能帶來(lái)哪些危險(xiǎn)?”

本德對(duì)論文中的擬人化表示擔(dān)憂,論文研究人員說(shuō)大語(yǔ)言模型有認(rèn)知、推理和作出選擇的能力,還使用了“大語(yǔ)言模型和人類參與者之間的物種公平比較”這一措辭。本德說(shuō),這“完全沒(méi)有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)的研究結(jié)果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會(huì)帶來(lái)什么影響。雖然這種大語(yǔ)言模型在與人類用戶交互和預(yù)測(cè)用戶需求方面會(huì)做得更好,但它們也可能更多地用于欺騙和操縱。它們會(huì)引來(lái)更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50376

    瀏覽量

    267082

原文標(biāo)題:人工智能在心智理論測(cè)試中戰(zhàn)勝人類

文章出處:【微信號(hào):AI智勝未來(lái),微信公眾號(hào):AI智勝未來(lái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能多模態(tài)與視覺(jué)大模型開(kāi)發(fā)實(shí)戰(zhàn) - 2026必會(huì)

    視覺(jué)大模型特訓(xùn):從原理到部署一站式學(xué)會(huì) 在科技飛速發(fā)展的當(dāng)下,視覺(jué)大模型已成為人工智能領(lǐng)域的一顆璀璨明星,廣泛應(yīng)用于安防監(jiān)控、自動(dòng)駕駛、醫(yī)療影像分析等眾多領(lǐng)域,深刻改變著我們的生活與工作方式。如今
    發(fā)表于 04-15 16:06

    人工智能測(cè)試開(kāi)發(fā)訓(xùn)練營(yíng)2期

    霍格沃茲干貨:AI 測(cè)試常見(jiàn)誤區(qū)與避坑指南 在2026年的技術(shù)版圖中,人工智能已不再是錦上添花的點(diǎn)綴,而是軟件質(zhì)量的基石。然而,隨著大模型(LLM)和生成式AI的深度應(yīng)用,傳統(tǒng)的測(cè)試方法論
    發(fā)表于 04-11 16:42

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?382次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    世界移動(dòng)通信大會(huì)|開(kāi)啟無(wú)線測(cè)試人工智能融合的未來(lái)篇章

    專為當(dāng)下至關(guān)重要的無(wú)線技術(shù)——Wi-Fi 8、6G以及基于開(kāi)放式無(wú)線接入網(wǎng)(Open RAN)的5G基礎(chǔ)設(shè)施——精心打造測(cè)試解決方案。這些技術(shù)對(duì)于在邊緣計(jì)算場(chǎng)景中實(shí)現(xiàn)人工智能應(yīng)用起著決定性作用。穩(wěn)固可靠的連接性是人工智能驅(qū)動(dòng)型應(yīng)
    的頭像 發(fā)表于 02-12 14:34 ?718次閱讀

    開(kāi)發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識(shí)”和“大模型備案信息”填寫 ,以供平臺(tái)審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能生成合成內(nèi)容標(biāo)識(shí) “
    發(fā)表于 02-07 11:44

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問(wèn)題。相比之下,人工智能擅長(zhǎng)快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?717次閱讀

    物理人工智能面臨的安全風(fēng)險(xiǎn)

    機(jī)器人,再到常見(jiàn)的掃地機(jī)器人,物理人工智能系統(tǒng)正變得越來(lái)越智能,也越來(lái)越貼近人類生活。先進(jìn)的3D傳感器、人工智能攝像頭、語(yǔ)音接口
    的頭像 發(fā)表于 11-17 10:54 ?1099次閱讀
    物理<b class='flag-5'>人工智能</b>面臨的安全風(fēng)險(xiǎn)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對(duì)“人工智能+”這個(gè)名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時(shí)代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?920次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    生成式人工智能認(rèn)證:重構(gòu)AI時(shí)代的人才培養(yǎng)與職業(yè)躍遷路徑

    當(dāng)人類站在生成式人工智能(Generative AI)的技術(shù)奇點(diǎn)上回望,會(huì)發(fā)現(xiàn)這場(chǎng)革命早已超越了工具迭代的范疇——它正在重新定義人類與技術(shù)的協(xié)作模式,重塑職業(yè)世界的運(yùn)行邏輯。生成式人工智能
    的頭像 發(fā)表于 05-23 09:29 ?1022次閱讀
    华容县| 垫江县| 阿鲁科尔沁旗| 兴山县| 晋江市| 公安县| 宁阳县| 珲春市| 台东县| 兴安盟| 崇礼县| 武宣县| 达日县| 临城县| 安陆市| 龙江县| 招远市| 西安市| 富蕴县| 册亨县| 苍南县| 荥阳市| 临猗县| 来宾市| 建水县| 左贡县| 赤水市| 读书| 高密市| 陇川县| 禹城市| 乡宁县| 乌恰县| 石棉县| 封丘县| 镇康县| 商丘市| 桓台县| 镇康县| 凤山市| 淮滨县|