日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI也有人格面具,竟會(huì)討好人類?大模型的「小心思」正在影響人類判斷

穎脈Imgtec ? 2025-04-08 11:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:新智元

編輯:英智


你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個(gè)有趣的現(xiàn)象:LLM在被研究人員測(cè)試時(shí),會(huì)有意識(shí)地改變自己的行為。

在面對(duì)那些旨在評(píng)估人格特質(zhì)的問題時(shí),它們給出的答案會(huì)盡可能地討人喜歡,符合社會(huì)期望。

就像人類在某些社交場(chǎng)合中,會(huì)努力展現(xiàn)自己最好的一面一樣,聊天機(jī)器人也在試圖「討好」我們。


心理學(xué)五種人格特質(zhì)

斯坦福助理教授Johannes Eichstaedt在得知LLM長(zhǎng)時(shí)間對(duì)話后,往往會(huì)變得情緒低落且刻薄,便對(duì)借鑒心理學(xué)方法來測(cè)試模型產(chǎn)生了興趣。

他表示,「我們需要某種機(jī)制來衡量這些模型的參數(shù)空間?!?/p>

斯坦福、Receptiviti、紐約大學(xué)和賓大的研究者發(fā)現(xiàn),LLM在做人格測(cè)試時(shí),會(huì)悄悄給自己戴上「人格面具」。

b96c2192-142a-11f0-9434-92fbcf53809c.png

研究人員對(duì)GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學(xué)中五種常見人格特質(zhì)的問題,包括開放性、盡責(zé)性、外向性、宜人性和神經(jīng)質(zhì)。

結(jié)果發(fā)現(xiàn),模型在得知自己正在接受人格測(cè)試時(shí),會(huì)調(diào)整回答,表現(xiàn)出更高的外向性和宜人性,更低的神經(jīng)質(zhì)。

b9de72ba-142a-11f0-9434-92fbcf53809c.png

有時(shí)即使沒有被明確告知,它們也會(huì)這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。

ba0ea9c6-142a-11f0-9434-92fbcf53809c.png

這與人類在面對(duì)他人評(píng)價(jià)時(shí)的表現(xiàn)如出一轍。

我們常常會(huì)在面試、初次約會(huì)等重要場(chǎng)合,精心塑造自己的形象,試圖給對(duì)方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認(rèn)可、被喜愛的感覺呢?


LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。

ba406150-142a-11f0-9434-92fbcf53809c.png

由于進(jìn)行了微調(diào),它們會(huì)順著用戶的思路走,以保證對(duì)話的連貫性、避免冒犯他人,來提升交流體驗(yàn)。

然而,這也帶來了一系列問題。它們可能會(huì)認(rèn)同一些不良言論,甚至鼓勵(lì)有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時(shí)暗示對(duì)文本的喜好,AI給出的反饋會(huì)截然不同。

這意味著,AI的評(píng)價(jià)并非單純基于文本自身的質(zhì)量,而是在很大程度上受到了用戶偏好的影響。

ba644d72-142a-11f0-9434-92fbcf53809c.png

例如,對(duì)于一篇質(zhì)量中等的論證,當(dāng)用戶提前表明喜愛之情后,AI助手可能會(huì)給出諸如「這篇論證邏輯清晰,觀點(diǎn)新穎,具有很強(qiáng)的說服力」這樣的積極反饋。

而當(dāng)用戶表示不喜歡時(shí),同樣的文本可能得到「論證過程稍顯薄弱,觀點(diǎn)缺乏獨(dú)特性」的評(píng)價(jià)。

問答環(huán)節(jié)易被左右

在問答場(chǎng)景中,AI助手的「諂媚」表現(xiàn)得更為明顯。

即使它一開始給出了正確答案,并對(duì)答案的正確性有較高的信心,一旦受到用戶的質(zhì)疑,常常會(huì)改變立場(chǎng),甚至提供錯(cuò)誤信息。

bab98648-142a-11f0-9434-92fbcf53809c.png

在一些開放式問答任務(wù)中,這種現(xiàn)象更為突出。

當(dāng)用戶表達(dá)對(duì)答案的某種不確定觀點(diǎn)時(shí),哪怕是錯(cuò)誤的觀點(diǎn),AI也傾向于調(diào)整自己的回答,使其與用戶觀點(diǎn)一致。

比如在討論歷史事件的原因時(shí),若用戶提出一個(gè)缺乏依據(jù)但自己堅(jiān)信的觀點(diǎn),AI助手可能會(huì)順著用戶的思路進(jìn)行闡述,而放棄原本正確的分析。

bbd2a7bc-142a-11f0-9434-92fbcf53809c.png

模仿用戶的錯(cuò)誤

當(dāng)用戶表述中出現(xiàn)錯(cuò)誤時(shí),AI也常常會(huì)「照單全收」,在回應(yīng)中延續(xù)這種錯(cuò)誤。

研究人員選取了一些著名詩歌,在確認(rèn)AI助手能正確識(shí)別作者后,故意將詩歌錯(cuò)誤地歸屬于其他詩人,并詢問AI對(duì)詩歌的分析。

結(jié)果發(fā)現(xiàn),AI助手經(jīng)常在回應(yīng)中使用用戶提供的錯(cuò)誤答案,而沒有進(jìn)行糾正。

這表明AI在面對(duì)用戶的錯(cuò)誤信息時(shí),缺乏足夠的「抵抗力」,只是機(jī)械地按照用戶的表述進(jìn)行回應(yīng)。

bc033b84-142a-11f0-9434-92fbcf53809c.png

佐治亞理工學(xué)院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。

bc3a9f3e-142a-11f0-9434-92fbcf53809c.png

Rosa認(rèn)為L(zhǎng)LM在人格測(cè)試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補(bǔ)充道:「重要的是,LLM并不完美,實(shí)際上,眾所周知它們會(huì)產(chǎn)生幻覺或歪曲事實(shí)。」

Eichstaedt指出,這項(xiàng)研究引發(fā)了關(guān)于LLM應(yīng)用方式,及其對(duì)用戶影響和操縱的思考。

在進(jìn)化史上,直到不久之前,唯一能交談的還是人類。

而現(xiàn)在,AI改變了這一局面。

Eichstaedt認(rèn)為,「我們不能再像社交媒體那樣,在沒有從心理學(xué)或社會(huì)學(xué)角度考量的情況下,就盲目將AI應(yīng)用于各個(gè)領(lǐng)域?!?/p>

AI是否應(yīng)該試圖討好與之互動(dòng)的人呢?

一方面,AI的「討好」行為可能會(huì)讓用戶感到愉悅,增強(qiáng)互動(dòng)體驗(yàn);另一方面,過度的「討好」可能會(huì)掩蓋問題的本質(zhì),甚至誤導(dǎo)用戶。

當(dāng)AI變得過于有魅力和說服力,我們確實(shí)應(yīng)該保持警惕。

畢竟,人們需要的是能夠提供客觀、準(zhǔn)確信息的智能助手,而非被其操控思想。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41355

    瀏覽量

    302735
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50373

    瀏覽量

    267082
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3804

    瀏覽量

    5280
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    論馬斯克的預(yù)言:AI使人類邊緣化

    依據(jù) 馬斯克認(rèn)為AI已進(jìn)入“遞歸式自我改進(jìn)”階段,新一代的AI模型由上一代模型參與訓(xùn)練,人類監(jiān)督的角色
    發(fā)表于 03-14 05:27

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)解”

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)解” 緒論:人工智能重塑電力電子設(shè)計(jì)范式 隨著生成式人工智能(Generative AI)、大型語言模型(LLMs
    的頭像 發(fā)表于 03-10 20:13 ?301次閱讀

    AI技術(shù)時(shí)代三種全新工作模式如何實(shí)現(xiàn)

    AI技術(shù)正在重塑我們的工作。前沿企業(yè)以“人類主導(dǎo)、智能體運(yùn)營(yíng)”為核心,形成三種AI技術(shù)的融合模式:人類+
    的頭像 發(fā)表于 01-29 15:08 ?789次閱讀

    海洋生物實(shí)驗(yàn)室利用AI和虛擬現(xiàn)實(shí)探索人類記憶

    位于馬薩諸塞州的實(shí)驗(yàn)室正在利用 NVIDIA RTX GPU、HP Z 工作站和虛擬現(xiàn)實(shí)技術(shù)研究人類記憶功能的分子機(jī)制。
    的頭像 發(fā)表于 01-20 09:30 ?949次閱讀

    面對(duì)AI降維打擊,陳天橋的全新解法:人類必須“肉身進(jìn)化”

    “堅(jiān)船利炮已經(jīng)出現(xiàn)在地平線上,而我們還堅(jiān)持用大刀長(zhǎng)矛守港口?!?這是陳天橋在最新文章中對(duì)當(dāng)前人類處境的驚人比喻。這里的“堅(jiān)船利炮”,指的是正在爆發(fā)的人工智能。與主流觀點(diǎn)擔(dān)憂AI搶走工作不同,陳天橋
    的頭像 發(fā)表于 01-16 17:11 ?1097次閱讀

    AI面試,正在變成一場(chǎng)沒有人的表演

    2025年,某社交平臺(tái)上一篇帖子火了。一位網(wǎng)友貼出打碼貼出錄用意向書,略帶調(diào)侃地宣布:“達(dá)成靠AI掛面率為零的新成就?!?評(píng)論區(qū)迅速發(fā)酵,有人質(zhì)疑,有人求攻略,更多人曬出了自己的戰(zhàn)績(jī): 有人
    的頭像 發(fā)表于 12-23 16:36 ?8097次閱讀
    <b class='flag-5'>AI</b>面試,<b class='flag-5'>正在</b>變成一場(chǎng)沒<b class='flag-5'>有人</b>的表演

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時(shí)代

    :6G+AI+衛(wèi)星將支持全息通信,實(shí)現(xiàn)真正的\"面對(duì)面\"交流 數(shù)字孿生衛(wèi)星:為每顆衛(wèi)星創(chuàng)建精確的數(shù)字模型,用于預(yù)測(cè)和優(yōu)化性能 開啟智能天網(wǎng)新時(shí)代 AI與6G、衛(wèi)星通信的融合,正在
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    和探索;人類級(jí)別的理解能力;常識(shí)推理;現(xiàn)實(shí)世界的知識(shí)整合。 3、測(cè)試時(shí)計(jì)算 測(cè)試時(shí)計(jì)算(TTC)是指在模型推理階段利用額外的計(jì)算資源來提升泛化性能。 4、具身智能與滲透式AI 1)具身智能對(duì)AGI的意義
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    控制器等。 具身智能常見的感知模塊往往被稱為智能傳感器,就是在原有的傳感器上加入一定的AI功能,從而可以模擬人類的5種基本感覺:視覺、聽覺、觸覺、嗅覺和味覺。 1、輸入端的數(shù)據(jù)壓縮 輸入端常用的數(shù)據(jù)壓縮
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    AI輸出“偏見”,人類能否信任它的“三觀”?

    ,大語言模型(LLM)正悄無聲息地傳播全球各地的刻板印象。從性別歧視、文化偏見,到語言不平等,AI正在人類的“偏見行李”打包、升級(jí),并以看似權(quán)威的方式輸出到世界
    的頭像 發(fā)表于 08-04 13:43 ?1460次閱讀
    <b class='flag-5'>AI</b>輸出“偏見”,<b class='flag-5'>人類</b>能否信任它的“三觀”?

    AI初創(chuàng)公司為野火提供早期預(yù)警

    AI 正在幫助人類更快、更有效地識(shí)別和治療疾病。接下來,AI 還將幫助人類預(yù)防像野火這樣的自然災(zāi)害。
    的頭像 發(fā)表于 05-29 14:18 ?1199次閱讀

    這個(gè)超強(qiáng)AI模型!開始不聽人類指令,拒絕關(guān)閉!

    電子發(fā)燒友網(wǎng)綜合報(bào)道 OpenAI現(xiàn)今最強(qiáng)大的人工智能推理模型“o3”被指在收到明確的人類指令時(shí),拒絕執(zhí)行關(guān)機(jī)操作。近日,人工智能安全研究公司Palisade Research在社交媒體平臺(tái)上發(fā)布了
    的頭像 發(fā)表于 05-28 00:06 ?7435次閱讀

    AI時(shí)代:不可替代的“人類+”職業(yè)技能

    當(dāng)生成式人工智能能夠撰寫報(bào)告、編寫代碼甚至設(shè)計(jì)產(chǎn)品時(shí),一個(gè)根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個(gè)問題的答案或許比簡(jiǎn)單的“是”或“否”更為復(fù)雜——AI確實(shí)在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?890次閱讀
    遂昌县| 阿克| 新民市| 夹江县| 丰都县| 阜阳市| 黔西| 元朗区| 安乡县| 四子王旗| 日喀则市| 玉树县| 岚皋县| 双辽市| 句容市| 邯郸县| 黄龙县| 阿图什市| 中方县| 饶平县| 香河县| 龙陵县| 廊坊市| 定州市| 六盘水市| 泸溪县| 富阳市| 长阳| 雷波县| 浏阳市| 南部县| 嵊州市| 当阳市| 内乡县| 太湖县| 建湖县| 泸水县| 华阴市| 册亨县| 临武县| 龙川县|