日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IQ測試是否能測量AI的推理能力?

mK5P_AItists ? 來源:未知 ? 作者:胡薇 ? 2018-07-17 14:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿基米德基于對物體體積的抽象理解,悟到了物體的體積與物體浮力之間的關(guān)系。這就是抽象推理的魔力。基于神經(jīng)網(wǎng)絡(luò)機器學習模型取得了驚人的成績,但是測量其推理抽象概念的能力卻是非常困難的。雖然人工智能已經(jīng)可以在策略游戲的對戰(zhàn)中戰(zhàn)勝人類,但是卻在一些簡單任務(wù)方面“無能為力”,特別是需要在新環(huán)境中發(fā)現(xiàn)并重新構(gòu)建抽象概念。

舉個例子,如果你只訓練AI計算三角形的屬性,那么,你訓練的AI系統(tǒng)永遠無法計算正方形或者其他沒有訓練過的形狀的屬性。

又比如下邊這道簡單的IQ測試題。

IQ測試給了DeepMind靈感,是不是也能用其測量AI的推理能力呢?

在以往解決通用學習系統(tǒng)努力的基礎(chǔ)上,DeepMind最新論文提出了一種如何測量機器模型認知能力的方法,并表達了關(guān)于泛化的一些重要見解。

要構(gòu)建更好、更智能的系統(tǒng),使得神經(jīng)網(wǎng)絡(luò)能夠處理抽象概念,需要對其進行改進。

此方法的靈感來源于IQ測試。

創(chuàng)建抽象推理數(shù)據(jù)集

標準的人類智商測試中,通常要求測試者通過應(yīng)用他們?nèi)粘=?jīng)驗學習的原則來解釋感知上簡單的視覺場景。

例如,人類測試者可能已經(jīng)通過觀察植物或建筑物的增長,通過在數(shù)學課上學習加法,或通過跟蹤銀行余額獲取利息增長的情況來了解“漸進”(一些屬性能夠增加的概念)。

然后把這些感性認識上升到理性認識,從而對測試題進行推斷預測,例如圖形的數(shù)量、大小,甚至沿著序列增加顏色強度。

現(xiàn)在機器學習仍然無法理解一些看似簡單的“日常體驗”,這意味著,人類無法輕易地衡量AI將知識從現(xiàn)實世界轉(zhuǎn)移到視覺推理測試的能力。

基于此認知,DeepMind設(shè)計一個實驗,希望使人類視覺推理測試得到很好的利用。這一研究不是從日常生活到視覺推理問題(如人類測試)的知識轉(zhuǎn)移,而是研究知識從一組受控的視覺推理問題轉(zhuǎn)移到另一組問題。

為實現(xiàn)這一目標,DeepMind構(gòu)建了一個用于創(chuàng)建矩陣問題的生成器,涉及一組抽象因子,包括“漸進”之類的關(guān)系以及“顏色”和“大小”等屬性。 雖然問題生成器使用了一小組潛在因子,但它仍然會產(chǎn)生大量獨特的問題。

接下來,DeepMind約束生成器可用的因子或組合,以便創(chuàng)建用于訓練和測試模型的不同問題集,以度量模型可以推廣到留存的測試集的程度。

例如,創(chuàng)建了一組謎題訓練集,其中只有在應(yīng)用于線條顏色時才會遇到漸進關(guān)系,而在應(yīng)用于形狀大小時會遇到測試集。如果模型在該測試集上表現(xiàn)良好,它將提供推斷和應(yīng)用抽象概念的能力的證據(jù),即使在之前從未見過進展的情況下也是如此。

有希望的抽象推理證據(jù)

在機器學習評估中應(yīng)用的典型的泛化機制中,訓練和測試數(shù)據(jù)來自于相同的基礎(chǔ)分布,測試的所有網(wǎng)絡(luò)都表現(xiàn)出良好的泛化誤差,其中一些在略高于75%的情況下實現(xiàn)了令人印象深刻的絕對性能。性能最佳的網(wǎng)絡(luò)明確地計算了不同圖像面板之間的關(guān)系,并且并行地評估了每個潛在答案的適用性。DeepMind將此架構(gòu)稱為Wild RelationNetwork(WReN)。

當需要在先前看到的屬性值之間使用屬性值“插值”來推理,以及在不熟悉的組合中應(yīng)用已知的抽象關(guān)系時,模型的泛化效果顯著。然而,在“外推”機制中,同樣的網(wǎng)絡(luò)表現(xiàn)得糟糕得多,在這種情況下,測試集中的屬性值并不與訓練中看到的值處于相同的范圍內(nèi)。

這種事情發(fā)生在當訓練集中有深顏色的物體而測試集中是淺顏色的物體的謎題中。當模型被訓練來應(yīng)用以前所見的關(guān)系(比如形狀的數(shù)量)到一個新的屬性(如大小)時,泛化性能也會更糟。

最后,當訓練模型不僅預測正確的答案,而且還預測答案的“原因”(即應(yīng)該考慮解決這個難題的特定關(guān)系和屬性)時,DeepMind稱觀察到了改進的泛化性能。

有趣的是,在中性分割中(the neutral split),模型的準確性與它推斷矩陣下正確關(guān)系的能力密切相關(guān):當解釋正確時,模型會選擇當時正確的答案的概率為87%,但當它的解釋錯誤時,性能下降到只有32%。這表明,當模型正確地推斷出任務(wù)背后的抽象概念時,能夠獲得更好的性能。

更微妙的泛化方法

目前的文獻關(guān)注于基于神經(jīng)網(wǎng)絡(luò)的機器學習方法的優(yōu)缺點,通常是基于它們的能力或泛化的失敗。DeepMind的結(jié)果表明,得出關(guān)于泛化的普遍結(jié)論可能是沒有幫助的:測試的神經(jīng)網(wǎng)絡(luò)在某些泛化狀態(tài)下表現(xiàn)得很好,而在其他狀態(tài)下表現(xiàn)得很差。

它們的成功是由一系列因素決定的,包括所使用的模型的架構(gòu),以及模型是否被訓練為其選擇的答案提供可解釋的“原因”。在幾乎所有的情況下,當需要推斷出超出其經(jīng)驗的輸入或處理完全陌生的屬性時,系統(tǒng)表現(xiàn)很差;在這個至關(guān)重要的研究領(lǐng)域為未來的工作創(chuàng)造一個清晰的重點。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4844

    瀏覽量

    108206
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41326

    瀏覽量

    302703
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12441

原文標題:學界 | DeepMind想用IQ題測試AI的抽象思維能力,進展還不錯

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為破解HBM依賴!AI推理黑科技UCM上線,9月正式開源

    8月12日,在2025金融AI推理應(yīng)用落地與發(fā)展論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周越峰宣布,華為此次和銀聯(lián)聯(lián)合創(chuàng)新,推出AI推理創(chuàng)新技術(shù)UCM(
    的頭像 發(fā)表于 08-13 08:58 ?1.1w次閱讀
    華為破解HBM依賴!<b class='flag-5'>AI</b><b class='flag-5'>推理</b>黑科技UCM上線,9月正式開源

    黑馬-Java+AI新版V16零基礎(chǔ)就業(yè)班百度云網(wǎng)盤下載+Java+AI全棧開發(fā)工程師

    AI 能力有兩條典型路徑。初級做法是獨立部署 AI 模型服務(wù)(Python 推理端),Java 業(yè)務(wù)層通過 HTTP/RPC 調(diào)用獲取結(jié)果。這種方式開發(fā)快、解耦好,但延遲與穩(wěn)定性受網(wǎng)
    發(fā)表于 05-01 11:29

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導,其GPU憑借強大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進,重點正從大規(guī)模訓練轉(zhuǎn)向?qū)σ延柧毮P偷?b class='flag-5'>推理和推斷,
    的頭像 發(fā)表于 02-03 17:15 ?3304次閱讀

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時也繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運動、生理信號等)可以留在本地,只上傳推理結(jié)果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    思必馳場景化推理AI重塑智能交互

    AI技術(shù)從“感知”走向“認知”的今天,推理能力正成為推動人工智能向更高階躍遷的核心引擎。
    的頭像 發(fā)表于 12-12 11:31 ?885次閱讀

    華為數(shù)據(jù)存儲與「DaoCloud 道客」發(fā)布AI推理加速聯(lián)合解決方案

    AI產(chǎn)業(yè)已從“追求模型能力極限”轉(zhuǎn)向“追求推理體驗最優(yōu)化”,推理體驗決定用戶與AI的交互質(zhì)感。當前推理
    的頭像 發(fā)表于 11-28 10:03 ?490次閱讀
    華為數(shù)據(jù)存儲與「DaoCloud 道客」發(fā)布<b class='flag-5'>AI</b><b class='flag-5'>推理</b>加速聯(lián)合解決方案

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1517次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實世界的知識整合。 3、測試時計算 測試時計算(TTC)是指在模型推理階段利用額外的計算資源來提升泛
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應(yīng)用

    主要步驟: ①溯因②假說③實驗 1、科學推理的類型 ①演繹②歸納 2、自動化科學發(fā)現(xiàn)框架 AI-笛卡兒-----自動化科學發(fā)現(xiàn)框架,利用數(shù)據(jù)和知識來生成和評估候選的科學假說。 4項規(guī)則:三、直覺
    發(fā)表于 09-17 11:45

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會方便很多
    發(fā)表于 09-17 06:36

    進行時鐘維持能力測試時,如何判斷裝置是否符合IEC標準?

    判斷電能質(zhì)量在線監(jiān)測裝置的時鐘維持能力是否符合 IEC 標準,需依據(jù) IEC 61000-4-30:2025《電磁兼容性 第 4-30 部分:測試測量技術(shù) 電能質(zhì)量
    的頭像 發(fā)表于 09-03 17:34 ?1066次閱讀
    進行時鐘維持<b class='flag-5'>能力</b><b class='flag-5'>測試</b>時,如何判斷裝置<b class='flag-5'>是否</b>符合IEC標準?

    MTA Studio:從測量測試執(zhí)行到數(shù)據(jù)價值洞察,全程賦

    本文導讀致遠儀器MTAStudio是一款面向電力電子測試測量應(yīng)用的綜合性軟件平臺。它集儀器管理、執(zhí)行測試與歷史數(shù)據(jù)深度分析等功能于一體,顯著提升測試
    的頭像 發(fā)表于 08-21 11:34 ?1024次閱讀
    MTA Studio:從<b class='flag-5'>測量</b><b class='flag-5'>測試</b>執(zhí)行到數(shù)據(jù)價值洞察,全程賦<b class='flag-5'>能</b>

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    近日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。中國銀聯(lián)執(zhí)行副總裁涂曉軍、華為數(shù)字金融軍團CEO曹沖出席本次論壇并發(fā)表致辭。論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士發(fā)布AI
    的頭像 發(fā)表于 08-15 09:45 ?1409次閱讀

    PCIe協(xié)議分析儀測試哪些設(shè)備?

    /ASIC加速器 測試場景:分析專用AI推理加速器與主系統(tǒng)的PCIe通信,優(yōu)化數(shù)據(jù)傳輸和指令下發(fā)效率。 應(yīng)用價值:提高推理吞吐量,確保加速器在低延遲場景(如實時
    發(fā)表于 07-25 14:09

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎
    發(fā)表于 07-16 15:29
    福海县| 临颍县| 加查县| 东阳市| 西峡县| 阿拉善右旗| 佳木斯市| 临洮县| 镇雄县| 沅江市| 临沂市| 扬州市| 新密市| 太仓市| 江口县| 台北县| 汾西县| 乐清市| 泉州市| 丰城市| 上思县| 顺义区| 沙雅县| 长治市| 保康县| 万州区| 老河口市| 博爱县| 东港市| 墨竹工卡县| 抚顺市| 铜川市| 阳信县| 卓资县| 麻江县| 邢台市| 惠安县| 临武县| 河池市| 奉节县| 巍山|