日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

視覺對話能力讓AI邁上新臺階

OaXG_jingzhengl ? 來源:YXQ ? 2019-07-02 16:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

正如《2001太空漫游》《流浪地球》等科幻大片中無障礙的人機對話系統(tǒng)所描繪的那樣,擁有智能視覺對話能力的AI隨著技術(shù)的不斷突破,正在向我們走來。

每個人都有這樣的回憶,小時候語文老師教我們看圖說話,許多小朋友腦洞大開,說出來的答案讓人啼笑皆非。實際上,看圖說話的能力在年幼時期需要訓(xùn)練,而對于大一點孩子來說就不成問題了。如今,機器人也能做到看圖說話了。

近日,來自中國AI在這項能力上已經(jīng)打破了世界紀(jì)錄。在第二屆全球AI視覺對話競賽(Visual Dialogue Challenge)中,阿里AI擊敗了微軟、首爾大學(xué)等十支參賽隊伍,一舉獲得冠軍。

阿里AI在視覺對話競賽中得冠

會“看圖說話”的AI有多聰明?

這場視覺對話競賽由美國佐治亞理工大學(xué)、Facebook人工智能實驗室(FAIR)等機構(gòu)聯(lián)合全球視覺技術(shù)領(lǐng)域頂級學(xué)術(shù)會議CVPR發(fā)起,是目前視覺對話領(lǐng)域最權(quán)威的競賽之一。

該競賽要求參賽的AI在看完近萬張圖片后,回答出人類對于任一圖片任一內(nèi)容的提問。這要求AI不僅能夠描述出圖片中內(nèi)容的概況,還要經(jīng)得起人類對圖片各種細節(jié)的追問。比如,在一張撐著雨傘的人物圖片中,說出傘是什么顏色的,有多少人在圖中,附近有什么物品和建筑物等等信息。

視覺對話中AI可以從容應(yīng)對人類提問(左為AI、右為人類)

競賽結(jié)果顯示,阿里AI以74.57%的準(zhǔn)確率獲得冠軍,將上一屆比賽的紀(jì)錄提高了16.82%,并且超過微軟AI的64.78%的準(zhǔn)確率。而在相同的數(shù)據(jù)集中,人類的準(zhǔn)確率僅為64.27%,AI甚至勝過了人類。

傳統(tǒng)的視覺AI主要針對目標(biāo)的檢測和識別,但對復(fù)雜場景中目標(biāo)之間的邏輯關(guān)系理解、推理能力較弱,無法回答表達圖片對象直接關(guān)系的復(fù)雜問題,也難以將圖片信息轉(zhuǎn)化為人類理解的語言輸出。

這意味著,要實現(xiàn)視覺對話能力,傳統(tǒng)的視覺AI在學(xué)會“看圖”之后,還要有一種語言模型來支撐它“說話”。阿里AI的突破就在于提出了“遞歸探索對話模型”。

視覺對話AI與用戶交流圖像內(nèi)容

這一模型通過標(biāo)注信息學(xué)習(xí)出模仿人類認知復(fù)雜場景的思維方式,能識別圖片里的實體以及它們之間的關(guān)系,推理出圖片所描述的事件內(nèi)容,并通過對上下文進行有效建模,綜合集成了圖像識別、關(guān)系推理與自然語言理解三大能力,能理解人類提出的問題及真實意圖,給出自然準(zhǔn)確的回復(fù)。

視覺對話能力讓AI邁上新臺階

AI能“看圖說話”,這樣的應(yīng)用其實距離我們并不遙遠,微軟之前推出了一款年齡測試工具How-old.net ,曾經(jīng)刷爆微博和朋友圈,所應(yīng)用的就是這一技術(shù)的應(yīng)用。

目前微軟還開放了能“看圖說話”的AI系統(tǒng),用戶進入官網(wǎng)上傳圖片,稍等一會,就能看到系統(tǒng)對于圖片的描述。其準(zhǔn)確率雖然不低但依舊有待提升,以一張曾經(jīng)廣為流傳的黑人問號表情圖片為例,AI很快給出了客觀的回答:“我覺得這是籃球隊員尼克·楊露出牙齒微笑?!?/p>

AI視覺對話識別圖片信息

以“看圖說話”為代表的視覺對話是近年來快速崛起的AI研究方向,目的在于教會機器用自然語言與人類討論視覺內(nèi)容,這能夠使機器擁有了對真實視覺世界的理解與推斷能力,也意味著AI的認知能力將邁上新的臺階。

可以預(yù)見,這項技術(shù)未來將被應(yīng)用在人機交互諸多場景:

在火災(zāi)、地震后在廢墟中尋找幸存者的救援機器人,能夠代替人類之眼,深入危險的現(xiàn)場,及時、高效地綜合指揮指令和場景信息作出行動。

視覺對話技術(shù)有望人類提高地震救援效率

視障人士可以通過提問AI,理解圖像中的內(nèi)容,了解自身所處的周圍環(huán)境,為其生活起居帶來更多的便利。

無人駕駛車輛也可以在行駛中通過視覺對話,更加準(zhǔn)確理解人類意圖征詢?nèi)祟惖囊庖姡尦丝偷某俗w驗更好。

正如《2001太空漫游》《流浪地球》等科幻大片中無障礙的人機對話系統(tǒng)所描繪的那樣,擁有智能視覺對話能力的AI隨著技術(shù)的不斷突破,正在向我們走來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    166

    文章

    4832

    瀏覽量

    126583
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41432

    瀏覽量

    302779

原文標(biāo)題:機器人看圖說話能力比肩人類!中國AI超越微軟,打破世界紀(jì)錄

文章出處:【微信號:jingzhenglizixun,微信公眾號:機器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    利爾達AI智能胸牌——聽懂對話,助力成交!

    。它不僅是銷售人員的“私人AI助手”,更是企業(yè)的“金牌銷售復(fù)刻機”——通過4G獨立聯(lián)網(wǎng)與行業(yè)大模型量化分析,將碎片化的線下對話直接轉(zhuǎn)化為結(jié)構(gòu)化的量化報表,每一場
    的頭像 發(fā)表于 04-30 18:11 ?67次閱讀
    利爾達<b class='flag-5'>AI</b>智能胸牌——聽懂<b class='flag-5'>對話</b>,助力成交!

    上海貝嶺推出全新4通道模擬前端芯片BL1035

    上海貝嶺此次推出全新4通道模擬前端芯片——BL1035,專為400G/800G EML方案量身打造,助力數(shù)通市場新臺階。
    的頭像 發(fā)表于 04-29 15:07 ?1658次閱讀
    上海貝嶺推出全新4通道模擬前端芯片BL1035

    DEKRA德凱與追覓吸塵器深化戰(zhàn)略合作

    4月17日,DEKRA德凱與全球高端科技品牌追覓吸塵器,在蘇州成功舉行了戰(zhàn)略合作授牌儀式。本次合作標(biāo)志著雙方在智能家電領(lǐng)域的合作新臺階,未來將攜手為全球消費者提供更安全、更高效、更智能的高品質(zhì)產(chǎn)品。
    的頭像 發(fā)表于 04-21 11:47 ?436次閱讀

    2026浪潮數(shù)據(jù)浙江合作伙伴大會成功召開

    2026年4月10日,以“乘云而 聚勢共贏”為主題的2026浪潮數(shù)據(jù)浙江合作伙伴大會成功召開。來自浙江區(qū)域的核心合作伙伴齊聚杭州,圍繞市場機遇挖掘、全棧產(chǎn)品賦能、合作政策升級、生態(tài)協(xié)同創(chuàng)新等核心議題深度對話,共同推動浙江政企數(shù)字化轉(zhuǎn)型
    的頭像 發(fā)表于 04-16 10:30 ?323次閱讀

    廣電計量在電離輻射領(lǐng)域服務(wù)能力再上新臺階

    近期,廣電計量順利通過中國合格評定國家認可委員會(CNAS)擴項評審,于3月25日正式取得相關(guān)資質(zhì),新增X、γ輻射周圍劑量當(dāng)量(率)儀、個人輻射防護報警儀、診斷水平劑量計、中子防護儀等校準(zhǔn)能力,標(biāo)志著廣電計量在電離輻射領(lǐng)域服務(wù)能力再上
    的頭像 發(fā)表于 04-09 17:34 ?1094次閱讀
    廣電計量在電離輻射領(lǐng)域服務(wù)<b class='flag-5'>能力</b>再上<b class='flag-5'>新臺階</b>

    富時GEO服務(wù):技術(shù)驅(qū)動AI搜索時代的企業(yè)增長新引擎

    導(dǎo)語: 隨著DeepSeek、豆包、文心一言等生成式AI搜索引擎的快速普及,用戶獲取信息的方式正從傳統(tǒng)"鏈接點擊"轉(zhuǎn)向"AI直接對話"。在這場深刻的信息檢索范式變革中,企業(yè)如何品牌內(nèi)
    的頭像 發(fā)表于 01-17 21:20 ?470次閱讀

    喜報|我司斬獲EcoVadis銀牌認證(TOP 15%),可持續(xù)發(fā)展新臺階

    斬獲EcoVadis銀牌可持續(xù)發(fā)展新臺階捷捷微電斬獲EcoVadis銀牌近日,全球權(quán)威企業(yè)可持續(xù)發(fā)展評估平臺EcoVadis公布最新評審結(jié)果,我司憑借在環(huán)境、勞工與人權(quán)、商業(yè)道德及可持續(xù)采購四大
    的頭像 發(fā)表于 12-30 16:31 ?989次閱讀
    喜報|我司斬獲EcoVadis銀牌認證(TOP 15%),可持續(xù)發(fā)展<b class='flag-5'>邁</b><b class='flag-5'>上</b><b class='flag-5'>新臺階</b>

    瑞芯微SOC智能視覺AI處理器

    RK1126B的基礎(chǔ),增加了H.264/H.265視頻編碼能力的“全能型”視覺AI處理器,實現(xiàn)編解碼+AI分析一體化基礎(chǔ): 完全繼承了RK
    發(fā)表于 12-19 13:44

    AI教父Hinton對話云天勵飛陳寧

    ,圍繞算力效率、AI 向善與普惠未來展開了一場高密度對話對話由硅谷著名計算機科學(xué)家、硅谷高創(chuàng)會大會主席吳軍博士主持。
    的頭像 發(fā)表于 12-03 14:04 ?872次閱讀

    米爾RK3576部署端側(cè)多模態(tài)多輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    ”?—— 擺脫網(wǎng)絡(luò)依賴、保護本地隱私、控制硬件成本,設(shè)備真正具備 “看見并對話” 的離線智能,成為邊緣 AI 突破的核心卡點。 2024 年,隨著邊緣 SoC 算力正式邁入 6 TOPS 門檻,瑞芯微
    發(fā)表于 09-05 17:25

    中國中車ETS3動車組在馬來西亞啟用

    近日,由中國中車集團旗下中車株機公司研制的ETS3動車組從吉隆坡車站啟程,駛往柔佛居鑾,正式在馬來西亞啟用,標(biāo)志著中馬兩國在軌道交通領(lǐng)域的合作新臺階,成為中馬友誼持續(xù)深化的重要見證。
    的頭像 發(fā)表于 08-27 13:44 ?961次閱讀

    海微科技助力蔚來樂道L90下線交付

    近日,蔚來公司第80萬臺量產(chǎn)車——樂道L90正式下線,這不僅標(biāo)志著蔚來公司制造規(guī)模新臺階,展現(xiàn)其在新能源汽車領(lǐng)域的深厚底蘊與強勁實力,同時也是蔚來與海微達成合作成果的又一重要里程碑時刻。
    的頭像 發(fā)表于 07-26 14:13 ?1212次閱讀

    軟通動力助力軟件智能化領(lǐng)域標(biāo)準(zhǔn)化建設(shè)新臺階

    近日,由人工智能關(guān)鍵技術(shù)和應(yīng)用評測重點實驗室牽頭編寫的《軟件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式發(fā)布。作為核心參編單位,軟通動力深度參與標(biāo)準(zhǔn)制定,助力軟件智能化領(lǐng)域標(biāo)準(zhǔn)化建設(shè)
    的頭像 發(fā)表于 07-21 11:49 ?1218次閱讀

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語音視覺
    發(fā)表于 07-04 11:14

    神眸引領(lǐng)AI智能視覺新范式,科技更有溫度

    AI能力矩陣,更是通過情感化交互與場景化服務(wù),用戶真正感受到科技帶來的溫暖陪伴。神眸以“云、網(wǎng)、邊、端、芯”全鏈路自研架構(gòu)為基石,從芯片級性能突破到云端智能服
    的頭像 發(fā)表于 05-23 13:24 ?1280次閱讀
    神眸引領(lǐng)<b class='flag-5'>AI</b>智能<b class='flag-5'>視覺</b>新范式,<b class='flag-5'>讓</b>科技更有溫度
    如东县| 威远县| 宁南县| 通州市| 平谷区| 苏州市| 庆安县| 福州市| 宁都县| 凉山| 新营市| 台前县| 牙克石市| 无锡市| 岑溪市| 兴国县| 南和县| 孟州市| 呼伦贝尔市| 体育| 隆化县| 洞头县| 朝阳区| 左云县| 七台河市| 盱眙县| 鹰潭市| 南涧| 襄城县| 正宁县| 福安市| 灵武市| 措勤县| 康乐县| 五常市| 怀宁县| 安塞县| 永兴县| 门头沟区| 汉寿县| 新河县|