日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM發(fā)布最新AI模型,幫視障者“看”到更多

DR2b_Aiobservat ? 來源:YXQ ? 2019-06-25 08:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在IBM最新的論文中,研究人員提出了一種能自主制作多樣化、創(chuàng)造性和符合人類語境的圖片文字說明的模型。實驗證明,圖片的文字說明取得了“良好”的性能,未來可以為強(qiáng)大的新計算機(jī)視覺系統(tǒng)奠定了基礎(chǔ)。

無論是報社、雜志社還是新媒體,編輯們最不愿意干得事情就是為圖片搭配文字說明。事實上這項工作必要且重要但實際操作上又非常枯燥。

不過,一個振奮人心的消息是,AI可能很快就能處理大部分工作。6月18日在加州長灘舉行的2019年計算機(jī)視覺和模式識別會議(CVPR)上,Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu發(fā)表了一篇論文《改進(jìn)圖像說明的對抗性語義對齊》,提出了一種能夠自主制作多樣化、創(chuàng)造性和符合人類語境的圖片文字說明的模型。

在論文中,他們將圖像說明作為一種有條件的GAN(生成式對抗網(wǎng)絡(luò))訓(xùn)練進(jìn)行研究,提出了一種上下文感知的LSTM字幕器和共同注意鑒別器,它們加強(qiáng)了圖像和字幕之間的語義對齊。

研究人員根據(jù)經(jīng)驗著重研究了SCST和ST兩種訓(xùn)練方法的可行性。他們發(fā)現(xiàn)即使沒有直接訪問鑒別器梯度,SCST也比ST顯示出更穩(wěn)定的梯度行為和更好的結(jié)果。進(jìn)而還解決了對這些模型進(jìn)行自動評估的開放性問題,引入了一個新的語義評分,并證明了它與人類判斷的強(qiáng)相關(guān)性。

作為評估范例,一個重要的標(biāo)準(zhǔn)是生成器能夠概括出平常不會一起出現(xiàn)的對象之間的組合關(guān)系。為此研究人員引入了一個小標(biāo)題能脫離上下文(OOC)測試集。OOC與常規(guī)語義評分相結(jié)合,為圖片搭配說明文字得體系提出了新基準(zhǔn)。當(dāng)面向OOC和MS-COCO進(jìn)行測試時,可以發(fā)現(xiàn)基于SCST的訓(xùn)練在語義評分和人類評估方面都有很強(qiáng)的表現(xiàn),有望成為高效離散GAN訓(xùn)練的一種有價值的新方法。

目前,構(gòu)建系統(tǒng)需要解決自動說明文字系統(tǒng)的一個主要缺點:順序語言生成導(dǎo)致語法正確—但同質(zhì)、非自然和語義不相關(guān)的結(jié)構(gòu)。

研究者的方法是通過一個注意力文字說明模型來解決這個問題,模型使用它正在觀察的照片中的場景片段來造句。在每一個生成步驟中,團(tuán)隊的AI都可以選擇關(guān)注最后一步的視覺或文本提示。

為了確保生成的文字說明聽起來不太機(jī)械化,研究團(tuán)隊在訓(xùn)練時使用了生成對抗網(wǎng)絡(luò)(GANs)——由生成樣本的生成器和試圖區(qū)分生成樣本和現(xiàn)實世界樣本的鑒別器組成的兩部分神經(jīng)網(wǎng)絡(luò)。共同注意鑒別器通過一個在像素級匹配場景和生成單詞的模型對新句子的“自然度”進(jìn)行評分,使文字說明者能夠通過圖像和句子成對來進(jìn)行合成。

文字說明系統(tǒng)中的另一個常見問題是,如何避免訓(xùn)練數(shù)據(jù)集的偏差,即經(jīng)常遭受過度擬合(特定數(shù)據(jù)集過于接近的分析)就需要構(gòu)建診斷工具,否則并不適合推廣到學(xué)習(xí)對象(“床和臥室”)出現(xiàn)在看不見的環(huán)境(“床和森林”)中的場景。為此,研究人員提出了一種標(biāo)題圖像的測試語料庫,其設(shè)計方式使得不良模型性能表明過度擬合。

在實驗中,Amazon's Mechanical Turk評估人員負(fù)責(zé)識別AI模型生成的文字說明,并判斷每句話對相應(yīng)圖像的描述程度,給出幾個真實的和合成的樣本,研究人員表示,他們的文字說明總體上取得了“良好”的性能。他們相信他們的工作為強(qiáng)大的新計算機(jī)視覺系統(tǒng)奠定了基礎(chǔ),并打算在未來的工作中繼續(xù)探索這些系統(tǒng)。另外,銜接語言和視覺語義的鴻溝表明需要將常識和推理融入場景理解中。

未來,圖像文字說明的自動生成和場景理解的進(jìn)步,使AI系統(tǒng)可以作為視覺障礙者的助理改善他們的日常生活。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1881

    瀏覽量

    77150
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41544

    瀏覽量

    302861

原文標(biāo)題:IBM發(fā)布最新AI模型,幫視障者“看”到更多

文章出處:【微信號:Aiobservation,微信公眾號:人工智能觀察】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    IBM推出AI驅(qū)動開發(fā)工具IBM Bob

    IBM近日宣布在全球范圍內(nèi)正式推出IBM Bob,一款面向企業(yè)團(tuán)隊的AI驅(qū)動開發(fā)工具。與目前市場上常見的AI編程助手不同,Bob的定位不僅是輔助寫代碼,而是覆蓋從需求規(guī)劃、代碼編寫、測
    的頭像 發(fā)表于 05-09 10:34 ?327次閱讀

    AI模型小龍蝦-OpenClaw-0基礎(chǔ)從入門實戰(zhàn)

    在當(dāng)今的 AI 浪潮中,“大模型”似乎成了一個專屬于算法科學(xué)家和高級程序員的封閉游樂場。滿屏的 Tensor、梯度消失、注意力機(jī)制數(shù)學(xué)推導(dǎo),宛如一堵高聳的墻,將無數(shù)對 AI 充滿熱情的零基礎(chǔ)愛好
    發(fā)表于 05-06 16:04

    HM博學(xué)谷狂野AI模型第四期

    在生成式 AI 浪潮席卷全球的今天,大語言模型(LLM)已成為技術(shù)圈的顯學(xué)。然而,絕大多數(shù)開發(fā)仍停留在“調(diào)用”的層面——通過 API 發(fā)送 Prompt,接收文本回復(fù)。這種“黑盒”
    發(fā)表于 05-01 17:30

    [完結(jié)15章]Java轉(zhuǎn) AI高薪領(lǐng)域必備-從01打通生產(chǎn)級AI Agent開發(fā)

    開發(fā)無可替代的底座優(yōu)勢。 二、 擁抱新范式:從同步阻塞到流式與反應(yīng)式架構(gòu) 傳統(tǒng)的Java Web開發(fā)多基于HTTP的同步請求-響應(yīng)模型,但在與AI模型交互時,這種
    發(fā)表于 04-30 13:46

    Java轉(zhuǎn) AI高薪領(lǐng)域必備 從01打通生產(chǎn)級AI Agent開發(fā) 教程資料

    “價值創(chuàng)造” 為什么是AI Agent?因為Agent代表了軟件工程范式的根本性轉(zhuǎn)移。(讠果aixuetang。xyz) 傳統(tǒng)的SaaS或CRUD系統(tǒng)是“確定性”的,機(jī)器只能按照預(yù)設(shè)的If-Else
    發(fā)表于 04-29 17:08

    AI輔助編程設(shè)計之道:從SpecCode工程實踐

    大語言模型正在重塑軟件開發(fā)的日常。從Copilot各種編程助手,AI生成代碼的能力已經(jīng)滲透許多開發(fā)的工作流中。但在實際應(yīng)用中,一個現(xiàn)象
    發(fā)表于 03-16 13:33

    HarmonyOS 6正式發(fā)布,超能小藝一用就愛!

    景終端設(shè)備上帶來真人感對話、小藝世界、小藝接、AI修圖、小藝慧記等行業(yè)領(lǐng)先的AI智慧體驗,深受消費喜愛。升級
    的頭像 發(fā)表于 10-22 17:43 ?1775次閱讀

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    重磅!騰科技新官網(wǎng)正式上線,AI算力與智能解決方案一鍵直達(dá)

    AI算力模組全棧智能解決方案,從技術(shù)研發(fā)到場景落地,騰科技始終以 “前沿技術(shù)落地” 為定位,助力產(chǎn)業(yè)智能化升級。新官網(wǎng)的上線,是我們與世界對話的新起點,未來,我們期待與
    的頭像 發(fā)表于 10-11 10:57 ?1055次閱讀
    重磅!騰<b class='flag-5'>視</b>科技新官網(wǎng)正式上線,<b class='flag-5'>AI</b>算力與智能解決方案一鍵直達(dá)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片AGI芯片

    、現(xiàn)階段更智能、更接近AGI的6中算法與模型 1、MoE模型 MoE模型作為Transfomer模型的后繼,代表著
    發(fā)表于 09-18 15:31

    IBM聯(lián)合NASA發(fā)布開源AI模型重要突破

    近日,IBM(紐交所代碼:IBM)與美國國家航空航天局 (NASA) 聯(lián)合發(fā)布了一款開創(chuàng)性的開源基礎(chǔ)模型,可理解高分辨率的太陽觀測數(shù)據(jù),從而預(yù)測太陽活動對地球和太空技術(shù)的影響。該
    的頭像 發(fā)表于 09-02 09:16 ?1067次閱讀

    OpenAI開源模型登陸IBM watsonx.ai開發(fā)平臺

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開發(fā)和企業(yè)可自由下載、運行并進(jìn)行定制。其中一款模型現(xiàn)已部署在
    的頭像 發(fā)表于 08-26 15:36 ?1179次閱讀

    科技AI模型應(yīng)用:提效、破局與落地,重塑智能新生態(tài)

    在這場數(shù)字化轉(zhuǎn)型的浪潮中,騰科技AI模型憑借其強(qiáng)大的提效能力、破局的創(chuàng)新思維以及切實的落地實踐,已然成為重塑智能新生態(tài)的重要力量。從企業(yè)辦公中的高效決策支持,教育科研里的學(xué)術(shù)探索
    的頭像 發(fā)表于 08-18 14:06 ?1884次閱讀
    騰<b class='flag-5'>視</b>科技<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>應(yīng)用:提效、破局與落地,重塑智能新生態(tài)

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    與 Nordic 的 nRF54 系列超低功耗無線 SoC 結(jié)合,使得即使是資源極為有限的設(shè)備也能高效運行邊緣 AI。Nordic 目前正在將 Neuton 深度集成自身開發(fā)生態(tài)中,未來會提供更多工具、固件
    發(fā)表于 06-28 14:18

    科技梧桐大模型賦能交通治理

    AI模型技術(shù)正驅(qū)動交通行業(yè)智能化升級。千方科技子公司宇科技于2023年發(fā)布“梧桐”AIoT(人工智能物聯(lián))行業(yè)大模型,采用“通用大
    的頭像 發(fā)表于 05-16 17:23 ?1372次閱讀
    长兴县| 塔城市| 泗水县| 高青县| 阿巴嘎旗| 衡阳县| 凤庆县| 墨竹工卡县| 麻栗坡县| 大竹县| 姜堰市| 南皮县| 太仓市| 聂拉木县| 武定县| 蒙自县| 酉阳| 宜川县| 甘德县| 阜平县| 延安市| 万盛区| 焦作市| 中山市| 象山县| 当雄县| 肥西县| 安陆市| 湖州市| 哈巴河县| 盐山县| 邵阳市| 萨嘎县| 宣化县| 昌都县| 武清区| 临海市| 三门峡市| 财经| 吉水县| 桦川县|