日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4o深夜炸場!AI實(shí)時視頻通話絲滑如人類,Plus功能免費(fèi)可用

穎脈Imgtec ? 2024-05-15 08:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

轉(zhuǎn)自:量子位 | 公眾號 QbitAI

不開玩笑,電影《她》真的來了。

OpenAI最新旗艦大模型GPT-4o,不僅免費(fèi)可用,能力更是橫跨聽、看、說,絲滑流暢毫無延遲,就像在打一個視頻電話。

現(xiàn)場直播的效果更是炸裂:

它能感受到你的呼吸節(jié)奏,也能用比以前更豐富的語氣實(shí)時回復(fù),甚至可以做到隨時打斷。


GPT-4o里的“o”是Omni的縮寫,也就是“全能”的意思,接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出。

它可以在短至232毫秒、平均320毫秒的時間內(nèi)響應(yīng)音頻輸入,與人類在對話中的反應(yīng)速度一致。


這還是一份給所有人的大禮,GPT4-o與ChatGPT Plus會員版所有的能力,包括視覺、聯(lián)網(wǎng)、記憶、執(zhí)行代碼、GPT Store……

將對所有用戶免費(fèi)開放!

eb0e1682-1251-11ef-9118-92fbcf53809c.png

(新語音模式幾周內(nèi)先對Plus用戶開放)在直播現(xiàn)場,CTO Murati穆姐說:這是把GPT-4級別的模型開放出去,其實(shí)她還謙虛了。

在場外,研究員William Fedus揭秘,GPT-4o就是之前在大模型競技場搞A/B測試的模型之一,im-also-a-good-gpt2-chatbot。

無論從網(wǎng)友上手體驗(yàn)還是競技場排位來看,都是高于GPT-4-Turbo級別的模型了,ELO分?jǐn)?shù)一騎絕塵。

eb122dc6-1251-11ef-9118-92fbcf53809c.png

而這樣的超強(qiáng)模型也將提供API,價格打5折,速度提高一倍,單位時間調(diào)用次數(shù)足足是原來的5倍!

追直播的網(wǎng)友已經(jīng)在設(shè)想可能的應(yīng)用,可以替代盲人看世界了。以及確實(shí)感覺比之前的語音模式體驗(yàn)上強(qiáng)上不少。

eb5edc84-1251-11ef-9118-92fbcf53809c.png

鑒于之前不少人就已經(jīng)和ChatGPT語音模式“談戀愛”了,有大膽想法的朋友,可以把你們的想法發(fā)在評論區(qū)了。


總裁Brockman在線演示

知道OpenAI發(fā)布會為什么定在谷歌I/O前一天了——打臉,狠狠打臉。

谷歌Gemini發(fā)布會需要靠剪輯視頻和切換提示詞達(dá)成的偽實(shí)時對話效果,OpenAI現(xiàn)場全都直播演示了。

比如讓ChatGPT在語言不通的兩個人之間充當(dāng)翻譯機(jī),聽到英語就翻譯成意大利語,聽到意大利語就翻譯成英語。


發(fā)布會直播之外,總裁哥Brockman還發(fā)布了額外的5分鐘詳細(xì)演示。而且是讓兩個ChatGPT互相對話,最后還唱起來了,戲劇感直接拉滿。這兩個ChatGPT,一個是舊版APP,只知道對話,另一個則是新版網(wǎng)頁,具備視覺等新能力。(我們不妨取Old和New的首字母,分別叫TA們小O和小N)eb8f021a-1251-11ef-9118-92fbcf53809c.pngBrockman首先向小O介紹了大致情況,告訴她要和一個擁有視覺能力的AI對話,她表示很酷并欣然接受。接著,Brockman讓她稍作休息,并向小N也介紹情況,還順帶展示了小N的視覺能力。只見打完招呼后,小N準(zhǔn)確地說出了Brockman的衣著打扮和房間環(huán)境。而對于要和小O對話這件事,小N也感到很有趣。
接下來就是小O和小N相互對白的時間了,TA們依然是從Brockman的衣著開始聊起,小O不斷提出新的問題,小N都一一解答。接著,他們又談?wù)摿朔块g的風(fēng)格、布置和光線,甚至小N還意識到了Brockman正站在上帝視角凝視著TA們。


如果你看了這段視頻就會發(fā)現(xiàn),畫面中出現(xiàn)了一個女人在Brockman身后做了些惡搞的手勢。這可不是亂入,是Brockman和女人串通好,專門給小N設(shè)計(jì)的一道“考題”。

就在小O和小N聊的正開心的時候,Brockman選擇加入,直接問有沒有看到什么不正常的地方。結(jié)果是小N直接識破了Brockman的小伎倆,直接復(fù)述出了女人在他身后做小動作的場景,小O聽了之后直接感嘆原來在這里享受樂趣的不只有我們兩個。Brockman把這句話當(dāng)成了夸贊,并對小O表示了感謝,還愉快地加入了TA們的對話。之后是最后也是最精彩的部分,在Brockman的指揮下,小O和小N根據(jù)剛才聊天的內(nèi)容,直接開啟了對唱模式。只過了簡單幾輪,銜接地就十分密切,而且旋律悠揚(yáng),音色也是和真人毫無二致。
最后視頻以Brockman唱出的一句Thank you結(jié)束,在視頻外的推文中他還透露新的語音對話功能將在數(shù)周內(nèi)向Plus用戶開放。

ebcac93a-1251-11ef-9118-92fbcf53809c.png


端到端訓(xùn)練,一個神經(jīng)網(wǎng)絡(luò)搞定語音文本圖像

正如奧特曼在發(fā)布會前所說,GPT-4o讓人感覺像魔法一樣,那么它是如何做到的呢?非常抱歉,這次非但沒有論文,連技術(shù)報告也不發(fā)了,只在官網(wǎng)Blog里有一段簡短的說明。在GPT-4o之前,ChatGPT語音模式由三個獨(dú)立模型組成,語音轉(zhuǎn)文本→GPT3.5/GPT-4→文本轉(zhuǎn)語音。我們也可以讓舊版ChatGPT語音模式自己講一下具體是怎么個流程。ebe410c0-1251-11ef-9118-92fbcf53809c.jpg這樣一來,整個系統(tǒng)的延遲足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丟失了大量的信息,它無法直接感受音調(diào)、多個說話者或背景噪音,也無法輸出笑聲、唱歌聲,或表達(dá)情感。ebfabea6-1251-11ef-9118-92fbcf53809c.jpgGPT-4o則是跨文本、視覺和音頻端到端訓(xùn)練的新模型,這意味著所有輸入和輸出都由同一個神經(jīng)網(wǎng)絡(luò)處理。在語音翻譯任務(wù)上,強(qiáng)于OpenAI專門的語音模型Whisper-V3以及谷歌和Meta的語音模型。ec8d0a68-1251-11ef-9118-92fbcf53809c.png在視覺理解上,也再次反超Gemini 1.0 Ultra與對家Claude Opuseca698d4-1251-11ef-9118-92fbcf53809c.png

雖然技術(shù)方面這次透露的消息就這么多了,不過也有學(xué)者評價。

一個成功的演示相當(dāng)于1000篇論文。

ecaabb4e-1251-11ef-9118-92fbcf53809c.png


One More Thing

除了OpenAI帶來的精彩內(nèi)容之外,也別忘了北京時間5月15日凌晨,谷歌將召開I/O大會。到時量子位將繼續(xù)第一時間帶來最新消息。另外根據(jù)網(wǎng)友推測,GPT-4o這么強(qiáng),全都免費(fèi)開放了,這是勸大家不續(xù)訂ChatGPT Plus了的意思嗎?那肯定不是啊~ecaef9f2-1251-11ef-9118-92fbcf53809c.png鑒于OpenAI春節(jié)期間在谷歌發(fā)布Gemini 1.5 Pro后半小時左右用Sora狙擊了一把,明天OpenAI還有新活也說不定呢?直播回放

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41495

    瀏覽量

    302806
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50400

    瀏覽量

    267231
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    374

    瀏覽量

    16996
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPT-5震撼發(fā)布:AI領(lǐng)域的重大飛躍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月8日凌晨1點(diǎn),OpenAI以一長達(dá)1小時的線上發(fā)布會正式推出GPT-5。這場被業(yè)界稱為“AI進(jìn)化分水嶺”的發(fā)布,終結(jié)了長達(dá)兩年的技術(shù)猜測,更以多維度性能
    的頭像 發(fā)表于 08-09 07:44 ?1w次閱讀
    <b class='flag-5'>GPT</b>-5震撼發(fā)布:<b class='flag-5'>AI</b>領(lǐng)域的重大飛躍

    堵車到崩潰?5分鐘搞懂ETC“”通行背后的通信黑科技

    毫秒級交易、5.8GHzDSRC、雙向加密認(rèn)證——ETC如何讓你縱享五一將至,你還把高速收費(fèi)站當(dāng)停車場嗎?每逢五一、國慶等節(jié)假日,高速公路收費(fèi)站往往成為巨大的“停車場”。人工收費(fèi)車道上,車輛
    的頭像 發(fā)表于 04-09 19:33 ?537次閱讀
    堵車到崩潰?5分鐘搞懂ETC“<b class='flag-5'>絲</b><b class='flag-5'>滑</b>”通行背后的通信黑科技

    論馬斯克的預(yù)言:AI使人類邊緣化

    呈指數(shù)級爆炸增長,在這種級別的AI面前,人類的智能總和將顯得微不足道,從而導(dǎo)致人類被邊緣化。 合理性 技術(shù)發(fā)展趨勢角度:從當(dāng)前技術(shù)發(fā)展來看,AI確實(shí)在不斷進(jìn)步,
    發(fā)表于 03-14 05:27

    AI功能(SC171開發(fā)套件V3)2026版

    AI功能(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 人體目標(biāo)檢測(Yolov5)案例----基于SC171開發(fā)套件V3 8
    發(fā)表于 01-15 11:18

    4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    人類專家能專注于更復(fù)雜的問題。 預(yù)測性維護(hù):讓衛(wèi)星\"長壽\"的秘密 衛(wèi)星在軌運(yùn)行壽命通常為10-15年,但設(shè)備故障往往是突然發(fā)生的。AI通過分析衛(wèi)星運(yùn)行數(shù)據(jù)(溫度、功耗、信號
    發(fā)表于 10-11 16:01

    成都匯陽投資關(guān)于大模型白熱化,應(yīng)用加速分化

    ? ? ? ?大模型: 加速多模態(tài)研發(fā) ,閉源模型逐步逆襲開源 多模態(tài)技術(shù)路線尚未收斂 , 國內(nèi)外大模型廠商持續(xù)刷新 SOAT。 圖片領(lǐng)域 ,GPT-4o 圖像生成功能引發(fā)熱潮后 ,谷歌
    的頭像 發(fā)表于 09-09 09:30 ?1121次閱讀

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    項(xiàng)目01_I2C_OLED復(fù)制一份,重命名為02_PWM 查看原理圖得知,P102引腳可用GPT功能。 點(diǎn)擊configuration.xml文件,按下面幾張圖所示內(nèi)容配置。 打開引腳配置界面(Pin
    發(fā)表于 09-01 15:20

    基于改進(jìn)模觀測器的PMSM無位置傳感器控制

    免費(fèi)獲取完整資料~~~ 內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評論支持一下,謝謝! 【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容,謝謝!
    發(fā)表于 08-06 14:38

    當(dāng)貝X5S Plus搭載MediaTek MT9669旗艦投影芯片

    當(dāng)貝 X5S Plus 搭載的 MediaTek MT9669 旗艦投影芯片集成高效能、多核 CPU、GPU 及專用 AI 處理單元(APU),以強(qiáng)悍算力,保障你的流暢投影體驗(yàn)。
    的頭像 發(fā)表于 07-17 17:58 ?2346次閱讀

    物聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall實(shí)時通話功能讓智能交互觸手可及

    “Aircall的最新技術(shù)成果——實(shí)時通話功能,為物聯(lián)網(wǎng)設(shè)備賦予了‘語音生命’。無論是智能音箱、車載終端還是工業(yè)傳感器,都能通過實(shí)時語音交互接收指令、反饋信息。這一變革讓設(shè)備不再局限于
    的頭像 發(fā)表于 07-07 09:26 ?921次閱讀
    物聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall<b class='flag-5'>實(shí)時</b><b class='flag-5'>通話</b><b class='flag-5'>功能</b>讓智能交互觸手可及

    具有增益調(diào)度切換增益的永磁同步電機(jī)模控制

    純分享帖,需要者可點(diǎn)擊附件免費(fèi)獲取完整資料~~~*附件:具有增益調(diào)度切換增益的永磁同步電機(jī)模控制.pdf【免責(zé)聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字涉及
    發(fā)表于 06-05 11:25

    感應(yīng)電機(jī)模變結(jié)構(gòu)控制系統(tǒng)的半實(shí)物仿真

    結(jié)構(gòu)控制的感應(yīng)電機(jī)電流內(nèi)環(huán)控制策略,在分析半實(shí)物仿真機(jī)理的基礎(chǔ)上,搭建了模變結(jié)構(gòu)控制系統(tǒng)的實(shí)時仿真模型,實(shí)現(xiàn)了系統(tǒng)硬件在環(huán)仿真,并分別對 控制和模變結(jié)構(gòu)控制的電流控制效果進(jìn)行了對比實(shí)驗(yàn)。結(jié)果表明,
    發(fā)表于 05-28 15:45

    InfiSight 智睿視界,擁抱 AI 做更落地的 ToB 生意

    過去一年, GPT-4、Sora 相繼問世,國內(nèi)大模型公司紛紛投身于追趕 OpenAI 的浪潮中。一個月前 GPT-4o 的亮相更是讓人們見證了從科幻到科技的華麗轉(zhuǎn)變,它強(qiáng)大的反應(yīng)能力和幾乎實(shí)時
    的頭像 發(fā)表于 05-14 18:20 ?703次閱讀

    INT-based Routing(基于遙測的智能路由)如何重構(gòu)AI集群流量調(diào)度?

    GPT-4o參數(shù)規(guī)模突破10萬億、千卡集群成為AI訓(xùn)練標(biāo)配的今天,全球互聯(lián)網(wǎng)正經(jīng)歷著前所未有的流量風(fēng)暴。當(dāng)單次模型訓(xùn)練可產(chǎn)生相當(dāng)于YouTube全球三日流量的數(shù)據(jù)洪流,當(dāng)分布式推理系統(tǒng)要求微秒級延遲保障,傳統(tǒng)網(wǎng)絡(luò)架構(gòu)的流量調(diào)度機(jī)制正面臨系統(tǒng)性崩塌。路由技術(shù)如何破局
    的頭像 發(fā)表于 05-12 17:06 ?1060次閱讀
    INT-based Routing(基于遙測的智能路由)如何重構(gòu)<b class='flag-5'>AI</b>集群流量調(diào)度?
    赤水市| 恩平市| 萨迦县| 酉阳| 拜泉县| 防城港市| 永昌县| 定南县| 富裕县| 石家庄市| 吕梁市| 博客| 博爱县| 闽清县| 融水| 宁陕县| 清远市| 新安县| 侯马市| 巩义市| 台山市| 麻城市| 双峰县| 陇南市| 石首市| 岐山县| 依安县| 报价| 邛崃市| 龙南县| 汉沽区| 安陆市| 库车县| 齐齐哈尔市| 道真| 蓬安县| 海安县| 镇安县| 兴国县| 西贡区| 勐海县|