以下文章來(lái)源于谷歌云服務(wù),作者 Google Cloud
從 Chatbot 向 Agentic AI (智能體) 演進(jìn)的過(guò)程中,推理能力的瓶頸 (ReasoningCeiling) 和多模態(tài)鏈路的碎片化是阻礙工程落地的兩大難題。本文深度解析昆侖天工旗下天工 Skywork 如何通過(guò)Google 的 Gemini 3模型家族,并結(jié)合Google Distributed Cloud (GDC)混合云架構(gòu),成功構(gòu)建面向 Windows 生態(tài)的桌面級(jí) Agent,在 GAIA 基準(zhǔn)測(cè)試中實(shí)現(xiàn)全球第一,更助力Skywork在海外用戶復(fù)雜研報(bào)生成場(chǎng)景中將端到端延遲降低 63%。
面對(duì)多步推理死循環(huán)、多模態(tài)處理鏈路割裂以及企業(yè)級(jí)數(shù)據(jù)主權(quán)三大技術(shù)挑戰(zhàn),更好解決海外用戶的各種復(fù)雜需求,Skywork 技術(shù)團(tuán)隊(duì)選擇與Google Cloud深度合作,通過(guò)引入 Gemini 3 模型與機(jī)密計(jì)算技術(shù),完成了底層架構(gòu)的全面重構(gòu)。
突破推理天花板: 基于 Gemini 3 DeepThink 的多路徑?jīng)Q策
推理死循環(huán)與淺層輸出:在早期的海外業(yè)務(wù)實(shí)踐中,當(dāng) Agent 面對(duì)高復(fù)雜度的專業(yè)任務(wù) (如 "閱讀 100 頁(yè)金融財(cái)報(bào)并生成符合品牌規(guī)范的 PPT") 時(shí),往往受限于模型的單鏈推理能力,容易陷入邏輯死循環(huán)或僅能生成淺層的摘要信息,無(wú)法滿足 "專家級(jí)" 交付標(biāo)準(zhǔn)。
解決方案:
Skywork 引入了Google Gemini 3及其Deep Think能力。不同于傳統(tǒng)的 CoT (思維鏈),Gemini 3 允許 Agent 在推理階段同時(shí)探索多條潛在的解決路徑 (Reasoning Paths),并對(duì)中間結(jié)果進(jìn)行自我評(píng)估與修正。
● 架構(gòu)優(yōu)化:從單一的 "Prompt-Response" 模式轉(zhuǎn)變?yōu)?"Plan-Execute-Reflect" 的自主循環(huán)架構(gòu)。
● 性能實(shí)測(cè):在全球通用的 GAIA (General AI Assistant) Benchmark 中,重構(gòu)后的 Skywork Agent 以 82.42% 的準(zhǔn)確率斬獲全球榜首,證明了其在高難度、多步驟現(xiàn)實(shí)任務(wù)中的魯棒性。
鏈路融合: 1M+ 上下文重塑多模態(tài)工作流
碎片化模型的延遲累積:在處理包含圖表、視頻會(huì)議錄音和文本的混合數(shù)據(jù)時(shí),傳統(tǒng)方案通常采用 "流水線模式"。這種包含 5 個(gè)獨(dú)立模型的碎片化管道導(dǎo)致了嚴(yán)重的上下文丟失和極高的端到端延遲,難以滿足海外用戶對(duì)極致流暢體驗(yàn)的需求。
解決方案:
Skywork 利用 Gemini 原生的多模態(tài)理解能力和1M+ Token的超長(zhǎng)上下文窗口,將原本割裂的流水線重構(gòu)為單一的統(tǒng)一數(shù)據(jù)流。
● 技術(shù)實(shí)現(xiàn):摒棄中間件轉(zhuǎn)譯,直接將原生視頻流、音頻流和文檔數(shù)據(jù)注入 Gemini 模型上下文。
● 效率提升:復(fù)雜深度研究報(bào)告的生成時(shí)間從3 小時(shí)大幅縮減至 60 分鐘以內(nèi),生產(chǎn)力效能提升63%,實(shí)現(xiàn)了真正的 "Near Real-time" 交互體驗(yàn)。
混合云架構(gòu): Google Distributed Cloud 支撐的數(shù)據(jù)主權(quán)與機(jī)密計(jì)算
Skywork 的海外市場(chǎng)包括大量對(duì)數(shù)據(jù)隱私極為敏感的金融與法律行業(yè)客戶。這些 "云猶豫" (Cloud-Hesitant) 型企業(yè)要求數(shù)據(jù)在處理過(guò)程中必須滿足嚴(yán)格的數(shù)據(jù)駐留 (Data Residency) 規(guī)定。
解決方案:
為了在利用全球云端算力的同時(shí)保障數(shù)據(jù)主權(quán),Skywork 采用了混合云部署策略:
● 邊緣部署:通過(guò)Google Distributed Cloud (GDC),將 Gemini 驅(qū)動(dòng)的 Agent 部署在海外客戶的本地環(huán)境或邊緣節(jié)點(diǎn)。
● 機(jī)密計(jì)算:啟用 Google Cloud 的機(jī)密計(jì)算節(jié)點(diǎn),確保數(shù)據(jù)在內(nèi)存處理態(tài) (Data-in-use) 全程加密,即使是云服務(wù)商也無(wú)法窺探。這一特性成為 Skywork 成功打開(kāi)國(guó)際高端企業(yè)市場(chǎng)的 "敲門磚"。
● 市場(chǎng)反饋:這一架構(gòu)成功消除了海外高合規(guī)行業(yè)的顧慮,在企業(yè)級(jí)試點(diǎn)項(xiàng)目中實(shí)現(xiàn)了97%的超高用戶留存率。
生態(tài)協(xié)同: One Google 技術(shù)棧的集成優(yōu)勢(shì)
Skywork 的技術(shù)演進(jìn)不僅僅是模型的替換,更是對(duì)"One Google"技術(shù)棧的深度集成。
● Google Workspace API 集成:Agent 可直接通過(guò)安全 API 操作 Docs、Sheets 和 Slides,將非結(jié)構(gòu)化的推理結(jié)果轉(zhuǎn)化為結(jié)構(gòu)化的辦公文檔。
● MSP 合作伙伴支持:在架構(gòu)遷移過(guò)程中,Google Cloud 提供了關(guān)鍵的工程化支持,協(xié)助團(tuán)隊(duì)針對(duì) Gemini 3 的長(zhǎng)上下文特性進(jìn)行了精細(xì)化的 Prompt Engineering 調(diào)優(yōu),確保了復(fù)雜任務(wù)的高并發(fā)穩(wěn)定性。
結(jié)語(yǔ)
從 Claude 遷移至 Gemini 3,天工 Skywork 完成了從 "對(duì)話式 AI" 到 "自主智能體 (AutonomousAgent)" 的技術(shù)跨越,并成功在出海賽道上建立了領(lǐng)先優(yōu)勢(shì)。這一實(shí)踐證明,在構(gòu)建面向全球的下一代桌面級(jí) OS Agent 時(shí),原生多模態(tài)能力、長(zhǎng)上下文推理以及混合云安全架構(gòu)缺一不可。Google Cloud 提供的全棧 AI 基礎(chǔ)設(shè)施,正在成為天工 Skywork 規(guī)?;涞厝蚴袌?chǎng)的核心引擎。
關(guān)于昆侖天工
昆侖天工是昆侖萬(wàn)維旗下子公司,專注 AGI 與 AIGC 業(yè)務(wù),是國(guó)內(nèi)少數(shù)真正踐行全模態(tài)輸入與全模態(tài)輸出路徑的 AI 公司,也是 AI 行業(yè) "務(wù)實(shí)主義" 標(biāo)桿,以實(shí)現(xiàn) AGI 為核心愿景,自研 8 大核心大模型,覆蓋文本、視頻、音樂(lè)、音頻、3D 等多領(lǐng)域,構(gòu)建 "底層架構(gòu)-技術(shù)能力-場(chǎng)景落地" 完整體系。依托底層統(tǒng)一全模態(tài)架構(gòu),打破模態(tài)壁壘,結(jié)合海外布局優(yōu)勢(shì),實(shí)現(xiàn) AI 音樂(lè) Mureka、AI 社交 Linky、AI 智能體 Skywork 等業(yè)務(wù)規(guī)模化變現(xiàn),海外收入占比極高,形成 "研發(fā)-落地-變現(xiàn)-迭代" 良性閉環(huán),憑借技術(shù)硬實(shí)力與商業(yè)落地能力,成為 AGI 賽道最具潛力的落地樣本。
行業(yè):科技
地區(qū):中國(guó)
使用的產(chǎn)品:Confidential Computing,Google Workspace API,Google Gemini
-
Google
+關(guān)注
關(guān)注
5文章
1816瀏覽量
60647 -
AI
+關(guān)注
關(guān)注
91文章
41313瀏覽量
302688 -
模型
+關(guān)注
關(guān)注
1文章
3831瀏覽量
52285
原文標(biāo)題:天工 Skywork 攜手 Google Cloud,以 Gemini 3 定義桌面級(jí) Agent 出海新范式
文章出處:【微信號(hào):Google_Developers,微信公眾號(hào):谷歌開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA與Google Cloud攜手推進(jìn)代理式與物理AI發(fā)展
NetApp與Google Cloud深化合作:重構(gòu)分布式云數(shù)據(jù)基礎(chǔ)設(shè)施的“安全主權(quán)”新范式
Cadence 與 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上擴(kuò)展 AI 驅(qū)動(dòng)的芯片設(shè)計(jì)
Cadence與Google合作,利用ChipStack AI Super Agent在Google Cloud上擴(kuò)展AI驅(qū)動(dòng)的芯片設(shè)計(jì)
亞馬遜云科技發(fā)布Amazon Agent Registry:企業(yè)級(jí)Agent管理邁入統(tǒng)一化新時(shí)代
昆侖萬(wàn)維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一
企業(yè)級(jí)Agent系統(tǒng)研發(fā)公司九科信息用bit-Agent賦能業(yè)務(wù)升級(jí)
昆侖天工Skywork與Google Cloud深度合作發(fā)布桌面級(jí)Agent
評(píng)論