作者:微軟全球資深副總裁、微軟AI亞太總裁 張祺
今天,我們正式推出 Office Agent —— 一個(gè)基于開源技術(shù)棧、Anthropic Claude 模型,并采用全新的“TDD-品味驅(qū)動(dòng)開發(fā)(Taste-Driven Development)”范式構(gòu)建的多智能體系統(tǒng)。Office Agent 的目標(biāo)是幫助用戶快速生成高質(zhì)量內(nèi)容:精致的 PowerPoint 演示文稿、可直接使用的 Word 文檔,和即將推出的動(dòng)態(tài) Excel 表格。
Office Agent經(jīng)由多個(gè)專用智能體的協(xié)同,實(shí)現(xiàn)了從規(guī)劃、撰寫到完善的全流程自動(dòng)化,全面提升了Office內(nèi)容生產(chǎn)效率。該系統(tǒng)基于通用型智能體架構(gòu),已通過行業(yè)領(lǐng)先基準(zhǔn)測(cè)試GAIA認(rèn)證,性能領(lǐng)先,在處理復(fù)雜工作流時(shí)兼具可靠性與精細(xì)度。

▲ GAIA 報(bào)告結(jié)果
AI 服務(wù)商 公布的官方指標(biāo)
Manus:2025 年 3 月 10 日;Genspark:2025 年 4 月 25 日;OpenAI DR:2025 年 2 月 2 日。
說明:L1、L2 和 L3 分別表示難度遞增的測(cè)試查詢,從“最簡單”到“最困難”。
01 架構(gòu)設(shè)計(jì)
基于開源的多智能體系統(tǒng)編排
在核心架構(gòu)中,Agent 由多智能體編排引擎驅(qū)動(dòng):
中央規(guī)劃智能體:負(fù)責(zé)協(xié)調(diào)任務(wù)并整合結(jié)果
專用智能體(涵蓋代碼、金融、搜索等領(lǐng)域):并行執(zhí)行各自任務(wù)
安全工具層:集成多種實(shí)用工具并提供沙盒環(huán)境
基于開源框架和社區(qū)創(chuàng)新,Office Agent 實(shí)現(xiàn)了高效協(xié)同的智能體工作流,兼具日常任務(wù)所需的性能與可靠性。

02 TDD - 品味驅(qū)動(dòng)開發(fā)(Taste-Driven Development) 新范式
先立審美之本,后行技藝之工
大多數(shù) AI 智能體生成演示文稿時(shí),僅僅輸出原始代碼,導(dǎo)致生成的文檔版式不均、視覺元素雜亂,用戶不得不進(jìn)行多輪手動(dòng)修正。Office Agent致力于打造精致、專業(yè)的內(nèi)容,為用戶提供更高的價(jià)值。
首先,Office Agent 引入了一種全新的創(chuàng)作方法——品味驅(qū)動(dòng)開發(fā)(TDD),即以品味為導(dǎo)向的開發(fā)理念:
可復(fù)用的“品味設(shè)計(jì)范式”:源自高質(zhì)量、長期積累的內(nèi)部內(nèi)容;
統(tǒng)一的設(shè)計(jì)語言:確保演示文稿整體風(fēng)格一致;
即用且美觀的輸出:兼顧實(shí)用性與審美。
借助TDD,Agent在AI生成內(nèi)容的美學(xué)布局上達(dá)到了更高標(biāo)準(zhǔn)——以演示文稿生成為例,基于TDD框架,優(yōu)雅的PPT生成以“品味提煉”為起點(diǎn):團(tuán)隊(duì)分析了海量高質(zhì)量演示文稿樣本,提取其中的核心品味設(shè)計(jì)藍(lán)圖。這些提煉出的先驗(yàn)知識(shí)被注入智能體的規(guī)劃與執(zhí)行環(huán)節(jié),并直接影響其生成的版式、風(fēng)格與內(nèi)容。
其次,工作流采用迭代循環(huán)。
每則生成內(nèi)容均須通過“內(nèi)容自驗(yàn)證模塊”進(jìn)行審校,評(píng)估質(zhì)量與美感。審校反饋會(huì)回傳給智能體,驅(qū)動(dòng)其自我迭代與優(yōu)化。最終產(chǎn)出為一組 HTML5 幻燈片,既突出設(shè)計(jì)的張力,又兼顧結(jié)構(gòu)的規(guī)范。為最大化提升生成內(nèi)容的可用性,團(tuán)隊(duì)提供了轉(zhuǎn)換工具,可將HTML5自動(dòng)轉(zhuǎn)換為PowerPoint格式,以便用戶在Microsoft PowerPoint中進(jìn)一步編輯。

Office Agent 的流程與輸出示例:
提示詞:“我將進(jìn)行一場(chǎng)關(guān)于神經(jīng)網(wǎng)絡(luò)的講座——能幫我制作教學(xué)幻燈片嗎?”
未來工作趨勢(shì)
提示詞:“創(chuàng)建一份演示文稿,總結(jié)塑造未來工作的全球五大趨勢(shì)(如 AI 采用、遠(yuǎn)程辦公、基于技能的招聘)。請(qǐng)包含 Microsoft WorkLab 的數(shù)據(jù)作為參考來源?!?/p>
咖啡文化演變
提示詞:“制作展示咖啡文化演變的幻燈片?!?/p>
供應(yīng)鏈韌性轉(zhuǎn)型
提示詞:“展示全球企業(yè)供應(yīng)鏈戰(zhàn)略從‘效率優(yōu)先’向‘韌性優(yōu)先’的轉(zhuǎn)變。以雅致的世界地圖、時(shí)間軸圖形展示變遷,用精煉的襯線標(biāo)題和柔和背景烘托整體格調(diào)?!?/p>
其三,自動(dòng)主題:高質(zhì)量輸出的新方式。
長期以來,制作演示文稿時(shí),預(yù)設(shè)主題都是許多用戶的默認(rèn)選擇。長期以來,用戶制作演示文稿時(shí)往往依賴預(yù)設(shè)主題。預(yù)設(shè)主題提供了多樣性,支持用戶個(gè)性化表達(dá),卻往往犧牲了與用戶需求及喜好精準(zhǔn)匹配的可能性。傳統(tǒng)的假設(shè)是,選項(xiàng)越多越好,只要提供足夠多的模板,用戶總能從諸多選項(xiàng)中找到較為合適的。然而,這未必是最佳的設(shè)定。用戶或許并不想在無盡的設(shè)計(jì)中遴選——他們需要的是能夠恰到好處展現(xiàn)其思想與創(chuàng)意的設(shè)計(jì)。
這正是我們?cè)O(shè)計(jì)自動(dòng)主題(auto theming)的原因。它并不是讓用戶在一長串預(yù)設(shè)模板中挑選,而是直接讀取內(nèi)容本身,并生成與之自然契合的設(shè)計(jì)。結(jié)果不只是“又一個(gè)主題”,而是“真正合適的主題”。
示例
其四,專家引導(dǎo)的“風(fēng)格規(guī)則“
TDD 固然提升了質(zhì)量底線,但系統(tǒng)的核心依舊承載著人的判斷。在開發(fā)過程中,設(shè)計(jì)師通過審視和打磨示例案例、精選最具代表性的模式,塑造了系統(tǒng)的“審美品味”。這些設(shè)計(jì)洞察被提煉成風(fēng)格規(guī)則,由智能體在運(yùn)行時(shí)應(yīng)用,從而保證生成結(jié)果既呼應(yīng)核心指令,又能規(guī)?;敵鼍碌膬?nèi)容。
其五,TDDEval——“品味驅(qū)動(dòng)生成”的基準(zhǔn)測(cè)試。
為了評(píng)估 TDD 在 PowerPoint、Excel 和 Word 中的表現(xiàn),團(tuán)隊(duì)開發(fā)了 TDDEval 基準(zhǔn)測(cè)試。與通用型基準(zhǔn)不同,TDDEval確保了知識(shí)型工作的廣度,涵蓋多種測(cè)試任務(wù)。該基準(zhǔn)包括高價(jià)值、具有代表性的場(chǎng)景,例如:
創(chuàng)建商業(yè)計(jì)劃書 PPT;
在 Excel 中生成預(yù)算預(yù)測(cè);
撰寫正式的 Word 報(bào)告。
同時(shí),它還包含邊界場(chǎng)景的測(cè)試,從開放性提示到精確分析請(qǐng)求,確保系統(tǒng)具備足夠的穩(wěn)健性。
質(zhì)量評(píng)估采用雙重視角框架:
內(nèi)容質(zhì)量:評(píng)估輸出在事實(shí)與結(jié)構(gòu)上的完整性,包括:
(a) 是否基于源材料
(b) 主題相關(guān)性
(c) 覆蓋完整性
(d) 邏輯結(jié)構(gòu)
(e) 實(shí)用性
品味評(píng)分:衡量美學(xué)與體驗(yàn)維度,包括:
(a) 視覺吸引力
(b) 布局與組織
(c) 字體排版質(zhì)量
(d) 設(shè)計(jì)一致性
(e) 視覺素材的精選度
結(jié)合這兩個(gè)維度,可以全面評(píng)估輸出是否既正確又具備專業(yè)外觀與即用體驗(yàn)。通過同時(shí)量化“內(nèi)容”和“風(fēng)格”,TDDEval為AI生成的生產(chǎn)力內(nèi)容設(shè)定了更高的質(zhì)量標(biāo)準(zhǔn)。
03 經(jīng)驗(yàn)總結(jié)
通過打造和測(cè)試 Office Agent,我們積累了許多經(jīng)驗(yàn),這些經(jīng)驗(yàn)直接影響了系統(tǒng)的設(shè)計(jì)與表現(xiàn)。它們并揭示了在真實(shí)生產(chǎn)力場(chǎng)景中,讓智能體系統(tǒng)做到可靠、精準(zhǔn)、實(shí)用所需的關(guān)鍵要素。
經(jīng)驗(yàn) 1:何時(shí)應(yīng)優(yōu)先采用通用代碼執(zhí)行,而非任務(wù)專用工具
雖然任務(wù)專用工具在可預(yù)測(cè)、可重復(fù)的場(chǎng)景中表現(xiàn)良好,但通用型智能體需要具備靈活性,并能在多樣化的工具調(diào)用中實(shí)現(xiàn)泛化。為打造高質(zhì)量的通用智能體,Office Agent 采用“code-first”的方法,即允許模型編寫并執(zhí)行代碼(如MP3轉(zhuǎn)寫、PDF 文本提取),而不是依賴任務(wù)專用工具——雖然專用工具更可控、更穩(wěn)定,但它們會(huì)限制靈活性,影響智能體的泛化能力。
這種設(shè)計(jì)讓智能體更像一名全棧開發(fā)者,而不是只會(huì)解決單一任務(wù)的“專才”。
經(jīng)驗(yàn) 2:自我驗(yàn)證提升準(zhǔn)確性率
對(duì)于復(fù)雜或多步驟任務(wù),智能體需要定期驗(yàn)證進(jìn)度并自我評(píng)估,以提高準(zhǔn)確率:
鼓勵(lì)模型重述原始問題,并與當(dāng)前輸出進(jìn)行比對(duì),確保一致性。
插入中間檢查點(diǎn),提升可靠性,尤其適用于需要精確度、篩選或多源信息整合的任務(wù)。
人機(jī)協(xié)作:用戶可要求 Office Agent 審查執(zhí)行結(jié)果或生成內(nèi)容,確認(rèn)是否符合預(yù)期,并提出進(jìn)一步調(diào)整。
經(jīng)驗(yàn) 3:模擬人類瀏覽,而非僅抓取內(nèi)容
瀏覽器工具應(yīng)支持類人化的網(wǎng)頁導(dǎo)航,而不僅僅是頁面抓?。?/p>
智能體不僅要提取原始頁面內(nèi)容,還應(yīng)具備類人瀏覽能力。
讓模型執(zhí)行以下操作:
點(diǎn)擊鏈接、翻頁、滾動(dòng)長頁面;
將每次瀏覽視為持續(xù)的信息收集過程。
將所有中間觀察納入上下文,提升推理能力。
利用基于大語言模型的摘要技術(shù)高效壓縮長篇內(nèi)容,在保留關(guān)鍵信息的同時(shí)優(yōu)化上下文記憶。
經(jīng)驗(yàn) 4:注入偏好知識(shí),提升任務(wù)執(zhí)行質(zhì)量
雖然LLM擁有廣泛的世界知識(shí),但在沒有明確引導(dǎo)時(shí),往往難以形成對(duì)任務(wù)的特定偏好。通過注入先驗(yàn)知識(shí)或偏好(如“處理.docx文件時(shí)使用python-docx”),可以幫助智能體更快選擇最佳執(zhí)行路徑,從而提高一致性和工具選擇的合理性。這種引導(dǎo)還能減少幻覺,確保決策基于可靠、經(jīng)過驗(yàn)證的模式。
04 未來之路
目前,Office Agent 已通過 Frontier 計(jì)劃向 Microsoft 全球版?zhèn)€人和家庭訂閱用戶開放,面向商業(yè)用戶的支持也即將到來。Office Agent是一款“從0到1”的人機(jī)協(xié)同創(chuàng)作工具,能夠從無到有生成高質(zhì)量、基于研究的內(nèi)容;而PowerPoint、Word和Excel中的Copilot則繼續(xù)作為應(yīng)用內(nèi)專家,幫助用戶在不同應(yīng)用中進(jìn)行優(yōu)化、編輯和迭代。兩者結(jié)合,能夠無縫融入用戶的工作流程。
這僅僅是一個(gè)開始。我們團(tuán)隊(duì)正在推進(jìn)智能體的編排能力,豐富審美風(fēng)格庫,并將進(jìn)一步擴(kuò)展其在微軟生態(tài)系統(tǒng)中的集成。Office Agent智能體系統(tǒng)不僅僅是任務(wù)助手,更將重塑知識(shí)型工作的創(chuàng)作、打磨與規(guī)模化完成方式。
-
微軟
+關(guān)注
關(guān)注
4文章
6754瀏覽量
108098 -
模型
+關(guān)注
關(guān)注
1文章
3831瀏覽量
52287 -
Agent
+關(guān)注
關(guān)注
0文章
224瀏覽量
29204
原文標(biāo)題:Office Agent —— 打造“品味驅(qū)動(dòng)”的多智能體系統(tǒng),全面增強(qiáng) Microsoft 365 Copilot
文章出處:【微信號(hào):mstech2014,微信公眾號(hào):微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
亞馬遜云科技發(fā)布Amazon Agent Registry:企業(yè)級(jí)Agent管理邁入統(tǒng)一化新時(shí)代
九天菜菜大模型agent智能體開發(fā)實(shí)戰(zhàn)2026一月班
格靈深瞳元識(shí)金融多模態(tài)智算平臺(tái)全面融入企業(yè)級(jí)Agent操作系統(tǒng)DeepBot-OS
寶馬集團(tuán)AIconic中國多智能體系統(tǒng)正式上線運(yùn)行
亞馬遜云科技Amazon DevOps Agent智能運(yùn)維助手正式可用
RPA低于Agent
【2025夏季班正課】大模型Agent智能體開發(fā)實(shí)戰(zhàn) 課分享
企業(yè)級(jí)Agent系統(tǒng)研發(fā)公司九科信息用bit-Agent賦能業(yè)務(wù)升級(jí)
微軟科技推出Office Agent多智能體系統(tǒng)
評(píng)論