在人工智能從“技術(shù)突破”走向“產(chǎn)業(yè)深水區(qū)落地”的進(jìn)程中,AI正從云端交互工具,升級(jí)為驅(qū)動(dòng)產(chǎn)業(yè)系統(tǒng)重構(gòu)的“數(shù)字發(fā)動(dòng)機(jī)”。隨之變化的,是算力價(jià)值邏輯的重心:行業(yè)競(jìng)爭(zhēng)不再僅是“訓(xùn)練側(cè)參數(shù)規(guī)模的堆疊”,而是更快轉(zhuǎn)向推理側(cè)的效率、成本與可用性。在這一階段,決定AI應(yīng)用能否規(guī)模化、能否持續(xù)盈利的關(guān)鍵變量,正在從“擁有多少算力”轉(zhuǎn)向“單位算力能穩(wěn)定產(chǎn)出多少高質(zhì)量Token(詞元)以及產(chǎn)出成本”。
弘信電子基于對(duì)產(chǎn)業(yè)趨勢(shì)的判斷,提出并持續(xù)深化“Token工廠”戰(zhàn)略:以“可規(guī)模交付的推理產(chǎn)出”為核心目標(biāo),將算力、平臺(tái)、模型與場(chǎng)景應(yīng)用貫通,推動(dòng)從“提供算力資源”向“交付智力產(chǎn)出能力”的升級(jí)。
Token:AI推理時(shí)代的計(jì)量單位與價(jià)值載體
在技術(shù)層面,Token是大模型理解與生成信息的基本計(jì)量單位。文本、音頻或多模態(tài)信息在模型內(nèi)部,均會(huì)先通過分詞器(Tokenizer)拆分成Token,再進(jìn)行計(jì)算與生成。
在商業(yè)邏輯上,Token是衡量AI服務(wù)可交付產(chǎn)出的核心指標(biāo):
1每一次調(diào)用都涉及輸入與輸出Token,決定系統(tǒng)吞吐和響應(yīng)效率;
2單Token成本與產(chǎn)出速度,直接影響AI在金融、醫(yī)療、工業(yè)等場(chǎng)景的可規(guī)?;瘧?yīng)用和盈利能力。
因此,Token產(chǎn)出效率(Tokens/s)、首Token時(shí)延、單Token成本與穩(wěn)定供給能力,構(gòu)成AI應(yīng)用走向規(guī)?;虡I(yè)化的核心約束條件。
需求躍遷:從“可用”到“規(guī)??韶?fù)擔(dān)”的挑戰(zhàn)
隨著大模型深入企業(yè)流程與多模態(tài)場(chǎng)景,Token需求正在呈現(xiàn)指數(shù)級(jí)增長。公開信息顯示,中國日均Token調(diào)用規(guī)模已達(dá)到140萬億級(jí)別。
更重要的是,需求增長不僅來自調(diào)用次數(shù)增加,還來自任務(wù)結(jié)構(gòu)變化:從文本問答擴(kuò)展到智能體(Agent)多輪調(diào)用、檢索增強(qiáng)生成、代碼執(zhí)行、多模態(tài)生成等更復(fù)雜鏈路。此類鏈路往往對(duì)系統(tǒng)提出更高要求:
1更低時(shí)延(尤其是多輪交互/工具調(diào)用場(chǎng)景);
2更高并發(fā)與更穩(wěn)定的長時(shí)間運(yùn)行;
3更可控的成本結(jié)構(gòu)與資源利用效率。
在這一背景下,企業(yè)最現(xiàn)實(shí)的問題不再是“能不能用AI”,而是能不能以可負(fù)擔(dān)的成本穩(wěn)定用起來。這正是“Token工廠”戰(zhàn)略要解決的產(chǎn)業(yè)痛點(diǎn):把推理產(chǎn)出從“基本可用”變成“規(guī)??山桓丁?。
戰(zhàn)略響應(yīng):以“五層協(xié)同”打造 Token 規(guī)?;a(chǎn)體系
為應(yīng)對(duì)Token稀缺與成本壓力,弘信電子提出的“Token工廠”,圍繞“從能量輸入到智力輸出”的全鏈路工程化體系。其方法論可概括為“五層協(xié)同”:
01能源層:算電協(xié)同優(yōu)化成本
弘信電子在甘肅(慶陽、天水、定西)、新疆等國家級(jí)能源樞紐及算力節(jié)點(diǎn)布局綠色算力,充分利用當(dāng)?shù)氐统杀揪G電資源。通過“算電協(xié)同”調(diào)度機(jī)制,從源頭壓降Token生產(chǎn)的能源成本,同時(shí)保障推理業(yè)務(wù)高可靠性供給。
02芯片層:
堅(jiān)持異構(gòu)兼容,提升適配與交付彈性
在AI推理場(chǎng)景中,不同芯片架構(gòu)在算力密度、能效比、軟件生態(tài)與供應(yīng)鏈確定性方面各有優(yōu)勢(shì)。公司堅(jiān)持混合異構(gòu)算力策略,深度適配燧原科技、華為等國產(chǎn)高性能AI芯片,同時(shí)利用ASIC/NPU架構(gòu)優(yōu)勢(shì)降低推理計(jì)算成本。旗下安聯(lián)通作為NVIDIA中國區(qū)雙料Elite合作伙伴,直接對(duì)接原廠技術(shù)資源,剝離中間溢價(jià),實(shí)現(xiàn)成本優(yōu)化與技術(shù)保障。
03算力層:
以平臺(tái)化調(diào)度提升有效利用率與交付
穩(wěn)定性
推理服務(wù)的核心不僅是“峰值性能”,更是“在真實(shí)負(fù)載下穩(wěn)定輸出”。因此,算力層更需要平臺(tái)化能力:統(tǒng)一納管、彈性調(diào)度、故障隔離、容量規(guī)劃與全生命周期運(yùn)維。弘信電子圍繞智算平臺(tái)化方向推進(jìn)異構(gòu)資源的統(tǒng)一調(diào)度與交付能力建設(shè)。依托自研智算云平臺(tái)實(shí)現(xiàn)算力池化,將資源空轉(zhuǎn)率從行業(yè)平均的60%大幅降至15%以內(nèi),極致釋放硬件有效產(chǎn)出能力。深度融合容芯致遠(yuǎn)AGC(以GPU為核心的AI計(jì)算體系)架構(gòu),將系統(tǒng)中GPU與CPU的配比提升至最高32:1,打破傳統(tǒng)“內(nèi)存墻”與“通信墻”。深度搭載華為昇騰推理卡的燧弘算力服務(wù)器SH-SF-43H01服務(wù)器采用無主板設(shè)計(jì),形成“數(shù)據(jù)不出域、部署更敏捷、交付更可控”的本地化開箱即用AI服務(wù)新模式,實(shí)現(xiàn)算力密度與傳輸效率的雙重突破。
04模型層:
以HonMaaS為載體,推動(dòng)“可用模型”到“可用服務(wù)”
模型落地的難點(diǎn)往往不在“有沒有模型”,而在“模型能否穩(wěn)定運(yùn)行、可控運(yùn)維、可管理迭代”。HonMaaS平臺(tái)對(duì)DeepSeek-V4、通義千問、智譜等百萬級(jí)超長上下文模型進(jìn)行全鏈路優(yōu)化,包括KVCache優(yōu)化和算子融合技術(shù)?;贒eepSeek-V4模型,可實(shí)現(xiàn)推理延遲降低40%,單節(jié)點(diǎn)每秒可穩(wěn)定產(chǎn)出2000Tokens。公司通過“芯模雙向協(xié)同”機(jī)制,以“算子—框架—驅(qū)動(dòng)—硬件”一體化聯(lián)調(diào)方式,與模型廠商共同優(yōu)化底層算子,確保模型高效運(yùn)行與穩(wěn)定交付。
05應(yīng)用層:
把Token變成“可交付的行業(yè)能力”
“Token工廠”的終點(diǎn)不是產(chǎn)出Token本身,而是把Token轉(zhuǎn)化為行業(yè)結(jié)果:效率提升、流程重構(gòu)、成本下降、體驗(yàn)升級(jí)。弘信電子面向醫(yī)療、視頻生成、智能體等高需求場(chǎng)景,以“平臺(tái)能力標(biāo)準(zhǔn)化+場(chǎng)景能力產(chǎn)品化”的方式把推理產(chǎn)出交付到業(yè)務(wù)流程中,形成價(jià)值閉環(huán)。
生態(tài)共振:多維場(chǎng)景實(shí)證,轉(zhuǎn)化極致智力產(chǎn)出
隨著“Token工廠”戰(zhàn)略的深入實(shí)施,弘信電子的技術(shù)紅利正通過生態(tài)共振,精準(zhǔn)轉(zhuǎn)化為各行各業(yè)的“交鑰匙”級(jí)商業(yè)價(jià)值。
01醫(yī)療智算的“精準(zhǔn)點(diǎn)火”
由燧弘華創(chuàng)聯(lián)合泰達(dá)生物研發(fā)的“羲和一號(hào)”端邊診療一體機(jī),內(nèi)置的“羲和一號(hào)”大模型由北三院、北大AI學(xué)院與泰達(dá)生物子公司博雅全健聯(lián)合研發(fā),基于北三院百萬級(jí)真實(shí)病案數(shù)據(jù)訓(xùn)練,擁有千億級(jí)參數(shù)規(guī)模。通過“Token工廠”提供的邊緣推理能力,診室端可實(shí)現(xiàn)秒級(jí)預(yù)問診與精準(zhǔn)分診,在確保隱私數(shù)據(jù)不出域的前提下,大幅緩解醫(yī)療資源的供需矛盾。這一場(chǎng)景的關(guān)鍵不在“更大參數(shù)”,而在“端邊推理可控交付”——把時(shí)延、隱私與穩(wěn)定性納入同一工程體系內(nèi)實(shí)現(xiàn)最優(yōu)解。
02多模態(tài)與視頻生成的“效能提升”
針對(duì)文生視頻、視頻渲染等極度渴求帶寬與吞吐量的場(chǎng)景,弘信電子與英特爾(Intel)戰(zhàn)略合作建立的聯(lián)合實(shí)驗(yàn)室,基于Gaudi 2e硬件架構(gòu)對(duì) 恒星AI進(jìn)行系統(tǒng)級(jí)優(yōu)化,使其綜合算力成本降低45%。而對(duì)于Hobby這種擁有10余個(gè)多模態(tài)業(yè)務(wù)場(chǎng)景的AI社交和心理健康平臺(tái),作為典型的Token消耗大戶,其每分鐘產(chǎn)生的多模態(tài)交互Token高達(dá)百萬量級(jí)。弘信電子通過協(xié)助其從公有云遷移至燧弘慶陽IDC,利用異構(gòu)集群的極高并發(fā)能力,支撐其在成本紅線之內(nèi)的規(guī)?;虡I(yè)擴(kuò)張。該類場(chǎng)景驗(yàn)證“Token工廠”的核心價(jià)值:不是追求單點(diǎn)極限性能,而是用穩(wěn)定吞吐與成本確定性,把多模態(tài)業(yè)務(wù)從試點(diǎn)推向常態(tài)化運(yùn)營。
03智能體的“連續(xù)性保障”
北冥星眸等深耕智能體(Agent)領(lǐng)域的企業(yè),其OpenClaw應(yīng)用具有顯著的“高頻交互、多輪循環(huán)”特征。在這種模式下,用戶一條簡(jiǎn)單的復(fù)雜指令往往會(huì)觸發(fā)后臺(tái)上百輪的模型內(nèi)部調(diào)用,這種幾何級(jí)數(shù)增長的Token需求對(duì)響應(yīng)時(shí)延有著近乎苛刻的要求。弘信電子通過AGC架構(gòu)的超高G:C配比支持與HonMaaS的智能多模型路由,確保Agent在任務(wù)執(zhí)行過程中智力輸出不中斷、不降速,真正實(shí)現(xiàn)Agent應(yīng)用的工程化落地。對(duì)Agent而言,“不中斷、不降速”本質(zhì)上意味著可預(yù)期的服務(wù)等級(jí)(SLA)與可復(fù)用的工程能力,這也是從Demo走向規(guī)模交付的分水嶺。
AI產(chǎn)業(yè)正從“技術(shù)展示”走向“推理交付能力競(jìng)賽”。弘信電子通過“Token工廠”戰(zhàn)略,把算力、芯片、模型和場(chǎng)景應(yīng)用貫通,實(shí)現(xiàn)從基礎(chǔ)資源提供到全棧智力工業(yè)化的躍遷。未來,公司將持續(xù)完善全棧能力,讓每一份電力與算力都能轉(zhuǎn)化為可規(guī)模、可負(fù)擔(dān)、可持續(xù)的智力產(chǎn)出,加速AI賦能千行百業(yè)的進(jìn)程,推動(dòng)新質(zhì)生產(chǎn)力加速形成。
-
AI
+關(guān)注
關(guān)注
91文章
41680瀏覽量
302920 -
人工智能
+關(guān)注
關(guān)注
1821文章
50445瀏覽量
267445 -
大模型
+關(guān)注
關(guān)注
2文章
3834瀏覽量
5288
原文標(biāo)題:深化“Token 工廠”戰(zhàn)略:弘信電子的推理交付新范式
文章出處:【微信號(hào):hon-flex,微信公眾號(hào):弘信電子集團(tuán)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
弘信電子旗下燧弘華創(chuàng)發(fā)布OpenClaw一體機(jī)全家桶
鋰電池自動(dòng)化生產(chǎn)線的精密協(xié)同與效能提升
2026研運(yùn)一體化趨勢(shì):CICD平臺(tái)如何適配信創(chuàng)與規(guī)?;?/b>研發(fā)場(chǎng)景?
菲沃泰全自動(dòng)化生產(chǎn)線實(shí)現(xiàn)規(guī)?;?/b>應(yīng)用
西井科技攜手五糧液集團(tuán)為酒類行業(yè)打造智能駕駛物流新標(biāo)桿
弘信電子成功發(fā)行2025年度第一期科技創(chuàng)新債券
弘信電子與中貝通信簽署戰(zhàn)略合作框架協(xié)議
弘信電子攜手百川智能推動(dòng)醫(yī)療AI技術(shù)落地應(yīng)用
弘信電子以五層協(xié)同打造Token規(guī)?;a(chǎn)體系
評(píng)論