在人工智能邁入“數(shù)據(jù)驅動”的關鍵發(fā)展階段,高質量數(shù)據(jù)集已成為突破技術瓶頸、推動產(chǎn)業(yè)落地的核心引擎。日前,中國信息通信研究院人工智能研究所聯(lián)合清華大學計算社會科學與國家治理實驗室、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟數(shù)據(jù)委員會共同發(fā)布《人工智能高質量數(shù)據(jù)集建設指南》,旨在為業(yè)界建設高質量數(shù)據(jù)集提供有實操價值的指導和參考。標貝科技深度參與指南的編制工作,將產(chǎn)業(yè)實踐經(jīng)驗轉化為標準框架,為行業(yè)洞察與產(chǎn)業(yè)實踐貢獻專業(yè)力量。
隨著大模型技術加速演進,數(shù)據(jù)作為AI核心三要素之一,在算法趨同、算力普惠的競爭格局下正構建起難以復制的差異化壁壘。然而,大量機構面臨目標定位模糊化、實施路徑碎片化、技術底座薄弱化三重挑戰(zhàn),不知道需要什么數(shù)據(jù)集、如何建設數(shù)據(jù)集、怎樣評估數(shù)據(jù)集質量,制約了AI應用高效落地。
系統(tǒng)地從政策、技術、產(chǎn)業(yè)層面介紹了當前高質量數(shù)據(jù)集建設的背景,梳理了高質量數(shù)據(jù)集的定義、特征、分類、建設主體以及“三大建設難點”,提出了人工智能數(shù)據(jù)工程的“五大核心要素”和企業(yè)建設高質量數(shù)據(jù)集“三步走”戰(zhàn)略;分析了高質量數(shù)據(jù)集建設的核心技術,展示了科學、通信、交通、鐵塔、醫(yī)療、文化等領域高質量數(shù)據(jù)集建設實踐。
指南還對未來趨勢進行展望,強調(diào)需從工程能力、技術創(chuàng)新、質量評估、版權合規(guī)、基礎制度創(chuàng)新等層面持續(xù)發(fā)力,并提出了對政府部門和企業(yè)機構的建議,為業(yè)界推進高質量數(shù)據(jù)集建設提供有力支撐。
作為深耕AI數(shù)據(jù)服務領域的代表企業(yè),標貝科技始終致力于為客戶提供高精度、場景化、全流程合規(guī)可控的數(shù)據(jù)解決方案。公司已構建覆蓋語音、視覺、文本等多模態(tài)數(shù)據(jù)產(chǎn)品體系,在智能駕駛、健康運動、人機交互等關鍵領域落地應用。憑借深厚的技術積累與成熟的工程經(jīng)驗,標貝科技為《指南》貢獻了多項來自真實業(yè)務場景的典型案例與系統(tǒng)化方法論。
《人工智能高質量數(shù)據(jù)集建設指南》的發(fā)布,標志著我國AI數(shù)據(jù)建設進入標準化、體系化、協(xié)同化發(fā)展的新階段。未來,標貝科技將繼續(xù)發(fā)揮其在AI數(shù)據(jù)領域的專業(yè)優(yōu)勢,與產(chǎn)、學、研各界密切合作,攜手推進高質量AI數(shù)據(jù)基礎設施建設,賦能千行百業(yè)實現(xiàn)智能化轉型升級,為我國人工智能產(chǎn)業(yè)生態(tài)的持續(xù)創(chuàng)新與領先發(fā)展提供堅實數(shù)據(jù)支撐。
審核編輯 黃宇
-
數(shù)據(jù)
+關注
關注
8文章
7349瀏覽量
95053 -
人工智能
+關注
關注
1821文章
50366瀏覽量
267046 -
大模型
+關注
關注
2文章
3796瀏覽量
5276
發(fā)布評論請先 登錄
萬里紅入選2025“鑄基計劃”高質量數(shù)字化轉型典型案例集
鴻利智匯核心參編助力照明行業(yè)高質量發(fā)展
萬里紅入選信通院2025年高質量數(shù)字化轉型解決方案集
萬里紅核心參編多項人工智能領域重要標準
奇異摩爾參編人工智能加速器互聯(lián)芯粒技術要求團體標準發(fā)布
標貝科技參編《人工智能高質量數(shù)據(jù)集建設指南》
評論