最近,人工智能(AI)和機器學習(ML)模型在各個領域的應用都取得了顯著的進展,相關討論也在不斷增多。學界認為,AI和ML模型應當是透明的,可解釋的和可信的。
在此背景下,可解釋AI(XAI)領域在迅速擴張。通過解釋一些復雜模型,比如深度神經(jīng)網(wǎng)絡(DNN)結(jié)果如何生成,可解釋AI在提高人工智能系統(tǒng)可信度和透明度方面前景廣闊。此外,許多研究員和業(yè)內(nèi)人士認為,使用數(shù)據(jù)起源去解釋這些復雜的模型有助于提高基于人工智能系統(tǒng)的透明度。
本文對數(shù)據(jù)起源、可解釋AI(XAI)和可信賴AI(TAI)進行系統(tǒng)的文獻綜述,以解釋基本概念,說明數(shù)據(jù)起源文件可以用來提升基于人工智能系統(tǒng)實現(xiàn)可解釋性。此外,文中還討論了這個領域近期的發(fā)展模式,并對未來的研究進行展望。
對于有意了解關于數(shù)據(jù)起源,XAI和TAI的實質(zhì)的諸多學者和業(yè)界人士,希望本文能成為助力研究的一個起點。
一文章提綱
1. 引言
2. XAI和TAI的基本概念
3. 數(shù)據(jù)起源, XAI, TAI的文獻計量分析
4. 數(shù)據(jù)起源, XAI, TAI的關系的思考
5. 數(shù)據(jù)起源, XAI, TAI未來十年發(fā)展趨勢
6. 結(jié)論
二內(nèi)容總結(jié)
引言
人工智能的應用廣泛,且對人類影響深遠。但現(xiàn)有的模型只有結(jié)果而不涉及過程,因此,很多人擔心這些模型不透明,不公平。比如“機器學習和深度學習是怎么工作,怎么產(chǎn)生結(jié)果”是一個黑箱問題。對此,有一個解決辦法是通過XAI,也就是建設TAI去解釋復雜模型。
作者引用文獻闡述XAI和TAI的技術方法——數(shù)據(jù)起源的重要性和有效性。本文對這三者進行文獻綜述并關注他們在數(shù)據(jù)科學中的應用?;陉P鍵詞在Scopus文獻庫中進行文獻搜索,采用滾雪球的策略研究2010年到2020年的論文。
XAI和TAI的基本概念
AI可解釋性和可信度的背景
作者先列舉了多例AI和機器學習的漏洞證明了提高可解釋性的重要。又說明TAl的基本原則是建立合法透明的AI系統(tǒng)。然后列舉各個國家在數(shù)據(jù)科學領域到XAI方法和戰(zhàn)略計劃,學者Wing擴充了計算機系統(tǒng)的維度,并認為需要權衡多種維度。

圖1 XAI和TAI的谷歌趨勢

圖2 文獻庫中論文的時間分布
實現(xiàn)XAI和TAI的技術途徑

圖3 ML模型分類及對應XAI方法
這些方法可以生成結(jié)果,但是為了增加AI系統(tǒng)的透明度,需要應用數(shù)據(jù)起源作為XAI的補充技術。
多方面的文獻計量分析
文中進行文獻計量分析去搜集這三者之間在論文中相互關聯(lián)的證據(jù)。作者說明選擇數(shù)據(jù)庫的原因和查詢的關鍵字以及分析工具是Bibliometrix和VOS Viewer。

圖4 參考文獻標題中的單詞可視化詞云

圖5 關鍵詞共現(xiàn)圖聚類
三者關系思考
來源標準的關注度和相關工作增加
作者進行文獻綜述,整理研究主題后得出:

圖6 三者話題相似度
文中也介紹了一些能夠使得Provenance文檔化的工具,比如W3C PROV本體,OpenML等。
數(shù)據(jù)起源實踐及對XAI和TAI的支持
對于現(xiàn)實世界的實踐,作者進行文獻綜述,講述數(shù)據(jù)起源模型類別,W3C PROV的六個組件,然后作者簡單介紹Renku等應用工具軟件。
未來十年展望
本部分討論了在AI/ML模型中造成偏差的原因,數(shù)據(jù)不可追蹤,沒有數(shù)據(jù)起源支持的決定是不可信的。
這項工作是社會-技術交叉領域問題,需要從兩方面解決問題。
開發(fā)數(shù)據(jù)起源功能應用前應掌握用戶需求
應開發(fā)更多的自動化工具記錄數(shù)據(jù)起源,并將其標準化、使數(shù)據(jù)起源記錄可查詢可訪問。
結(jié)論
用事后解釋的方法來解釋AI或機器學習模型是不夠的,需要數(shù)據(jù)起源加入增加系統(tǒng)可信度和透明度。作者總結(jié)了文章行文順序,強調(diào)數(shù)據(jù)起源對于XAI和TAI的重要性。
審核編輯 :李倩
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4844瀏覽量
108203 -
自動化
+關注
關注
31文章
5989瀏覽量
90687 -
人工智能
+關注
關注
1821文章
50366瀏覽量
267055
原文標題:文獻綜述:確保人工智能可解釋性和可信度的來源記錄
文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Questa One 智能驗證:釋放人工智能在功能驗證中的潛力
是德科技推出AI軟件完整性構(gòu)建器解決方案
云知聲榮獲2025人工智能治理示范案例
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
UPS電源—確保UPS電源穩(wěn)態(tài)測試靠譜的妙招
中國中車通過中國信通院可信AI人工智能數(shù)據(jù)集質(zhì)量四級評估
挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!
BSI亮相2025世界人工智能大會:以國際標準構(gòu)建可信AI未來
鐵路巡檢升級:云翎智能高精度執(zhí)法記錄儀+指揮調(diào)度系統(tǒng)實現(xiàn)故障秒級響應
最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型篇)
墨芯人工智能入選中國戰(zhàn)略性新興產(chǎn)業(yè)典型案例
如何構(gòu)建邊緣人工智能基礎設施
中國科學院西安光機所在計算成像可解釋性深度學習重建方法取得進展
文獻綜述:確保人工智能可解釋性和可信度的來源記錄
評論