?
產前超聲檢查能夠有效預防和降低出生缺陷,受到了越來越多家庭的重視。然而傳統(tǒng)的產前超聲檢查對于醫(yī)師的專業(yè)能力要求較高,且耗時耗力。針對這些問題,深圳開立生物醫(yī)療科技股份有限公司(以下簡稱:開立醫(yī)療)推出了基于人工智能(AI)技術的 S-Fetus 4.0 產科掃查助手1,能夠有效簡化工作流程,減輕醫(yī)師負擔,并為患者提供更好的診療服務。
為提升性能表現,開立醫(yī)療在基于英特爾 酷睿 i7 處理器的平臺上使用英特爾 oneAPI Base 工具包進行跨架構開發(fā)與優(yōu)化,從而實現更高的經濟性、跨架構擴展性和靈活性。
?
背景
智能超聲診斷面臨諸多挑戰(zhàn)
超聲診斷是一種將超聲檢測技術應用于人體,通過測量了解生理或組織結構的數據和形態(tài),進而發(fā)現疾病、做出提示的一種診斷方法2,現已成為人類疾病診療、尤其胎兒產前篩查重要的影像學診療手段。但是,傳統(tǒng)超聲檢查高度依賴醫(yī)師經驗水平,且手動操作效率低下,給醫(yī)師和醫(yī)院帶來諸多困擾。
為解決上述問題,開立醫(yī)療推出基于人工智能技術的智能診斷超聲解決方案,在方案開發(fā)過程中遇到了如下挑戰(zhàn):
如何進一步優(yōu)化性能
相關的深度學習算法眾多且需要協(xié)同工作,以幫助醫(yī)療機構快速處理不同數據類型的任務,并根據場景無等待地最優(yōu)執(zhí)行用戶發(fā)起的任務。這對于超聲終端的算力、算法優(yōu)化均帶來了較高要求。
如何應對移動應用需求
目前搭載了 S-Fetus 4.0 產科掃查助手的開立醫(yī)療超聲診斷系統(tǒng)為移動型系統(tǒng),對于系統(tǒng)整體的功耗、尺寸有著較高的限制,這給獨立 GPU 的部署帶來了很大的挑戰(zhàn)。
如何面向不同場景實現跨架構擴展
S-Fetus 4.0 產科掃查助手需要跨多種架構進行遷移和擴展,以應對多種復雜場景。
解決
使用英特爾 oneAPI工具包
優(yōu)化超聲診斷
為應對上述挑戰(zhàn),開立醫(yī)療與英特爾合作,探索通過英特爾 oneAPI Base 工具包對 S-Fetus 4.0 產科掃查助手進行優(yōu)化。
硬件層面
在硬件層面,方案采用了基于第 11 代英特爾 酷睿 i7 處理器的算力基礎架構。該處理器實現了更出色的執(zhí)行性能,搭載全新內核和顯卡架構,并具備基于人工智能的智能性能,能夠為各種工作負載提供卓越性能。該處理器具備英特爾 深度學習加速(英特爾 DL Boost)技術,可為 AI 引擎提供強大支持,為人工智能、數據分析等多種復雜負載提供出色的性能支撐。
第 11 代英特爾 酷睿 處理器還集成了英特爾銳炬 Xe 顯卡,充分利用該集成顯卡來提升工作負載的性能。此外,這一顯卡還能夠支持多種數據類型,并采用了低功耗架構。
解決方案的數據處理流程如圖 1 所示。其中英特爾銳炬 Xe 顯卡提供數據密集計算核,負責實時識別追蹤流程,實現高頻實時執(zhí)行(每一幀圖像都要進行處理或智能推理)。英特爾 酷睿 i7 處理器負責標準面決策及調度、自適應切面特征提取、量化分析等流程,執(zhí)行業(yè)務邏輯或空閑期執(zhí)行 AI 推理。

圖1 基于英特爾 酷睿 處理器的
開立醫(yī)療 S-Fetus 4.0 產科掃查助手方案架構圖
軟件工具優(yōu)化
多模態(tài)數據優(yōu)化處理作為一個數據密集與邏輯判斷相結合的模塊,開立醫(yī)療與英特爾使用英特爾 oneAPI 工具包,重點針對這一環(huán)節(jié)進行了 4 個方面的優(yōu)化。優(yōu)化后,開立醫(yī)療 S-Fetus 4.0 產科掃查助手可以靈活調用 CPU 和 iGPU 的資源,大幅提升了性能,在滿足業(yè)務需求的同時,改善了超聲用戶體驗。
優(yōu)化一
開立醫(yī)療使用英特爾 VTune Profiler 對工作負載進行分析,隨后通過英特爾 oneAPI 工具包中的 DPC++ 編譯器對代碼進行重新編譯并生成向量化指令以提升性能。通過這種方式,將工作負載的處理速度從 141ms 大幅縮短到 33ms3。

圖2 標量操作 Vs 向量操作
■ 優(yōu)化二
通過英特爾 VTune Profiler 進一步發(fā)現性能瓶頸后,開立醫(yī)療使用英特爾 Integrated Performance Primitives(英特爾 IPP)中的 API 對其進行替換。通過這一步驟的優(yōu)化,開立醫(yī)療將工作負載的處理速度從 33ms 進一步縮短到 13.787ms4。
■ 優(yōu)化三
通過使用英特爾 IPP 替換源碼中的 openCV 函數,應用代碼在各代英特爾平臺上均能夠很好地運行,并在大規(guī)模數據場景下表現出更好的可擴展性。
■ 優(yōu)化四
S-Fetus 4.0 產科掃查助手應用了英特爾 DPC++ Compatibility Tool,將現有的 CUDA 代碼高效地遷移到DPC++ 代碼,從而實現跨架構運行,大幅縮短了代碼遷移時間

圖3 英特爾 DPC++ Compatibility Tool 工作流程圖
通過上述優(yōu)化,開立醫(yī)療 S-Fetus 4.0 產科掃查助手在基于英特爾 oneAPI DPC++ 的異構平臺上的性能較優(yōu)化前的基準性能數據,實現了近 20 倍的性能提升(具體性能數據見圖 4)5。

圖4 使用英特爾 oneAPI 異構平臺優(yōu)化前后的性能對比6
收益
卓越的性能與跨架構擴展能力
通過采用集成英特爾銳炬 Xe 顯卡的英特爾 酷睿 處理器提供底層算力,并使用英特爾 oneAPI 異構平臺進行優(yōu)化,開立醫(yī)療 S-Fetus 4.0 產科掃查助手實現了性能、經濟性和異構擴展性等方面的兼顧:
● 高性能:通過基于英特爾 oneAPI 工具包的英特爾 XPU 混合架構開發(fā),開立醫(yī)療 S-Fetus 4.0 產科掃查助手實現了近 20 倍的性能提升,為高效的產科智能超聲診斷奠定了堅實的基礎7。
● 更優(yōu)成本:得益于英特爾 酷睿 處理器的強大性能和靈活架構,以及全方位的優(yōu)化,開立醫(yī)療只需使用 CPU + iGPU就可以實現預期的性能指標。同時,由于硬件的精簡,供電、散熱、空間等成本顯著降低,使得其可以搭載在尺寸更小的超聲診斷設備中,更靈活地應對不同場景的需求。此外,CPU + iGPU 的組合也意味著更持久的電池續(xù)航時間,以及更高的穩(wěn)定性與可靠性。
● 異構擴展性:該方案能夠在 CPU、iGPU 等異構化硬件上進行統(tǒng)一編程,有效提升跨架構編程的開發(fā)效率,支持開立醫(yī)療 S-Fetus 4.0 產科掃查助手靈活地在不同的硬件配置中運行,同時確保流暢的用戶體驗。
展望
加速 “AI + 醫(yī)療” 的落地
智能超聲診斷是 “AI + 醫(yī)療” 的重要場景,有助于大幅減少醫(yī)生工作量,提升醫(yī)療業(yè)務流程效率。為了推動 “AI + 醫(yī)療” 技術的落地,英特爾正在與開立醫(yī)療等伙伴合作,通過包含 CPU、iGPU、專用加速器以及 FPGA 的 XPU 混合架構,以及英特爾 oneAPI 工具包等軟硬件產品,加速數字化創(chuàng)新,推動更多智慧化產品與方案在醫(yī)療行業(yè)的落地。
原文標題:英特爾助力開立醫(yī)療推動超聲產檢智能化
文章出處:【微信公眾號:英特爾物聯(lián)網】歡迎添加關注!文章轉載請注明出處。
電子發(fā)燒友App














評論