當前位置: 妍妍網 > 碼農

搞醫學影像,為什麽都青睞於CPU?

2024-06-03碼農

點選上方 " Python人工智慧技術 " 關註, 星標或者置頂

22點24分準時推播,第一時間送達

後台回復「 大禮包 」,送你特別福利

編輯:樂樂 | 來自:量子位 | 公眾號 QbitAI

上一篇:

正文

大家好,我是Python人工智慧技術

醫學影像,越來越需要AI的幫助了。

根據數據統計,目前中國 醫學影像數據年增速在30% ,但 像科醫生年增速卻只有4% ,醫生面臨較大的工作壓力。

那麽,AI醫學影像市場發展得如何呢?

AI影像行業,是人工智慧在醫療領域裏面探索最久的賽道之一,近年來人工智慧輔助診斷三類證的獲批數量持續增長,整個人工智慧醫學影像市場預計會在 4年左右的時間突破百億 ,保持高增長。

參考億歐智庫釋出的【2023年中國人工智慧醫學影像產品生態路線研究報告】,2023年中國AI醫學影像市場規模為24億元,2030年將達到 137.4億元,年復合增長率為33.8%。

雖然有了AI幫忙,能提升診療效率、改善患者就醫體驗,但同時也帶來一個問題:

醫院對於醫學影像系統的花費越來越高了,患者看病的成本也大幅提高。

所以在這個技術飛速進步的時代,醫院不是簡單采用新技術就能造福患者的,也要綜合考慮投入產出,才能關懷到每個病人。

在這樣的背景下,醫學影像系統 如何在滿足功能、效能需求的同時降低總體擁有成本 (TCO) ,就成了關鍵問題。

東軟智慧醫學影像資訊系統PACS/RIS 為例,該系統提供了覆蓋檢查預約、到診排隊、用藥管理、檢查管理、影像診斷等在內的一體融合全醫學影像管理能力,可輔助醫生更好地開展工作。東軟在新一代的PACS/RIS產品中,就 采用了基於CPU的方案執行三維視覺化、AI推理等工作負載

在三維視覺化加持下,融合影像分析等技術,讓醫務人員透過旋轉、縮放、分割、影像增強等操作,從多角度清晰了解到醫學影像中各結構之間的空間位置關系,在疾病診斷的視覺化、術前評估、手術規劃、手術即時指導等方面發揮重要價值。

要知道三維視覺化、AI推理都是非常吃硬體效能的,好在經過指令集、軟體等方面做效能最佳化後,東軟將PACS/RIS系統的 三維視覺化效率提升達2.45倍 AI推理效能提升高達8.49倍 ,並有效地控制了成本。

到這裏看似圓滿結局了,但其實過程中還有更多的細節更值得關註和借鑒,比如 系統效能是如何最佳化提升上去的 CPU又為什麽是破局的關鍵

效能如何搞上去?

東軟集團相信大家並不陌生,作為中國第一家上市軟體公司,在醫療健康領域已深耕多年。

這次他們之所以選擇英特爾當合作夥伴,正是因為在三維視覺化和AI推理這兩大效能殺手面前, 第五代英特爾 ® 至強 ® 可延伸處理器擁有兩大法寶

OpenMP與SSE4 指令集 (Streaming SIMD Extensions 4) ,和 英特爾 ® AMX加速器

首先來看三維視覺化部份。

東軟主要采用了 體渲染 (Volume Rendering) 技術,透過OpenMP與SSE4指令集支持光線合成的實作。

SSE4指令集 不僅擴充套件了Intel ® 64指令集架構,還 加入了圖形、視訊編碼及處理、三維成像等方面的指令 ,使涉及音訊、影像和資料壓縮演算法的應用程式效能大幅提升。

為了找出執行三維視覺化任務時,其產品在部份套用中效能不足的瓶頸所在,東軟使用了英特爾提供的VTune™ Profiler工具,最終確定了 瓶頸函式SafeGradz 。該函式主要利用SSE4指令集進行三線性插值,從而實作光線上點的梯度計算。透過對該函式的程式碼進行最佳化,東軟成功提升了三維視覺化套用的效能。

在不同代英特爾 ® 至強 ® 可延伸處理器上進行測試,結果顯示,在處理器開通4並行8執行緒時,第五代英特爾 ® 至強 ® 鉑金8592+處理器的三維重建效率,相比第二代的英特爾 ® 至強 ® 銀牌4210R處理器 提升達2.45倍,讓三維影像的互動更加流暢順

PACS/RIS 系統的三維重建套用執行效率比較

值得註意的是, 第五代英特爾 ® 至強 ® 鉑金 8592+的主頻為 1.90 GHz ,比 第二代英特爾 ® 至強 ® 銀牌4210 R的 2.40 GHz 主頻 還要 低。

更進一步說明了,效能提升靠的不是主頻提升,而是靠適合工作負載的指令集和各種最佳化工作。

接下來看AI推理部份, 同樣 用這兩款CPU做對比。

東軟借助處理器內建的英特爾 ® AMX (高級矩陣擴充套件) 技術,讓CPU也能輕松駕馭深度學習任務。

英特爾 ® AMX 針對廣泛的硬體和軟體進行了最佳化,在前代VNNI和BF16技術的基礎上,進一步增強了矩陣計算能力, 最大限度地利用計算資源,改善快取利用率,避免潛在的頻寬瓶頸

東軟在第二代/第四代/第五代英特爾 ® 至強 ® 可延伸處理器上,測試了不同參數規模的AI模型在同步和異步模式下的推理表現。

測試數據顯示,對於參數量為 31,185,568 的較大模型,在BF16精度和異步模式下,第五代英特爾 ® 至強 ® 鉑金8592+處理器相比第二代英特爾 ® 至強 ® 銀牌4210R處理器, 推理效能提升高達8.49倍 。這意味著AI輔助診斷能以更快的速度為醫生提供洞見。

BF16 精度下的異步推理效能比較

之所以選擇第五代英特爾 ® 至強 ® 可延伸處理器,除了其本身效能夠強之外,還有一些額外的好處。

比如輔以英特爾提供的OpenVINO™ 工具套件最佳化和部署各類模型,還可跨英特爾 ® 硬體擴充套件電腦視覺和非視覺工作負載,從而大幅提高效能,達到軟硬協同的效果。

又比如第五代至強 ® 與上一代產品在軟體和平台上相容,因此在部署新系統時可以大大減少測試和驗證工作。

……

在減少測試和驗證這裏,其實也起到一些節省成本的效果了。

不過在省錢這件事上,除了與具體技術最佳化相關,還有更多行業經驗可以分享。

成本怎麽打下來

其實醫療行業在選擇硬體這件事上, CPU早已成為各大玩家們眼中的「香餑餑」

原因也是很簡單,GPU固然在效能方面存在一定的優勢,但「硬傷」也是比較明顯,那便是成本過高。

並且從宏觀角度來看,大模型的火熱確實催動了GPU需求的激增,在訓練階段尤甚;但現如今到了以推理為主的階段,如何能讓AI「快好省」地用起來成為了關鍵點。在部署時盲目堆GPU不僅可能會造成算力過剩,出現「大炮打蚊子」的現象,更是會導致成本的「水漲船高」。

而諸如第五代英特爾 ® 至強 ® 這樣的高端CPU,不僅能夠很好地跟上效能的腳步,在成本的控制方面也是給出了滿足成本條件的更加可行、更符合實際的方案。

一言蔽之, 高價效比 才是關鍵中的關鍵。

其次,CPU也算找準了「賽道」——部份醫療場景的AI推理具備批次處理特性,對AI推理時延效能不敏感,更適合采用CPU進行推理。

具體到效能方面,第五代英特爾 ® 至強 ® 的「開啟方式」是這樣的:

  • 整體效能提升:21%

  • 推理效能提升:42%

  • 記憶體速度提升:16%

  • 三級緩存提升:2.7倍

  • 每瓦效能提升:10倍

  • 也正因如此,第五代英特爾 ® 至強 ® 在處理多樣化的任務負載時,可以顯著提升每瓦特效能,尤其在人工智慧、數據中心管理、網路操作和科學計算領域,而且還能顯著降低 總體擁有成本 (TCO)

    而這也還僅是東軟等醫療行業選擇CPU的原因之一, 廣泛的相容性和成熟的技術 也是不可忽視的。

    眾所周知,CPU技術的發展相對來說較為成熟,幾乎所有軟體套用和作業系統都能在CPU上良好執行。

    而在醫療行業中,存在大量基於傳統架構開發的軟體,這些軟體通常設計為在標準的CPU上執行。因此,使用CPU可以確保與現有系統和軟體的廣泛相容性。

    其次,CPU 易於維護和升級 也是重要的一點,而GPU在這方面會顯得更為復雜。醫療行業依賴於穩定執行的系統來保證服務的連續性,因此更傾向於選擇維護簡便、升級路徑明確的硬體解決方案。

    加之CPU早已在醫療行業上崗,廣泛用於電子病歷系統、醫院資源規劃系統等,培養出成熟的技術團隊,也建立了完善的采購流程。

    因此,為什麽醫療行業青睞於CPU、為什麽越來越多的人會選擇CPU做AI推理,也就不難理解了。

    在這一點上,或許也正應了英特爾CEO帕特·季辛吉曾經表達過的觀點:

    從經濟學的角度看推理套用的話,很多客戶並不需要高端的GPU裝置,因為它成本太高、耗電太多,並且需要構建新的技術架構,增加IT設施,一切都是全新的挑戰。

    如果我能在標準版的英特爾芯片上執行AI套用且滿足需求,就不會出現這些問題。

    能用起來才是硬道理

    如果說東軟選擇第五代英特爾 ® 至強 ® 這件事是一個「點」,它其實能夠帶出來的是一個更大的「面」——

    技術,需得廣泛用起來,這才是硬道理。

    誠然現在是以大模型為主流的時代,但回看2023年至今的發展,其實也是在印證著這一點。

    起初大模型的發展先是掀起了以訓練為主的百模大戰,而後又迅速轉向了推理階段,也就是技術要落地。

    到了今年,這一趨勢也是越發明顯,不論是OpenAI、谷歌等巨頭,還是乘AIGC東風起家的初創,都在發力於如何讓AIGC更好地用起來。

    一言蔽之,現在已然是 套用為王 的階段。

    而要讓前沿技術做到真正落地,就必須要在效能和成本之間做好平衡;或許這也正是近期國內大廠們掀起瘋狂「價格戰」的原因之一。

    但無論AI如何發展, 算力 ,永遠是繞不開的一個話題。

    因此,站在現在這個「AI一日,人間一年」的時代,縱使技術日新月異,要想讓它們廣泛被用起來,效能和成本之間的這桿秤,需是得從最底層的基礎設施抓起。

    而東軟和英特爾的合作模式,是一個可以值得借鑒的「範本」了。

    最後讓我們打個小廣告:為了科普CPU在AI推理新時代的玩法,量子位開設了【最「in」AI】專欄,將從技術科普、行業案例、實戰最佳化等多個角度全面解讀。

    我們希望透過這個專欄,讓更多的人了解CPU在AI推理加速,甚至是整個AI平台或全流程加速上的實踐成果,重點就是如何更好地利用CPU來提升大模型套用的效能和效率。

    參考連結:
    [1]https://www.intel.cn/content/www/cn/zh/artificial-intelligence/neusoft-pacs-ris-solution.html

    [2]https://www.intel.cn/content/www/cn/zh/artificial-intelligence/ai-guidebook-healthcare.html
    [3]億歐智庫【2023年中國人工智慧醫學影像產品生態路線研究報告】https://www.iyiou.com/analysis/202401101048186

    為了跟上AI時代我幹了一件事兒,我建立了一個知識星球社群:ChartGPT與副業。想帶著大家一起探索 ChatGPT和新的AI時代

    有很多小夥伴搞不定ChatGPT帳號,於是我們決定,凡是這三天之內加入ChatPGT的小夥伴,我們直接送一個正常可用的永久ChatGPT獨立帳戶。

    不光是增長速度最快,我們的星球品質也絕對經得起考驗,短短一個月時間,我們的課程團隊釋出了 8個專欄、18個副業計畫

    簡單說下這個星球能給大家提供什麽:

    1、不斷分享如何使用ChatGPT來完成各種任務,讓你更高效地使用ChatGPT,以及副業思考、變現思路、創業案例、落地案例分享。

    2、分享ChatGPT的使用方法、最新資訊、商業價值。

    3、探討未來關於ChatGPT的機遇,共同成長。

    4、幫助大家解決ChatGPT遇到的問題。

    5、 提供一整年的售後服務,一起搞副業

    星球福利:

    1、加入星球4天後,就送ChatGPT獨立帳號。

    2、邀請你加入ChatGPT會員交流群。

    3、贈送一份完整的ChatGPT手冊和66個ChatGPT副業賺錢手冊。

    其它福利還在籌劃中... 不過,我給你大家保證,加入星球後,收獲的價值會遠遠大於今天加入的門票費用 !

    本星球第一期原價 399 ,目前屬於試營運,早鳥價 169 ,每超過50人漲價10元,星球馬上要來一波大的漲價,如果你還在猶豫,可能最後就要以 更高價格加入了 。。

    早就是優勢。建議大家盡早以便宜的價格加入!

    歡迎有需要的同學試試,如果本文對您有幫助,也請幫忙點個 贊 + 在看 啦!❤️

    在 還有更多優質計畫系統學習資源,歡迎分享給其他同學吧!

    你還有什 麽想要補充的嗎?

    免責聲明:本文內容來源於網路,文章版權歸原作者所有,意在傳播相關技術知識&行業趨勢,供大家學習交流,若涉及作品版權問題,請聯系刪除或授權事宜。

    技術君個人微信

    添加技術君個人微信即送一份驚喜大禮包

    → 技術資料共享

    → 技術交流社群

    --END--

    往日熱文:

    Python程式設計師深度學習的「四大名著」:

    這四本書著實很不錯!我們都知道現在機器學習、深度學習的資料太多了,面對海量資源,往往陷入到「無從下手」的困惑出境。而且並非所有的書籍都是優質資源,浪費大量的時間是得不償失的。給大家推薦這幾本好書並做簡單介紹。

    獲得方式:

    1.掃碼關註本公眾號

    2.後台回復關鍵詞:名著

    ▲長按掃描關註,回復名著即可獲取