在醫(yī)學(xué)影像技術(shù)及其交叉學(xué)科領(lǐng)域,有許多問題需要借助高性能計(jì)算才能得到解決,如醫(yī)學(xué)影像重建、放療劑量評估、影像基因組學(xué)等。中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所醫(yī)學(xué)影像室研究員高欣帶領(lǐng)的數(shù)字介入診療課題組,從2014年開展了云計(jì)算技術(shù)在醫(yī)學(xué)影像計(jì)算領(lǐng)域的應(yīng)用研究,取得了進(jìn)展,并已應(yīng)用于醫(yī)學(xué)影像的數(shù)據(jù)處理。以放療劑量評估為例,課題組成員劉仰川等針對在本地計(jì)算機(jī)上進(jìn)行放療劑量評估耗時(shí)嚴(yán)重的問題,開展了基于云計(jì)算加速的放療劑量評估研究。研究人員提出了利用在云計(jì)算平臺Amazon EC2上構(gòu)建Hadoop集群(見圖1),實(shí)現(xiàn)基于MapReduce的GATE仿真加速的方案(見圖2)。在該方案中,GATE是一款Monte Carlo仿真軟件,具備完善的放療劑量評估功能;Hadoop是一款開源軟件,它提供了分布式計(jì)算框架MapReduce,還提供了大數(shù)據(jù)儲存框架HDFS。
在云端Hadoop集群中,節(jié)點(diǎn)(又稱主機(jī)、實(shí)例)均來自同一個(gè)機(jī)器鏡像(Amazon Machine Image,AMI),且被分配了不同的角色,其中一個(gè)Master節(jié)點(diǎn)負(fù)責(zé)計(jì)算任務(wù)的分配、一個(gè)Secondary NameNode節(jié)點(diǎn)負(fù)責(zé)對Master節(jié)點(diǎn)進(jìn)行備份、多個(gè)Slave節(jié)點(diǎn)負(fù)責(zé)計(jì)算。本地計(jì)算機(jī)通過SSH通訊協(xié)議實(shí)現(xiàn)跟云端集群之間的數(shù)據(jù)上傳與下載。
在MapReduce框架中,包含Map和Reduce兩種任務(wù),它們均在worker節(jié)點(diǎn)內(nèi)運(yùn)行,分別負(fù)責(zé)計(jì)算和合并。Map任務(wù)首先從HDFS中下載仿真代碼文件(sub-macro),再調(diào)用GATE進(jìn)行仿真,并將中間結(jié)果(sub-dose、sub-dose uncertainty)以鍵值對(key-value pairs)的形式發(fā)送出去。Reduce任務(wù)將具有相同鍵(key)的中間結(jié)果合并,并將最終結(jié)果傳輸至HDFS。
為了驗(yàn)證基于MapReduce的GATE仿真加速方案的有效性,科研人員構(gòu)建了18MeV的X光束入射水模實(shí)驗(yàn),分別進(jìn)行了本地單線程仿真、云端多集群仿真、云端多光束強(qiáng)度仿真、以及集群可靠性仿真。實(shí)驗(yàn)中,作為云計(jì)算加速的典型結(jié)果,含有64個(gè)worker節(jié)點(diǎn)的集群,相對單個(gè)worker節(jié)點(diǎn)集群和本地計(jì)算機(jī),分別取得了41倍和32倍的加速比。該方案除了能應(yīng)用于醫(yī)學(xué)影像領(lǐng)域外,還可應(yīng)用于生物醫(yī)學(xué)領(lǐng)域的諸多方面,如基因測序、蛋白質(zhì)分析等。
上述研究成果發(fā)表在Australasian Physical & Engineering Sciences in Medicine上。
該研究工作得到了國家自然科學(xué)基金、中科院科研裝備研制項(xiàng)目及蘇州科技計(jì)劃項(xiàng)目的資助。
圖1.云端Hadoop集群構(gòu)建示意圖
圖2.基于MapReduce的GATE仿真加速方案