應該每個(gè)醫學(xué)生都經(jīng)歷過(guò)看病理切片的痛苦吧,瞇眼盯著(zhù)顯微鏡好幾分鐘“找不同”真是一大折磨,可是不經(jīng)歷這千萬(wàn)次的折磨,面對某些長(cháng)得特別像的腫瘤咱們就得麻爪了。比如說(shuō)同屬非小細胞肺癌的肺腺癌(LUAD)和鱗狀細胞癌(LUSC),雖然兄弟倆長(cháng)得很像,但是在臨床上治療選擇卻大相徑庭。
幾十年來(lái),醫生們就是靠著(zhù)訓練有素的火眼金睛來(lái)為患者尋找診斷依據的,不過(guò)或許很快醫生們就能夠從這種乏味的重復勞動(dòng)中解脫出來(lái)了。
今天發(fā)表在《自然醫學(xué)》的一項新研究帶來(lái)了紐約大學(xué)研究者的最新成果。研究者們利用大量數字化病理切片圖像重新訓練了谷歌的深度學(xué)習算法InceptionV3,AI識別癌組織和正常組織準確率達到99%,區分腺癌和鱗癌的準確率達到97%,遠超前人研究![1]
更令人驚訝的是,該算法能夠從切片圖像中識別肺癌常見(jiàn)六大基因突變,包括已有靶向療法的EGFR突變,準確率能達到73%-86%。目前在單GPU上檢測一個(gè)數字切片的時(shí)間在20秒左右,研究者認為,更新的技術(shù)加上多GPU并行處理,每個(gè)切片的檢測時(shí)間可以只有幾秒鐘!
無(wú)論發(fā)病率還是死亡率,肺癌都是我國癌癥中的頭號殺手,每年新發(fā)病例達到80萬(wàn),死亡人數則接近70萬(wàn)。在占據了絕大多數的非小細胞肺癌中,肺腺癌(LUAD)和肺鱗狀細胞癌(LUSC)是兩個(gè)主要的亞型[1],而它們二者的現有治療方案,從常規化療到最新的靶向治療,都是截然不同的[2],所以準確區分亞型就成了治療的一大關(guān)鍵。
病理組織切片是臨床上常用的分型手段。不過(guò)一是在幾十倍放大顯微鏡下,數據量巨大,二是癌細胞形態(tài)也未必有很明顯的區別能夠一下看出來(lái),怎么能夠解放醫生的雙眼就很值得一究了。
此前有研究者利用隨機森林模型開(kāi)發(fā)了病理切片的識別算法,區分腫瘤組織和正常組織的準確率達到85%,亞型分型準確率則達到了75%[2];另一項研究則實(shí)現了83%的分型準確率[3]。
紐約大學(xué)的研究者們選擇了谷歌的一種開(kāi)源算法InceptionV3[4],這是一種常用于分析視覺(jué)圖像的卷積神經(jīng)網(wǎng)絡(luò )(CNNs),在谷歌手里,它能夠識別一千種以上的對象,它也已經(jīng)成功被用于檢測皮膚癌癥[5]和糖尿病視網(wǎng)膜病變[6]了。
那么怎么讓AI認識腫瘤組織和正常組織呢?給它喂知識!
研究者從基因組數據共享(GDC)數據庫中獲得了1634個(gè)數字化病理切片圖像,其中包括1176個(gè)肺部腫瘤組織和459個(gè)正常肺組織,它們又被分為三組,分別用來(lái)訓練、驗證和檢測。
考慮到整個(gè)數字切片數據量很大,沒(méi)法直接用來(lái)分析,研究者們還把每個(gè)切片又進(jìn)一步分為512×512像素的碎片圖像,根據切片大小要分幾十到幾千份不等,平均每個(gè)切片分為約500個(gè)碎片。
不得不說(shuō)機器真是聰明,吃了這些知識之后它一下就成了病理專(zhuān)家,區分腫瘤組織和正常組織的準確率達到99%,跟真人專(zhuān)家達到一個(gè)水平;在區分正常組織、鱗癌組織和腺癌組織上,準確率則達到了96.8%!
研究者請了三位病理學(xué)家來(lái)和AI較量,兩位專(zhuān)攻胸外,一位是解剖學(xué)專(zhuān)家??偟膩?lái)說(shuō),三位歷經(jīng)千錘百煉的專(zhuān)家,水平和AI是基本一致的。那些AI分類(lèi)錯誤的切片,有50%至少有一名專(zhuān)家也看錯了,說(shuō)明腺癌和鱗癌的區分確實(shí)很困難。此外,專(zhuān)家看錯的83%(45/54)切片都能夠被AI正確分類(lèi),說(shuō)明這個(gè)系統還是很有作為二次校正使用的潛力的。
除了準確,AI的另一個(gè)優(yōu)點(diǎn)就是快。一般情況下,醫生看一個(gè)切片怎么也要幾分鐘,病理組織特別復雜的情況下,或許還用動(dòng)用免疫組化分析,那診斷時(shí)間就要超過(guò)24小時(shí)了。
AI就快得多了。目前研究者使用單個(gè)TeslaK20mGPU進(jìn)行分析,平均每個(gè)數字切片分為500個(gè)碎片,分析只要大概20秒,如果采用多GPU并行的方式運行,差不多幾秒鐘就能出結果了!目前最大的障礙反而在掃描系統上,放大20倍的切片掃描需要2-2.5分鐘,不過(guò)FDA去年才批準了最新的超高速數字化病理學(xué)掃描儀[7],相信這也不會(huì )是什么難闖的關(guān)。
研究者還在來(lái)自紐約大學(xué)的獨立數據庫中進(jìn)行了檢測,AI仍舊能夠在83%-97%的情況下正確分型??紤]到紐約大學(xué)保存的腫瘤樣本純度遠遠不如GDC的樣本,其中含有更多的炎癥、血管、血凝塊、壞死區域等“噪點(diǎn)”,樣本保存方式也不太一樣,研究者認為,只要數據量上來(lái)了,準確率也會(huì )隨之提升。
接下來(lái),研究者準備嘗試訓練AI從病理切片中“看”出突變,這可是多高明的醫生都做不到的!
為了保證足夠的樣本量,研究者只選擇了突變率高于10%的基因和腺癌樣本,總共納入了320個(gè)切片、212000個(gè)碎片用于訓練和驗證,62個(gè)切片、44000個(gè)碎片用于測試。AI猛學(xué)一頓之后,果然就能夠認出STK11、EGFR、FAT1、SETBP1、KRAS、TP53等六個(gè)基因在肺癌中的常見(jiàn)突變了,準確率從73%到86%不等!
而且從數據來(lái)看,面對多種類(lèi)型的EGFR突變,免疫組化分析(IHC)只能檢測到最常見(jiàn)的兩種p.L858R和p.E746_A750del,AI還能夠檢測到更多的突變和缺失,例如p.G719A,p.L861Q和p.E709_T710delinsD。
就像我們前面說(shuō)過(guò)的,EGFR已經(jīng)有了相應的靶向治療方案;STK11存在于15-30%非小細胞肺癌中,也是一個(gè)潛在治療靶點(diǎn)[8,9];其他基因的突變情況也都具有一定的預后意義,與腫瘤的耐藥、侵襲性等特性有關(guān)。
與亞型檢測一致的是,突變檢測在獨立樣本中的準確度也略有降低,而且幅度和亞型檢測相似,研究者認為這也是由樣本制備帶來(lái)的差異,可以通過(guò)大數據訓練來(lái)提高。
不過(guò)研究者還不知道AI到底是怎么從切片中判斷出突變的,只能猜測突變會(huì )帶來(lái)極其微小的、人類(lèi)無(wú)法觀(guān)察到的變化。這就是機器學(xué)習的“黑匣子”問(wèn)題了,有人覺(jué)得我不需要知道為啥,好用就行唄,也有反對的研究者提出,如果你不知道為啥,又怎么能夠百分百確定呢。
這就是研究者們下一步要做的事情了。接下來(lái)的幾個(gè)月中,研究者將使用更多不同來(lái)源的數據訓練AI,并積極考慮商業(yè)化以便早日投入臨床。
想象一下,現在腫瘤測序還需要幾天到幾周不等,考慮到時(shí)間和成本,還沒(méi)法納入標準治療流程。而這項技術(shù)如果真的落現,那么只要病理切片掃一掃,或許就能夠得到一項可行的治療方案,豈不是美哉!
當然了,研究現在還是在一個(gè)比較基礎的階段,斯坦福大學(xué)癌癥研究所研究者DanielRubin就表示,說(shuō)這項技術(shù)能夠取代目前的診斷方法還為時(shí)尚早,AI還需要更多的驗證工作,不過(guò)這項研究確實(shí)讓我們看到了人類(lèi)和計算機合作的未來(lái),也說(shuō)明病理圖像中蘊含的信息量比我們現在能夠利用的還要多得多[10]。
本文的通訊作者AristotelisTsirigos也在采訪(fǎng)中表示,AI能夠通過(guò)病理切片診斷肺癌亞型,還不意味著(zhù)很快就能代替醫生的工作,但是目前來(lái)說(shuō),AI已經(jīng)可以幫助醫生減少讀片錯誤了[11]。
希望未來(lái)這些基礎工作能夠都交給機器來(lái)做,真正解放醫生去處理更多更重要的臨床決斷。
抗癌,消炎,平喘。用于食道癌、胃癌、肺癌,對大腸癌、宮頸癌、白血病等多種惡性腫瘤,亦有一定療效,亦可配合放療、化療及手術(shù)后治療。并用于治療慢性氣管炎及支氣管哮喘。
健客價(jià): ¥16.9破血消瘦,攻毒蝕瘡。用于原發(fā)性肝癌、肺癌、直腸癌、惡性淋巴瘤、婦科惡性腫瘤等。
健客價(jià): ¥24.9本品單藥適用于表皮生長(cháng)因子受體(EGFR)基因具有敏感突變的局部晚期或轉移性非小細胞癌(NSCLC)患者的一線(xiàn)治療以及既往接受過(guò)化學(xué)治療的局部晚期或轉移性非小細胞癌(NSCLC)。詳見(jiàn)說(shuō)明書(shū)。
健客價(jià): ¥2359適用于惡性淋巴瘤、多發(fā)性骨髓瘤、淋巴細胞白血病、神母細胞瘤、卵巢癌、乳癌以及各種肉瘤及肺癌等。
健客價(jià): ¥311、各型急性白血病,特別是急性淋巴細胞白血病、惡性淋巴瘤、非何杰金氏淋巴瘤和蕈樣肉芽腫、多發(fā)性骨髓病。2、頭頸部癌、肺癌、各種軟組織肉瘤、銀屑病。3、乳腺癌、卵巢癌、宮頸癌、惡性葡萄胎、絨毛膜上皮癌、
健客價(jià): ¥139抗癌藥。用于肺癌、肺癌腦轉移,消化道腫瘤及肝癌的輔助治療。
健客價(jià): ¥47.9