物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

浙江突破AI診斷技術(shù):疑似病例基因分析縮至半小時(shí)

作者:乾明
來源:凹非寺
日期:2020-02-05 09:15:13
摘要:2月1日,浙江省疾控中心上線自動(dòng)化的全基因組檢測分析平臺(tái),這一平臺(tái)由浙江省疾控中心聯(lián)合達(dá)摩院和杰毅生物聯(lián)合研發(fā)。
關(guān)鍵詞:AI診斷基因分析

2月1日,浙江省疾控中心上線自動(dòng)化的全基因組檢測分析平臺(tái),這一平臺(tái)由浙江省疾控中心聯(lián)合達(dá)摩院和杰毅生物聯(lián)合研發(fā)。

借助阿里達(dá)摩院研發(fā)的AI算法,原來數(shù)小時(shí)的疑似病例基因分析縮短至半小時(shí),加上杰毅生物技術(shù)的新型檢測設(shè)備,大幅縮短疑似患者確診時(shí)間。

達(dá)摩院介紹,這一平臺(tái)還能有效防止病毒變異產(chǎn)生的漏檢,并精準(zhǔn)檢測出可能存在的病毒變異情況,為后續(xù)疫苗與藥物研發(fā)提供支撐。

在抗擊新型冠狀病毒緊要關(guān)頭,這樣的AI突破,對(duì)于有效提升疑似病例確診效率,及時(shí)阻斷病毒的傳播,必然會(huì)有極大助益。

那么,這到底是一個(gè)什么樣的突破?這一突破又意味著什么?

我們從“疑似病例”這一關(guān)鍵詞開始說起。

還有19544例疑似病例尚未得到確診

最新數(shù)據(jù),截至2月1日24時(shí),國家衛(wèi)生健康委收到31個(gè)省(自治區(qū)、直轄市)和新疆生產(chǎn)建設(shè)兵團(tuán)累計(jì)報(bào)告確診病例14380例,疑似病例有19544例。

快速、精確診斷武漢新型冠狀病毒(2019-nCoV),對(duì)于疫情傳播控制來說,顯得尤其重要。

目前,全國大多數(shù)醫(yī)院普遍采用核酸檢測來確診患者是否患有新型冠狀病毒肺炎。

雖然背后的方法已經(jīng)相對(duì)成熟完善,但仍舊需要很長的時(shí)間。

果殼此前發(fā)布的文章對(duì)整個(gè)過程分析之后稱:從病人樣本送到實(shí)驗(yàn)室即刻開始測試到出檢測報(bào)告差不多也需要8個(gè)小時(shí)。

加上新冠狀病毒傳染性較強(qiáng),開展核酸檢測對(duì)于實(shí)驗(yàn)室、設(shè)備、人員也都有相應(yīng)要求。

因此,新型冠狀病毒核酸檢測一開始只能在湖北省疾控中心進(jìn)行,而且核酸檢測試劑盒生產(chǎn)較少,就出現(xiàn)了疑似患者確診困難,得不到及時(shí)救治的狀況。

雖然現(xiàn)在能夠進(jìn)行新冠狀病毒核酸檢測的醫(yī)院和機(jī)構(gòu)增多,而且核酸檢測試劑盒產(chǎn)量逐步跟上,疑似患者確診困難狀況得到緩解。

但仍舊是依靠人肉來推動(dòng),效率并沒有得到提高,所以依舊有大量疑似患者存在。

而且,當(dāng)前采用的核酸檢測方法, 也有不足之處。

根據(jù)各個(gè)機(jī)構(gòu)公布的數(shù)據(jù),新型冠狀病毒全基因組序列全長29847bp,是基因組序列最長的病毒之一。

達(dá)摩院算法專家顧斐博士介紹稱,核酸檢測方法只能檢測到病毒基因的局部。

“由于病毒存在變異的可能性,對(duì)于整個(gè)基因序列來說,這種檢測方法猶如盲人摸象。一旦病毒發(fā)生變異,就可能出現(xiàn)漏檢的情況,”他說。

因此,在嚴(yán)峻的抗疫形式面前,仍舊需要一種效率更高的病毒檢測方法。

浙江省疾控中心上線的全新檢測平臺(tái),不僅使用了更先進(jìn)的檢測儀器,還有達(dá)摩院的算法發(fā)揮作用,而且?guī)砹饲袑?shí)的效果。

AI如何大幅度提高檢測效率?

浙江省的自動(dòng)化全基因組檢測分析平臺(tái)采用的是不同于核酸檢測方法的全基因組檢測技術(shù),是對(duì)疑似病例的病毒樣本進(jìn)行全基因組序列分析比對(duì)。

達(dá)摩院介紹稱,這屬于高通量測序,可以一次對(duì)幾十萬到幾百萬條DNA分子進(jìn)行序列測定,使得對(duì)一個(gè)物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能。

應(yīng)用在新型冠狀病毒中,可以有效防止病毒變異產(chǎn)生的漏檢。雖然能力很強(qiáng),但它也有缺陷。最直接的不足就是其前處理和數(shù)據(jù)分析都非常費(fèi)時(shí)費(fèi)力。

但在AI算法的加持下,這些問題也都得到了克服。

根據(jù)官方信息,這一平臺(tái)主要由浙江省疾控中心、阿里巴巴達(dá)摩院、杰毅生物共同研發(fā)。杰毅生物開發(fā)了全自動(dòng)高通量測序建庫儀,把整體常規(guī)人工需要12小時(shí)的工作縮短到2個(gè)小時(shí)。

每次測序過程產(chǎn)生的海量數(shù)據(jù),則交由達(dá)摩院的算法進(jìn)行分析。

△新型冠狀病毒結(jié)構(gòu)

顧斐介紹稱,在序列比對(duì)過程中,他們對(duì)算法增加了分布式設(shè)計(jì),病毒基因分析的速度由數(shù)小時(shí)縮短到半小時(shí),從而大幅提高疑似病例的確診速度。

在病毒的拼接階段,他們也采用了分布式設(shè)計(jì)的de Bruijn圖算法,將病毒拼接的速度由30分鐘-1小時(shí)縮短到15-30分鐘。

不僅只有速度的提升,還有質(zhì)量的提高。達(dá)摩院表示,這能夠幫醫(yī)護(hù)人員檢測到病毒全貌,就算變異的病毒也能精準(zhǔn)檢測,大幅提升確診效率。

怎么評(píng)價(jià)這一平臺(tái)?目前,這個(gè)平臺(tái)已經(jīng)上線,浙江省疾控中心也給出了評(píng)論。

“這個(gè)平臺(tái)基于阿里云的強(qiáng)大算力與達(dá)摩院新算法可以為病毒的解析提供支撐,”其基因測序負(fù)責(zé)人孫逸博士說:“基于這個(gè)平臺(tái),未來還可以在短時(shí)間內(nèi)將檢測范圍覆蓋整個(gè)確診病例,也為后續(xù)疫苗與藥物研發(fā)打下了堅(jiān)實(shí)基礎(chǔ)?!?/p>

據(jù)介紹,平臺(tái)將會(huì)在全省應(yīng)用。達(dá)摩院也說,他們也正在努力與合作伙伴共同將這套系統(tǒng)推廣至全國。

阿里達(dá)摩院,用算法抗疫

疫情兇猛,科技公司如何能夠貢獻(xiàn)一份力量?達(dá)摩院的做法可以作為一個(gè)參考:讓自身技術(shù)能力在抗疫第一線發(fā)揮作用。

達(dá)摩院介紹說,疫情發(fā)生之后,他們就組建了十余人團(tuán)隊(duì),針對(duì)新冠病毒基因的特征進(jìn)行了分析,決定采用分布式設(shè)計(jì)的分析算法,并基于蛋白質(zhì)數(shù)據(jù)庫(PDB)等公共數(shù)據(jù)集的數(shù)據(jù)進(jìn)行算法的優(yōu)化訓(xùn)練。

并深入到一線,與浙江省疾控中心、杰毅生物共同打造自動(dòng)化全基因組檢測分析平臺(tái),于是才有了病毒基因分析速度由數(shù)小時(shí)縮短到半小時(shí)的直接產(chǎn)出。

△顧斐在疾控中心基因檢測分析現(xiàn)場

除此之外,達(dá)摩院的并沒有就此停下腳步。

顧斐說,在病毒序列拼接完成后,通過設(shè)BiLSTM+DNN的方式訓(xùn)練模型還可以在還可以15-30分鐘內(nèi)預(yù)測病毒蛋白二級(jí)結(jié)構(gòu)。

而且, 達(dá)摩院還在研究基于序列的蛋白質(zhì)三維結(jié)構(gòu)預(yù)測模型以及藥物篩選模型,為藥物研發(fā)貢獻(xiàn)技術(shù)能力。

所以,雖然疫情突至,誰也沒能預(yù)料。

但現(xiàn)在,技術(shù)的力量正在成為抗擊疫情的新驅(qū)動(dòng)引擎。

達(dá)摩院這樣的機(jī)構(gòu)創(chuàng)辦,最初或許并不為這樣的時(shí)刻而生,但正在用實(shí)際行動(dòng)帶來希望、帶來信心。

俠之大者,當(dāng)如是。