2017年,伴隨Illumina旗下NovaSeq系列基因測序儀上市,全基因組測序成本被進一步拉低到不足1000美元。一時間,全球基因數(shù)據(jù)體量和解析需求激增。彼時,動脈網(wǎng)曾預(yù)測,作為基因科技行業(yè)爆發(fā)的第二曲線,如何更快速、準確地進行基因數(shù)據(jù)分析和解讀,將會成為關(guān)鍵命題。
如今,互聯(lián)網(wǎng)和科技巨頭入局推動信息技術(shù)(IT)與生物技術(shù)(BT)相融合,似乎正在印證當(dāng)時的推測。在生物信息學(xué)家眼里,人體就是一個程序,是由基因組這個程序控制的化學(xué)反應(yīng)與物理變化。測序樣本數(shù)據(jù)在實驗室中產(chǎn)生,而后與信息系統(tǒng)中沉淀的數(shù)據(jù)相比對,從而發(fā)現(xiàn)突變點位,并以此為基礎(chǔ)解讀出終端可用的結(jié)果。當(dāng)基因測序數(shù)據(jù)量仍處于爬坡階段,IT的角色是針對特定問題的各種專業(yè)分析工具。而眼下的數(shù)據(jù)規(guī)模漸已超出分析工具的承受極限,云計算、超高性能芯片加速、人工智能算法開始定義“IT+BT”的底層邏輯。
從科研服務(wù)到臨床應(yīng)用,從腫瘤診療到感染病防治,基因科技的商業(yè)化場景層出不窮,明星產(chǎn)品和公司總在輪換。到底什么才是構(gòu)筑基因公司之根本的核心競爭力?我們?yōu)楹未藭r重提基因數(shù)據(jù)話題?多年前設(shè)想以信息技術(shù)迭代基因科技的圖景是否顯現(xiàn)?本報告將試圖揭曉答案。
在報告中,我們通過行業(yè)及產(chǎn)品梳理、專家訪談,總結(jié)出關(guān)于基因檢測智能化的以下核心觀點,以饗讀者。
1、國內(nèi)外基因測序上游競爭格局板塊移動明顯,將撬動中游服務(wù)商深度洗牌;
2、認知紅利趨盡,基因檢測服務(wù)商轉(zhuǎn)而重視修煉內(nèi)功,數(shù)據(jù)能力建設(shè)是核心;
3、新藥、科研與臨床基因大數(shù)據(jù)分析需求井噴,臨床數(shù)據(jù)挖掘潛力巨大;
4、區(qū)域與企業(yè)平臺建設(shè)加速,標準與規(guī)范夠艱難,基因數(shù)據(jù)庫涉深水區(qū);
5、上游測序與下游應(yīng)用均趨成熟,數(shù)據(jù)庫依然掣肘基因科技步入智能化;
6、頭部企業(yè)基因智能化產(chǎn)品與服務(wù)頻出,但研發(fā)與應(yīng)用整體仍處于起步階段。
基因檢測是指對人類的DNA、RNA、蛋白質(zhì)及代謝物進行分析,以診斷、預(yù)測或預(yù)防遺傳性疾病的發(fā)生,指導(dǎo)疾病治療方案的選擇(藥物種類及劑量的選擇),或預(yù)測疾病的復(fù)發(fā),也可以作為評估個人體質(zhì)或特質(zhì)的依據(jù)。目前,用于進行基因檢測的技術(shù)主要分為PCR技術(shù)、基因測序技術(shù)、FISH技術(shù)和基因芯片技術(shù)四種?;诨虼髷?shù)據(jù)的應(yīng)用,測序技術(shù)成為最為主流的基因檢測技術(shù)。以二代基因測序(NGS)技術(shù)為例,基因測序的流程包括樣本采集、數(shù)據(jù)生產(chǎn)、數(shù)據(jù)分析、數(shù)據(jù)解讀與轉(zhuǎn)化應(yīng)用等環(huán)節(jié)。如今NGS技術(shù)依然依靠人工操作,無法避免人工對于數(shù)據(jù)生產(chǎn)質(zhì)量的影響以及人工帶來的數(shù)據(jù)生產(chǎn)成本和時間限制;需處理的基因數(shù)據(jù)規(guī)模龐大,最大可達到PB或EB級別,以及數(shù)據(jù)分析采用的生物信息分析算法十分復(fù)雜使得數(shù)據(jù)分析環(huán)節(jié)繁瑣,效率低,耗時長。政策法規(guī):新醫(yī)改與生命健康新基建推動基因檢測行業(yè)跑步進入智能化行業(yè)2017年,《國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》中提到基于人工智能開展大規(guī)?;蚪M識別、蛋白組學(xué)、代謝組學(xué)等研究和新藥研發(fā),推進醫(yī)藥監(jiān)管智能化。因此,基因測序的智能化生產(chǎn)體系是必然趨勢,有助于基因數(shù)據(jù)生產(chǎn)的流程規(guī)范化、數(shù)據(jù)的全程質(zhì)控以及測序成本和時間的控制。基因檢測行業(yè)的發(fā)展目前仍由技術(shù)驅(qū)動,但是相關(guān)政策環(huán)境也為基因檢測智能化的發(fā)展提供充足的養(yǎng)料。生命健康新基建。2020年4月的國務(wù)院常務(wù)會議中將新型基礎(chǔ)設(shè)施(簡稱“新基建”)定義為以新發(fā)展理念為引領(lǐng),以技術(shù)創(chuàng)新為驅(qū)動,以信息網(wǎng)絡(luò)為基礎(chǔ),面向高質(zhì)量發(fā)展需要,提供數(shù)字轉(zhuǎn)型、智能升級、融合創(chuàng)新等服務(wù)的基礎(chǔ)設(shè)施體系。2020年4月,國務(wù)院應(yīng)對新型冠狀病毒肺炎疫情防聯(lián)控機制發(fā)布《關(guān)于進一步做好疫情期間新冠病毒檢測有關(guān)工作的通知》:明確三級綜合醫(yī)院均應(yīng)當(dāng)建立符合生物安全二級及以上標準的臨床檢驗實驗室,獨立開展新型冠狀病毒檢測;對醫(yī)療資源相對缺乏、檢測能力相對薄弱的地區(qū),選擇1家綜合實力強的縣級醫(yī)療機構(gòu)予以重點支持,實現(xiàn)縣域內(nèi)醫(yī)療機構(gòu)具備核酸檢測能力。近年來,我國將基因檢測作為國家重點領(lǐng)域,加大了支持力度,先后推出了多項政策、制度進行扶持,為行業(yè)的發(fā)展創(chuàng)造了良好的政策環(huán)境,同時也逐步收緊了對基因檢測的監(jiān)管。2021年3月,《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》正式發(fā)布,明確“基因與生物技術(shù)”作為七大科技前沿領(lǐng)域攻關(guān)領(lǐng)域之一;“生物技術(shù)”作為九大戰(zhàn)略性新興產(chǎn)業(yè)之一,其中“基因技術(shù)”為未來產(chǎn)業(yè)。2016年,我國過先后發(fā)布了多條與之相關(guān)的關(guān)鍵性國家政策,基因檢測經(jīng)歷了從產(chǎn)業(yè)發(fā)展倒逼政策改革,到以政策引導(dǎo)產(chǎn)業(yè)發(fā)展的階段。2016年4月15日,國家發(fā)改委頒布了《國家發(fā)展改革委辦公廳關(guān)于第一批基因檢測技術(shù)應(yīng)用示范中心建設(shè)方案的復(fù)函》,正式批復(fù)建設(shè)全國27個基因檢測技術(shù)應(yīng)用示范中心,鼓勵加快基因檢測產(chǎn)業(yè)的快速發(fā)展。2017年,我國啟動十萬人基因組計劃,十三五規(guī)劃將發(fā)展基因技術(shù)作為生物醫(yī)藥產(chǎn)業(yè)創(chuàng)新的核心任務(wù),由此,以基因技術(shù)為核心的生物產(chǎn)業(yè)獲得快速發(fā)展,并帶動基因測序行業(yè)邁入爆發(fā)期。2019年,《健康中國行動(2019-2030年)》明確提出“加快推動從以治病為中心”轉(zhuǎn)變?yōu)椤耙匀嗣窠】禐橹行摹?,提出預(yù)防是最經(jīng)濟、最有效的健康策略,而基因檢測是最有效的預(yù)防手段,隨著“健康中國2030”上升為國家戰(zhàn)略。市場規(guī)模:精準醫(yī)療需求之井噴態(tài)勢與基因檢測成本之超摩爾定律下降基因檢測市場空間隨著2015年二代測序技術(shù)的上市迅速打開。二代測序技術(shù)憑借通量大、準確度高、價格低廉的優(yōu)勢成為當(dāng)前主流的基因檢測技術(shù),引領(lǐng)行業(yè)迅速發(fā)展。醫(yī)療的未來無疑是精準醫(yī)療,國家鼓勵和支持發(fā)展以基因測序為基礎(chǔ)的精準醫(yī)療。科技部在2015年3月首次召開的“國家精準醫(yī)療戰(zhàn)略專家會議”中提出2030年前政府?dāng)M投入600億元發(fā)展精準醫(yī)療。根據(jù)預(yù)測,全球基因檢測市場規(guī)模將從2019年的122億美元增長至2024年的280億美元,年復(fù)合增長率高達18.08%;國內(nèi)基因檢測市場將從 2019 年的106.54億元增長至2026年的281.34億元,未來市場空間十分可觀。基因測序技術(shù)的進步帶動了基因測序成本大幅下降,遠超摩爾定律。根據(jù) National Human Genome Research Insititute 公布的數(shù)據(jù),2001年平均每兆堿基的測序成本是5292.4美元,單人類基因組測序成本是9526.3萬美元。2006年美國第二代基因測序企業(yè)454 Life Science 推出超高通量基因組測序系統(tǒng),二代測序技術(shù)的產(chǎn)生使得平均每兆堿基的測序成本下降至581.9美元,單人類基因組測序成本下降至1047.5萬美元。隨著新技術(shù)和新測序設(shè)備的推出,此后基因測序成本以超“摩爾定律”的速度不斷下降,至2020年平均每兆堿基的測序成本低至0.01美元,單人類基因組測序成本低至689美元。成長階段:疾病關(guān)系、算法驗證相對復(fù)雜,基因檢測智能化尚處于早期數(shù)字化大潮下,智能化為基因檢測技術(shù)賦能,通過將數(shù)據(jù)分析流程所需的設(shè)備、生物信息分析軟件、數(shù)據(jù)庫與人工智能技術(shù)結(jié)合在一起,實現(xiàn)自動化數(shù)據(jù)分析和智能決策系統(tǒng),促進基因檢測行業(yè)高質(zhì)量發(fā)展,然而數(shù)據(jù)分析算法、基因組與疾病之間的關(guān)系的復(fù)雜性使基因檢測智能化處于早期發(fā)展階段。然而,知易行難,基因檢測智能化仍然面臨許多技術(shù)壁壘。大數(shù)據(jù)庫。如今基因檢測技術(shù)發(fā)展得十分成熟,很多企業(yè)都能生產(chǎn)基因數(shù)據(jù),然而基因數(shù)據(jù)的解讀卻非常困難,因為基因與疾病的關(guān)系復(fù)雜,并且依賴于用來解釋不確定遺傳檢測結(jié)果的大數(shù)據(jù)庫,以此才能將基因數(shù)據(jù)轉(zhuǎn)化成臨床決策。數(shù)據(jù)分析算法。隨著基因組數(shù)據(jù)的迅速增加和所需要分析解讀的突變類型日益復(fù)雜,表型和醫(yī)療數(shù)據(jù)也不斷豐富,對數(shù)據(jù)分析算法提出了更高的要求。業(yè)務(wù)模塊復(fù)雜。基因檢測智能化能力的構(gòu)建是圍繞數(shù)據(jù)生產(chǎn)、傳輸、分析、應(yīng)用的全生命周期流程進行,業(yè)務(wù)模塊的復(fù)雜和對數(shù)據(jù)安全更敏感等原因,使得基因檢測技術(shù)難以完美地與數(shù)字技術(shù)結(jié)合在一起,未來基因檢測智能化還有很長的道路要走。雖然基因檢測智能化還處于早期階段,但發(fā)展迅猛,國內(nèi)已有產(chǎn)品上市,例如華大基因的生信分析一體機HALOS和諾禾致源的一站式解決方案Falcon柔性智能生產(chǎn)系統(tǒng)等。資本熱度:計算機、互聯(lián)網(wǎng)、基因測序平臺巨頭紛紛入局撬動行業(yè)變革截至報告發(fā)布,2021年,中國基因檢測行業(yè)共發(fā)生了106起融資交易事件,披露融資交易總額達213億元,相比2020年增加10%(2020年約193億元)。2021年融資交易事件較2020年增加32起,但融資額相差不多的主要原因是缺少類似華大智造在2020年4月完成超10億美元的超大融資事件。從2015年到2021年的融資額和融資事件來看,2020年是基因檢測行業(yè)融資交易事件的高峰期,年增長率高達153%,而2021年延續(xù)了基因檢測的融資熱潮,資本持續(xù)關(guān)注。目前,我國基因檢測行業(yè)的融資集中在測序儀及試劑耗材生產(chǎn)企業(yè)上,而國外同時期的投資方向主要集中在基因數(shù)據(jù)分析領(lǐng)域,且多數(shù)企業(yè)已進入后期階段。另外,國外的產(chǎn)業(yè)結(jié)構(gòu)和資本市場比國內(nèi)成熟,獨角獸企業(yè)(包括未上市和上市企業(yè))覆蓋基因行業(yè)上、中、下游,主要業(yè)務(wù)涉及儀器及試劑研發(fā)、科研和臨床基因檢測服務(wù)以及數(shù)據(jù)分析等。由于測序技術(shù)壁壘高,國內(nèi)僅有幾家公司能夠自主研發(fā)基因測序儀等設(shè)備,多數(shù)企業(yè)集中于數(shù)據(jù)分析、試劑耗材生產(chǎn)和中游的檢測服務(wù)。而我國2021年獲得融資的企業(yè)大多處于B輪及以前的階段,表明國內(nèi)基因數(shù)據(jù)生產(chǎn)及分析還處于早期產(chǎn)品化階段。基因大數(shù)據(jù)擁有廣闊的應(yīng)用場景和市場,是醫(yī)療健康領(lǐng)域能最快大規(guī)模轉(zhuǎn)化應(yīng)用的行業(yè)。而PB級別的基因大數(shù)據(jù)的分析與運用離不開云計算、人工智能、大數(shù)據(jù)、5G、區(qū)塊鏈等數(shù)字技術(shù)。IT企業(yè)擅長的數(shù)字技術(shù)的數(shù)據(jù)規(guī)模大、強大算力和算法以及安全可靠賦能基因行業(yè),為傳統(tǒng)基因檢測行業(yè)帶來生產(chǎn)力的變革。市場角色:5大角色構(gòu)筑生態(tài),初代產(chǎn)品已進入市場推動檢測效率提升基因檢測行業(yè)一般由生命數(shù)字化信息的采集、數(shù)據(jù)生產(chǎn)、分析、解讀與轉(zhuǎn)化應(yīng)用等5大環(huán)節(jié)構(gòu)成,基于大數(shù)據(jù)實現(xiàn)大規(guī)模人群的精準醫(yī)療和全生命周期管理。數(shù)據(jù)分析是運用生物信息分析對下機數(shù)據(jù)進行處理和分析,涉及數(shù)據(jù)存儲、計算、管理等基礎(chǔ)設(shè)施以及分析所需的軟件、算法以及新的數(shù)字技術(shù)。布局數(shù)據(jù)分析的企業(yè)主要圍繞生物信息軟件開發(fā)、基因大數(shù)據(jù)平臺解決方案、基因大數(shù)據(jù)增值服務(wù)3種業(yè)務(wù)展開。軟件方面國內(nèi)多數(shù)為非小細胞肺癌突變基因軟件,獲批的企業(yè)有華大生物、吉因加、燃石以及世和醫(yī)療。數(shù)據(jù)解讀是將基因檢測結(jié)果與臨床表型相結(jié)合,挖掘基因與疾病的關(guān)系,從而進行基礎(chǔ)研究和指導(dǎo)臨床決策。在科研服務(wù)上,諾禾致源采用多組學(xué)聯(lián)合分析方法揭示疾病機理并提出潛在治療方法。臨床上,智因東方開創(chuàng)了“生物+遺傳+臨床”三要素分析原則的臨床分析算法,提高了臨床診斷效率。基因檢測目前在醫(yī)療健康領(lǐng)域中廣泛運用于科研級、臨床級和消費級場景。科研領(lǐng)域的基因檢測業(yè)務(wù)主要面向科研機構(gòu),包括基因組測序、轉(zhuǎn)錄組學(xué)測序、表觀組學(xué)測序、宏基因組學(xué)系列測序、單細胞測序等。國內(nèi)基因檢測科研市場相對飽和,提供基礎(chǔ)科研基因檢測服務(wù)的企業(yè)主要有諾禾致源、華大基因、貝瑞基因、求臻醫(yī)學(xué)、安諾優(yōu)達等。臨床級應(yīng)用主要是臨床基因診斷,包括出生缺陷防控、腫瘤診斷、傳染病診斷等領(lǐng)域。基因檢測智能化產(chǎn)業(yè)鏈與應(yīng)用
基因行業(yè)正在進入大數(shù)據(jù)時代。人類基因組中蘊藏海量數(shù)據(jù)。DNA(脫氧核糖核酸)是一種雙鏈聚合物,由4種攜帶不同堿基的脫氧核糖核苷酸(A、T、C、G)排列組合形成。堿基或脫氧核糖核苷酸數(shù)量是衡量DNA長度的標準,由1000個脫氧核糖核苷酸組成的DNA長度為1Kb,完整的人類基因組包含約32億對堿基,長度為3Gb左右。同時,基因的相互差異形式十分多樣,例如單核苷酸突變、基因片段重復(fù)和缺失、染色體變異、甲基化等不改變DNA序列的表觀遺傳學(xué)變異,從而基因信息數(shù)量龐大、結(jié)構(gòu)復(fù)雜。隨著基因產(chǎn)業(yè)持續(xù)發(fā)展,基因測序數(shù)量逐漸增多,這些海量數(shù)據(jù)及其治理需求逐漸浮出水面。由此,基因技術(shù)與人工智能的融合,從作為基因檢測輔助環(huán)節(jié)的生物信息分析中脫穎而出,成為蓬勃發(fā)展的行業(yè)。在基因科技智能化產(chǎn)業(yè)的最上游,仍然通過專門的設(shè)備和試劑獲取下機測序數(shù)據(jù),這項工作在當(dāng)前已經(jīng)發(fā)展得比較成熟,也已經(jīng)形成了測序儀和配套試劑相對成熟的供給側(cè)結(jié)構(gòu)。從測序儀的型號看,Illumina的HiSeq是目前市場上最主流的測序儀。不過,受制于有限的生物信息技術(shù)水平,對海量的測序數(shù)據(jù)的正確解讀其實是基因檢測中亟待解決的難題。越來越多企業(yè)開始布局上游測序平臺。例如,Pac Bio所展開的對端讀長測序技術(shù)的收購、菲鵬生物收購高通量測序平臺等。基因數(shù)據(jù)原始狀態(tài)是以ATCG為標識的堿基序列。從基因測序儀運行下來提取的原始數(shù)據(jù)類似計算機二進制數(shù)字序列,不能直接提供關(guān)于疾病的信息,最終轉(zhuǎn)化為人們可理解的生物學(xué)數(shù)據(jù),為疾病診斷和治療提供指導(dǎo)。還需要借助專業(yè)知識分析。當(dāng)前,基因表達調(diào)控網(wǎng)絡(luò)、信號傳導(dǎo)網(wǎng)絡(luò)、蛋白-蛋白相互作用網(wǎng)絡(luò)以及代謝網(wǎng)絡(luò)的出現(xiàn)與發(fā)展更使生物信息學(xué)進入系統(tǒng)生物學(xué)時代,如果說生物信息學(xué)發(fā)展初期面對的主要是序列數(shù)據(jù),隨基因組領(lǐng)域研究在質(zhì)與量上的提高,特別在第二、第三代高通量測序技術(shù)的推動下,生物信息學(xué)面對的數(shù)據(jù)在類型、本質(zhì)、數(shù)量上都得到了極大豐富,生物信息學(xué)也作為基因組分析不可或缺的工具而得到迅速發(fā)展,并快速向包括人類健康在內(nèi)的很多領(lǐng)域滲透。測序數(shù)據(jù)處理和分析的技術(shù)壁壘較高,并且因為其重要性,也成為掣肘基因測序行業(yè)中游發(fā)展的關(guān)鍵因素,更是各大測序公司的核心競爭力所在。目前,測序數(shù)據(jù)處理流程基本已經(jīng)標準化,但對于數(shù)據(jù)處理過程中的核心步驟,各家公司都有自己的一套分析方法,即使是相同的原始數(shù)據(jù),各方不同同算法對細節(jié)的處理不盡相同,輸出的結(jié)果也不同,最終反映在測序數(shù)據(jù)解讀質(zhì)量上。基因數(shù)據(jù)正在形成巨大的數(shù)據(jù)庫,它的終極形態(tài)是,每一個健康人或者患者都可以將自己的基因數(shù)據(jù)進行上傳分析,通過比對得出自己的健康狀況,獲得健康建議。不過,這需要很長一段時間的積累來達到理想的可靠性與穩(wěn)定性,基因檢測成長為越來越類似血常規(guī)、尿常規(guī)等常規(guī)臨床檢驗項目,在一定程度上加速了這個過程。基因檢測的下游應(yīng)用可以分為臨床應(yīng)用和非臨床應(yīng)用兩個大類,兩者各自又可以進一步細分為生育健康、病原感染檢測、腫瘤基因檢測、基礎(chǔ)醫(yī)學(xué)研究、新藥研發(fā)等垂直板塊。其中,非臨床應(yīng)用中的基礎(chǔ)醫(yī)學(xué)研究是基因測序最早實現(xiàn)商業(yè)化的領(lǐng)域,也是當(dāng)前發(fā)展最為成熟的應(yīng)用場景,其次便是臨床場景中的腫瘤基因檢測、生育健康、病原感染監(jiān)測等應(yīng)用。在這個過程中,生物信息學(xué)不僅是一門學(xué)科,更是一種重要的研究開發(fā)工具,且生物信息學(xué)工具幾乎是未來生物研究/生物醫(yī)藥開發(fā)所必須的,并且生物信息學(xué)作為強大的生物數(shù)據(jù)解讀工具,正是連接基因序列和個性化醫(yī)療的關(guān)鍵紐帶。當(dāng)今,生物信息學(xué)界的研究人員主要將注意力集中在基因組、蛋白質(zhì)組、轉(zhuǎn)錄組、 RNA 組等組學(xué)以及與這些組學(xué)密切相關(guān)的藥物設(shè)計上,測序、數(shù)據(jù)庫資源、序列對比、基因芯片&表達譜分析、分子進化分析、蛋白質(zhì)結(jié)構(gòu)分析、藥物設(shè)計輔助是生物信息學(xué)最常見的相關(guān)應(yīng)用。
基因科技的臨床應(yīng)用,行至腫瘤診療,才算真正點燃了產(chǎn)業(yè)界的熱情。也正因如此,紅海競爭之下積累的豐富樣本和數(shù)據(jù),使得腫瘤診療成為基因大數(shù)據(jù)治理開發(fā),甚至基于人工智能技術(shù)做解析的排頭兵。早期的蒙眼狂奔之后,臨床上可茲采用的基于中國人群的腫瘤基因數(shù)據(jù)庫已經(jīng)越來越多,但整個基因信息大數(shù)據(jù)領(lǐng)域仍然缺乏統(tǒng)一標準,多個數(shù)據(jù)孤島并存,大數(shù)據(jù)價值不能充分被挖掘用于滿足臨床需求。換言之,國內(nèi)基因行業(yè)也亟需建立一套基因檢測樣本采集、運輸、儲存、檢測、生物信息分析和遺傳咨詢解讀等標準化流程,用以規(guī)范多基因Panel檢測流程,同時解決臨床數(shù)據(jù)支持及共享機制的項目。隨著國內(nèi)大眾對基因科技認知不斷加深,和供給側(cè)的基因測序行業(yè)生態(tài)不斷完善,大規(guī)模人群基因數(shù)據(jù)庫的建設(shè)節(jié)奏明顯加快。大多數(shù)腫瘤NGS廠商都將建立和開發(fā)腫瘤基因大數(shù)據(jù)庫作為自身的第二增長曲線,例如華大基因、求臻醫(yī)學(xué)、吉因加、仁東醫(yī)學(xué)、至本醫(yī)療等紛紛布局了針對不同癌種、納入不同體量人群的腫瘤基因數(shù)據(jù)庫。現(xiàn)階段,在一些特定的垂直領(lǐng)域,已經(jīng)有零星基于人工智能的腫瘤基因組解讀產(chǎn)品被嘗試推出。例如,志諾維思旗下的志諾醫(yī)珀(iGenome? Reporter)就是一款NGS基因檢測數(shù)據(jù)分析系統(tǒng)。它基于GVC基因變異探測算法、醫(yī)學(xué)解讀知識庫,快速精準分析和解讀腫瘤樣本NGS數(shù)據(jù),只需極簡操作就可以從原始測序數(shù)據(jù)獲得全面的臨檢報告和/或科研報告,輔助用戶進行臨床診療決策和科研產(chǎn)出。由此,腫瘤基因組學(xué)研究的門檻進一步被降低,而從事下游產(chǎn)品開發(fā)的小型基因公司再生產(chǎn)和研發(fā)能力得以加強。
實際上,大多數(shù)基因測序公司只是擅長做基礎(chǔ)測序和基本的分子生物學(xué)注釋,對疾病、遺傳機制缺乏深入了解,與醫(yī)生、研究者這類終端用戶的需求存在差距,輸出結(jié)果也缺少靈活性,在一定程度上增加用戶成本。對于非生信專業(yè)的人而言,原始測序數(shù)據(jù)幾乎毫無實際意義。遺傳疾病多為多基因?qū)е碌膹?fù)雜疾病。全基因組關(guān)聯(lián)分析是一種和基因測序密切相關(guān)的,近幾年來研究中非常熱門的高通量分析方法。遺傳學(xué)與分子生物學(xué)實驗室常規(guī)分析是將關(guān)心的DNA或蛋白序列與庫比對,這些序列長度大多數(shù)情況比整個基因組的量級小得多,進行的分析通量也低。但近年來,隨生物數(shù)據(jù)量的增加以及單基因研究的局限性,生物信息學(xué)相關(guān)高通量分析方法已越來越成為必須,特別測序成本的快速下降,以及生物信息學(xué)的快速發(fā)展,高通量分析方法的應(yīng)用門檻進一步降低,全基因組關(guān)聯(lián)性分析正是研究中最為常見的、應(yīng)用越來越常規(guī)化的生物信息學(xué)高通量分析手段之一。對人類基因組研究而言,全基因組關(guān)聯(lián)分析(GWAS)是指在人類全基因組范圍內(nèi)找出單核苷酸多態(tài)性(SNP)數(shù)據(jù),并從中篩選出與目標特征(如胖瘦、高矮、特定疾病、藥物敏感性等)相關(guān)的SNPs。在GWSA中,研究人員通常先收集到足夠多的患者基因組數(shù)據(jù),再將其中的SNP位點與對照組進行比較,并將相關(guān)數(shù)據(jù)進行關(guān)聯(lián)性分析,嘗試建立序列數(shù)據(jù)與目標性狀之間的關(guān)聯(lián),從而篩選出同目標性狀相關(guān)性密切的潛在基因。往往在這一步干試驗完成之后,還需要采用實驗生物學(xué)的方法做驗證和深入研究。這種方式將更多維的海量數(shù)據(jù)納入研究,已經(jīng)幫助研究者發(fā)現(xiàn)了許多未知基因以及染色體區(qū)域,為復(fù)雜疾病的發(fā)病機制提供了更多的線索。
消費級基因檢測是指通過廣告、電商、線下店可被消費者認知且直接購買的基因檢測產(chǎn)品,主要以低通量檢測為主,技術(shù)手段包括 PCR 和基因芯片。在中國消費基因發(fā)展相對早期,產(chǎn)品主要圍繞健康管理等維度展開。中國消費級基因檢測服務(wù)市場成立相對美國來講晚了20年,目前處于初期發(fā)展階段。但是中國消費者如今還未完全認可并采用消費級基因檢測服務(wù)作為健康管理的手段,然而基于中國的人口眾多和老齡化及個性化健康管理的趨勢,這意味著未來中國消費級基因檢測市場廣闊。學(xué)界對于基因與疾病的關(guān)系,更多還停留在關(guān)聯(lián)性研究的階段,而非確證性研究。相對于嚴肅醫(yī)學(xué)領(lǐng)域的基因檢測,消費級基因檢測公司普遍面臨著基因檢測深度不夠高、規(guī)?;y、消費者認知不足的問題。尤其是目前國內(nèi)消費級基因檢測主要服務(wù)是健康管理,健康管理則要將臨床數(shù)據(jù)、用戶的健康數(shù)據(jù)與基因數(shù)據(jù)結(jié)合起來。然而目前臨床數(shù)據(jù)和用戶的健康數(shù)據(jù)都比較薄弱,以及現(xiàn)在消費基因檢測產(chǎn)品結(jié)果并無專業(yè)的醫(yī)療人員進行診斷,在這種狀況下,即使基因數(shù)據(jù)量很大,也無法有效指導(dǎo)健康管理。針對消費級基因檢測行業(yè)整體大環(huán)境不容樂觀的情況下,已有多家企業(yè)做出戰(zhàn)略調(diào)整推動消費基因檢測智能化以提高基因檢測穩(wěn)定性和準確性。自動化是智能化的基礎(chǔ),美因基因運用自動化水平的生產(chǎn)體系提高基因檢測水平,成為了中國首個及唯一一個日檢測能力超過5萬次的基因檢測平臺。而美因未來將進一步結(jié)合基因技術(shù)和信息技術(shù),實現(xiàn)基因檢測高水平的自動化和智能化,將更具性價比的產(chǎn)品和服務(wù)推向市場,推動消費級基因檢測的市場普及。基因信息學(xué)和藥物開發(fā)的交集也越來越多,不少藥企都開始成立自己的基因組學(xué)部門,來為新藥開發(fā)提供方向。如今我們所熟知的CD系列靶點,很多都是誕生于這波浪潮之中?;蚪M學(xué)里測出來的數(shù)據(jù)都是海量級別,如何進行清洗和利用,把它用到藥物開發(fā)中去,總歸離不開計算機和大數(shù)據(jù)技術(shù)。對于靶向藥而言,生物標志物(biomarker)舉足輕重,它與藥物敏感性、反應(yīng)率相關(guān)。傳統(tǒng)上,藥物開發(fā)者根據(jù)已有的知識尋找生物標志物,常見的做法是將藥物靶點本身作為生物標志物。這種模式直觀、并已有不少成功案例,但局限性也顯而易見。人類對自身和疾病的已有知識有限,絕大多數(shù)臨床試驗實際上沒能用上生物標志物,到三期失敗的臨床試驗尤其如此。實際上,肺癌明星藥易瑞沙初始的臨床三期也曾失敗,原研廠阿斯利康并沒有找到生物標志物,而最終由哈佛大學(xué)的兩家試驗室發(fā)現(xiàn)EGFR突變是易瑞沙的生物標志物。
有分析認為,基因信息規(guī)模最大的市場來自制藥公司藥品研發(fā)的臨床數(shù)據(jù)需求。2014年美國制藥公司的藥品研發(fā)總費用為約1400億美元,只有3~4%用于購買臨床數(shù)據(jù),包括基因信息、用藥記錄、病歷等其他數(shù)據(jù)。盡管基因信息在現(xiàn)階段占藥品研發(fā)費用比例較低,但預(yù)計未來幾年會逐步上升。
文章來源:動脈網(wǎng)