通過NGS或者質譜平臺拿到序列后,面臨的一個重要問題就是:選擇什么數據庫進行比對才能得到較好的分類鑒定結果呢?數據庫中圖譜的質量、數量都將直接影響鑒定的成功率與準確率。如原核的16S rDNA序列,真核的18S rDNA序列、ITS(ribosomalinternal transcribed spacer)序列等。
有兩個關于人體微生物組的奠基性研究,一個是人類腸道宏基因組計劃 MetaHIT,由歐盟發起,8個國家14個研究機構參與。華大基因承擔了其中關鍵的測序與分析工作,從2008年1月1日到2012年6月30日,構建了第一個腸道微生物基因集,包含330萬個基因,氮吹儀是近年來腸道微生物研究的里程碑。另一個是由美國國家衛生院發起的人類微生物組計劃。從2008年到2013年,采集了人體各個部位共超過5000份樣本進行了測序和深入的分析,繪制了人體相關的微生物圖譜,并破解了3000種微生物前基因組,初步建立了人體共生微生物參考數據庫。
其實針對每一類生物的主要marker序列都有相應的數據庫以方便比對鑒定。如 RDP數據庫(RibosomalDatabase Project)、SILVA數據庫(一個包含細菌、古菌、真核rRNA基因序列的綜合數據庫)、Greengenes(針對細菌、古菌16S rRNA基因)數據庫、 PR2(ProtistRibosomal Referencedatabase)數據庫(針對真核微生物18SrRNA基因)等等。 目前國內僅梅里埃和BD兩家外企,及北京毅新博創的微生物質譜獲得CFDA認可。雖然外企大范圍市場推廣時間較短(約2-3年),市場總裝機量不超過400臺,但是根據2016年檢驗醫學網的數據,2015年在細菌鑒定和藥敏檢測中,梅里埃的質譜儀已達到了2%的市占率,增長迅速氮吹儀。總體來看占據主導地位的還是梅里埃和西門子的傳統檢測系統,目前合并統計后生物梅里埃在細菌鑒定和藥敏檢測中市占率高達61.1%,西門子緊隨其后為26.7%。
質譜技術在臨床微生物菌種鑒定領域的應用,除了技術本身,更重要的是依賴于質譜菌種鑒定數據庫。因此,數據庫中圖譜的質量、數量都將直接影響鑒定的成功率與準確率。由于病原微生物分布流行情況不同,實驗室在原有數據庫基礎上可補充建立本地病原微生物的質譜指紋圖譜庫,提高鑒定成功率。
目前梅里埃和BD的產品均可以鑒定2000多種微生物,安圖生物在微生物檢測領域積累20多年,已開發出具有自主知識產權的中國本土化微生物菌株數據庫,可鑒定超過1500種微生物。
反觀NGS在微生物領域額應用,目前全球還沒有相關領域的注冊試劑獲批。國外是通過LDT的方式開展。國內目前處在方法學的標準品驗證階段。由中檢院負責,華大基因、博奧生物、達瑞生物和賽哲生物四家公司是第一批參與標準品驗證的行業玩家。其中華大基因用自己的BGISEQ測序平臺,博奧生物、達瑞生物兩家用Thermo Fisher的NGS平臺,賽哲生物用的是Illumina平臺。
所謂標準品是行業對NGS方法學,即測序平臺的驗證。由中檢院“出題”,構建一個由1000多種基因組成的樣品“黑箱”,四家受試者在各自的平臺上分析。檢測準確度達到一定標準的,就把這種檢測平臺作為方法學的標準品,后續可以在這個平臺上開發產品。毫無疑問,通過率先通過標準品驗證的公司會在行業建立先發優勢。
由于病原微生物分布流行情況不同,這些公開數據庫不能完全滿足臨床檢測需求。實驗室在原有數據庫基礎上需補充建立本地病原微生物的質譜指紋圖譜庫,提高鑒定成功率。
2016年初,之江生物(834839.OC)發布公告稱出資 50 億韓元,約合 2,750 萬元人民幣,認購韓國 ChunLab公司390,625 股新增股份,增資后之江生物持有后者 12.93%的股權。ChunLab公司擁有一個龐大的、非公開的微生物數據庫。我們預測之江生物的這個布局意味著即將會在微生物檢測領域有所作為,也為未來業績增長創造了很好的先發優勢。