Chi Biotech Co., Ltd zh_CN PRN Asia 全國首個RNA二代測序流程團體標準正式發布 2023-09-04 17:08:00 0.98的定量相關性,誤差與同一管樣品測序兩次相當,證明了這一流程的驚人穩健性。同時,該流程對目前市售的所有主流二代測序儀型號均可得到高度一致的定量結果。該流程對樣品的保存運輸也做了創新,并通過大量的商業化實踐,可穩健地實現RNA樣品國內常溫運輸或者普通冰袋運輸,在7-10天的國際運輸中也無需使用干冰。這大幅優化了目前的RNA樣品冷鏈物流體系,大大降低了物流成本,并使得以往很難空運的樣品可以在三天內空運到世界上任何一個主要城市。經過多個商業實驗室的實踐測試,該流程只需要對實驗員進行簡單培訓,第一次實操即能達到滿意的效果。可以說,該流程是首個高穩健性、全平臺通用的RNA定量測序流程,對規范整個測序和精準醫學行業、推動RNA測序的臨床應用,有著至關重要的意義,解決“精準醫學不精準”的世界性難題。 ]]> 深圳2023年9月4日 /美通社/ -- 日前,由承啟生物、暨南大學、華南理工大學、賽哲生物等單位聯合編制的《RNA定量測序技術規程》團體標準(T/CI 121-2023),經中國國際科技促進會標準化工作委員會審批通過,正式發布。這是全國首個RNA二代定量測序流程標準,其特點是可以幾乎無視通常的RNA降解而得到高度一致的測序定量結果;樣品的保存和運輸也無需干冰,近程運輸甚至室溫即可。此標準大大降低了樣本保存運輸的成本,保證了各種樣品的定量測序一致性和穩健性,對規范整個測序和精準醫學行業有著至關重要的作用。

二代測序(或稱新一代測序)是精準醫學的基石,其將核酸打斷成無數小片段,同時對數億條小片段進行大規模平行測序以獲得樣品內的核酸信息。在醫學檢驗中,DNA測序應用范圍很小,因為基因組通常一輩子保持不變,只有少數癌癥由DNA突變引起。而RNA由DNA轉錄而來,各基因的RNA表達量在各種生理和病理條件下都不同,因而用二代測序一次性測定多種RNA的量,就可以對幾乎所有的疾病做到極為精確的診斷,甚至對一些重大疾病在癥狀出現之前很久就做到近乎100%的極早期預警。但如此有潛力的診斷方法,卻遲遲未能在醫學臨床實踐上落地實施,其主要原因是RNA非常脆弱,盡管人們通常采用干冰等昂貴的方式保存運輸,但依然很容易降解;而以往的測序方法對降解樣品輕則出現定量失準,重則完全測不出數據。并且,各測序單位使用的儀器不同、流程不同,數據也無法互通。這些因素使RNA二代測序難以作為診斷標準來推廣應用。

由承啟生物牽頭研發編制的《RNA定量測序技術規程》團體標準,制定了一種RNA定量測序的標準流程,利用承啟生物自主研發的FANSe算法的超強準確性和穩健性,使該流程可以無視通常的RNA降解:自然降解的RNA樣品和未降解的樣品,經過完全相同的流程,可以達到R2>0.98的定量相關性,誤差與同一管樣品測序兩次相當,證明了這一流程的驚人穩健性。同時,該流程對目前市售的所有主流二代測序儀型號均可得到高度一致的定量結果。該流程對樣品的保存運輸也做了創新,并通過大量的商業化實踐,可穩健地實現RNA樣品國內常溫運輸或者普通冰袋運輸,在7-10天的國際運輸中也無需使用干冰。這大幅優化了目前的RNA樣品冷鏈物流體系,大大降低了物流成本,并使得以往很難空運的樣品可以在三天內空運到世界上任何一個主要城市。經過多個商業實驗室的實踐測試,該流程只需要對實驗員進行簡單培訓,第一次實操即能達到滿意的效果。可以說,該流程是首個高穩健性、全平臺通用的RNA定量測序流程,對規范整個測序和精準醫學行業、推動RNA測序的臨床應用,有著至關重要的意義,解決“精準醫學不精準”的世界性難題。

]]>
首個行政區級老年研究“龍華萬人老年健康計劃”第一階段成果發表 2023-08-24 08:30:00 深圳2023年8月24日 /美通社/ -- 近日,由承啟生物首席科學家張弓教授等人發起的“龍華萬人老年健康計劃”在國際權威的公共衛生期刊JMIR Public Health and Surveillance上發表了第一階段的成果,在全球首次以行政區級別的全集式橫斷面調查,揭示了老年人失智的各種影響因素,為提升老年人生活質量和健康水平、預防老年失智提供了重要參考和關鍵依據。

隨著全球老齡化快速加深,老年失智問題越來越成為制約老年人生活質量的重要因素,不但使老年人自身生活質量低下,也給家庭和社會帶來了沉重的經濟負擔和照護負擔。由于老年失智常源于神經退行性疾病(如阿爾茨海默癥等),一旦發病便不可逆轉,因而預防成為解決這一問題的核心手段,因此必須弄清哪些因素會影響失智的發生。傳統的研究是采樣研究,即從人群中抽取一定比例的人進行研究,或者等待志愿者自己報名參與研究。但這種抽樣的方法很難避免偏倚,例如以醫院為主體開展研究,去醫院的人基本是有疾病的;以社區志愿者為主體的研究,則向比較開朗外向、愿意參與社會活動、對醫學研究認知較高的人群偏倚。因此雖然老年失智問題的調研已有不少,但這些調研的結論常常大相徑庭,也幾乎不能被推廣應用。

“龍華萬人老年健康計劃”則打破了“抽樣研究”這一偏倚性問題,在國際上首次采用了“全集式”研究,即對一定地域范圍內符合入組條件的全部人群進行調研,除非他實在無法參與。該項研究對深圳市龍華區全區、龍崗區和光明區的部分街道的范圍的老年人開展,覆蓋面積約235km2,總人口約323萬。對該區域全部60歲以上戶籍人口8467人全部進行入戶訪問調查,除502人因不在深圳無法接受調查外,其余7965人全部取得了調查結果,應答率高達94%。除去個別信息前后不一致或有缺失的,7766人的問卷調查完整有效。而且深圳是個移民城市,絕大多數居民是從外地遷入的,來源地十分多樣,這意味著人群的遺傳背景十分多樣。因此,如此全面的全集式調查使結果能反映社區人群的真實狀況,比以往項目更全面、更深入。

與以往研究公認的結論一致,年齡仍然是失智的最大風險因素,90歲以上失智風險是60歲的23.92倍。在所有受訪人群中,女性失智風險僅略高于男性(OR=1.15, 95%CI 1.04-1.28)。教育程度可顯著降低失智風險:與文盲半文盲相比,哪怕僅有小學至初中教育水平都能降低三分之一的風險,大專以上文化水平則可降低三分之二的風險,說明多用腦的確可以提升老年生活質量。此外,婚姻也是顯著的保護因素:與已婚者相比,從未結婚的人群風險值高達3.6倍,離婚或喪偶的風險值也高達1.98倍。傳統上認為與家人同住可以預防失智,但本研究發現與獨居相比,與配偶、子女、其他親屬同住均無顯著差異,反而是與非親屬同住和采用家庭照護服務者失智風險會提高2.38-3.33倍。同時,該研究發現評估老年人能力的四個維度顯著相關,即日常生活能力、精神狀態、感知覺和溝通以及社會參與能力,其中一個維度差則其他幾個維度也會差。

“龍華萬人老年健康計劃”于2019年10月啟動,由時任龍華區政協委員的張弓、袁暉、馬靜、陳小珠等委員與西安交大張磊教授、華南理工大學杜紅麗教授等共同發起,旨在通過創新的研究范式提高大規模調查的效費比,以全集式的研究揭示影響社區老人健康的真實因素,并通過低成本的家庭或社區干預措施進行預防或治療。承啟生物與厚德世家等公司承擔了大范圍入戶走訪調查和采樣的任務,并得到了各社區、街道的大力支持。由于疫情的原因,項目團隊為避免調查給老人帶來感染風險,項目一度暫停,至疫情放開后才得以全面恢復。接下來,項目團隊還將做更多研究,為提升銀發族的生活質量做出貢獻。

“龍華萬人老年健康計劃”第一階段成果:
A Multidimensional Assessment of Activities of Daily Living, Mental Status, Communication, and Social Abilities Among Older Adults in Shenzhen, China: Cross-Sectional Study

]]>
國際人類蛋白質組計劃官方數據庫neXtProt亞洲分站正式建成 2023-08-07 09:15:00 )由深圳承啟生物科技有限公司(下稱承啟生物)建設完成,提供全功能的公共服務。這標志著中國擁有全部的人類蛋白質組公共數據,將極大地提升中國和其他亞洲國家利用人類蛋白質組計劃成果的便捷性,助力人類健康和疾病的研究。 HUPO官宣(詳情點擊:https://www.nextprot.org/news/a-nextprot-mirror-site-in-china) 國際人類蛋白質組計劃(Human Proteome Project)是人類基因組計劃之后的又一重大國際合作大科學計劃,旨在鑒定所有人類基因組編碼蛋白,繪制人體蛋白質圖譜,作為研究蛋白質分子功能、推進疾病的診斷和治療的重要資源。相比于人類基因組計劃時中國僅負責1%的測序工作,中國科學家在人類蛋白質組計劃中的參與程度有了質的飛躍。目前,中國科學家負責了人類三條染色體上的蛋白質研究,分別是1號染色體、8號染色體、20號染色體。2022年起,暨南大學教授、承啟生物首席科學家張弓博士被選為國際人類蛋白質組計劃的常委,是唯一來自亞洲的常委。 國際人類蛋白質組計劃所產生的人類蛋白質數據載于neXtProt數據庫(www.nextprot.org ),是目前人類蛋白質組最權威的數據庫,由瑞士生物信息學研究院(Swiss Institute of Bioinformatics)建立和維護。隨著中國科學界對蛋白質組高質量資源的需求與日俱增,洲際訪問neXtProt數據庫常常遇到速度緩慢和卡死狀況。為此,承啟生物從2021年末起承建neXtProt數據庫的亞洲分站( https://nextprot.cn/ )。但由于中國和歐洲的網絡環境差異巨大,承啟生物做了許多調整與更改,復刻了主站的全部內容與結構,方便用戶的使用習慣。同時,兩個數據庫的內容也會定期同步。亞洲分站的建設完成,將大大提升中國和其他亞洲國家利用這些高質量蛋白質數據的便捷程度,對人類蛋白質的研究、疾病機制研究和藥物開發起到顯著的推動作用。 承啟生物是HUPO(人類蛋白質組組織)的長期合作伙伴,在人類蛋白質組計劃中有很大的投入。承啟生物以高精度的大規模測序比對算法FANSe系列和翻譯組測序技術(含RNC-seq, Ribo-seq)享譽業界,并為人類蛋白質組計劃免費提供翻譯組測序服務。 ]]> 深圳2023年8月7日 /美通社/ -- 日前,國際人類蛋白質組計劃官方數據庫neXtProt亞洲分站(https://nextprot.cn/)由深圳承啟生物科技有限公司(下稱承啟生物)建設完成,提供全功能的公共服務。這標志著中國擁有全部的人類蛋白質組公共數據,將極大地提升中國和其他亞洲國家利用人類蛋白質組計劃成果的便捷性,助力人類健康和疾病的研究。

HUPO官宣(詳情點擊:https://www.nextprot.org/news/a-nextprot-mirror-site-in-china)
HUPO官宣(詳情點擊:https://www.nextprot.org/news/a-nextprot-mirror-site-in-china)

國際人類蛋白質組計劃(Human Proteome Project)是人類基因組計劃之后的又一重大國際合作大科學計劃,旨在鑒定所有人類基因組編碼蛋白,繪制人體蛋白質圖譜,作為研究蛋白質分子功能、推進疾病的診斷和治療的重要資源。相比于人類基因組計劃時中國僅負責1%的測序工作,中國科學家在人類蛋白質組計劃中的參與程度有了質的飛躍。目前,中國科學家負責了人類三條染色體上的蛋白質研究,分別是1號染色體、8號染色體、20號染色體。2022年起,暨南大學教授、承啟生物首席科學家張弓博士被選為國際人類蛋白質組計劃的常委,是唯一來自亞洲的常委。

國際人類蛋白質組計劃所產生的人類蛋白質數據載于neXtProt數據庫(www.nextprot.org),是目前人類蛋白質組最權威的數據庫,由瑞士生物信息學研究院(Swiss Institute of Bioinformatics)建立和維護。隨著中國科學界對蛋白質組高質量資源的需求與日俱增,洲際訪問neXtProt數據庫常常遇到速度緩慢和卡死狀況。為此,承啟生物從2021年末起承建neXtProt數據庫的亞洲分站(https://nextprot.cn/)。但由于中國和歐洲的網絡環境差異巨大,承啟生物做了許多調整與更改,復刻了主站的全部內容與結構,方便用戶的使用習慣。同時,兩個數據庫的內容也會定期同步。亞洲分站的建設完成,將大大提升中國和其他亞洲國家利用這些高質量蛋白質數據的便捷程度,對人類蛋白質的研究、疾病機制研究和藥物開發起到顯著的推動作用。

承啟生物是HUPO(人類蛋白質組組織)的長期合作伙伴,在人類蛋白質組計劃中有很大的投入。承啟生物以高精度的大規模測序比對算法FANSe系列和翻譯組測序技術(含RNC-seq, Ribo-seq)享譽業界,并為人類蛋白質組計劃免費提供翻譯組測序服務。

]]>
癌癥突變檢測的新標桿 承啟生物自研算法大幅領先國外算法 2022-12-30 08:30:00 深圳2022年12月30日 /美通社/ -- 近日,暨南大學、華南理工大學團隊發表論文Towards an accurate and robust analysis pipeline for somatic mutation calling,比較了突變檢測算法在癌癥領域常見的低頻突變標準測試數據集上的性能,發現國產FANSe算法的檢測效果遠勝于國際上常用的算法,速度還要快上幾十倍。這將為癌癥診療等應用提供重要的標準化依據。

癌癥的診斷、分型、治療中,突變檢測是重要手段。特定的突變對應著相應的治療方案,尤其是近年來火爆的靶向治療和免疫治療,均高度依賴突變檢測的結果。因此突變檢測的靈敏度和準確性在癌癥的診療中十分關鍵。用二代測序手段進行全基因組級別的突變檢測一直被視為癌癥診療的“通用武器”,但市場上的現實狀況卻是亂象不止。不少人都有過體會,將同一份樣品送到兩家公司去進行檢測,得到的兩份突變檢測報告卻大相徑庭。事實上,這是一個國際性的難題。2017年,JAMA Oncology雜志發表研究,將40個患者的ctDNA樣品送至兩家國際知名的測序公司,大部分患者得到的兩份突變檢測報告中的突變完全不同。醫生很難從這樣兩份充滿著矛盾和沖突的報告中制定正確的治療方案,看似“先進”的二代測序技術卻往往帶來悲劇。在實驗和儀器早已高度標準化的情況下,主要的問題在于算法的準確性。使用標準樣品進行的室間質評一直是監管部門使用的質控方法,但對基因組級別的檢測,標準樣品難以制備:人工方法做幾個突變出來還可以,但整個基因組的突變狀況要想給出可靠的標準答案非常難以做到。也因此,長期以來整個市場無法得到有效監管。

2020年,華南理工大學杜紅麗教授團隊使用多個真實世界的測序數據集,制作了一系列基因組級別的低頻突變標準測試數據集,這是世界上第一個接近真實癌癥測序應用場景、并有明確“標準答案”的突變檢測評測數據集,可以客觀真實地反映突變檢測流程的能力。此次研究中,研究者們利用這一系列標準測試數據集評測了5種突變檢測流程,包括唯一的純國產自主開發的FANSe流程和國際上的4種主流突變檢測算法。測試結果顯示,所有算法能檢出的突變基本99%以上都是正確的,即“假陽性”較少,但靈敏度則有巨大的差異。在所有場景下(突變頻率1-40%,測序深度100-800x),FANSe的靈敏度都顯著超越其他所有算法,即FANSe能檢出更多的突變,同時保持很高的準確度。即便是1%突變率下,FANSe也可以正確檢出87%的突變,而此時Mutect2和Strelka2僅能檢出20%左右的突變。突變率5%時,FANSe即可幾乎完美地檢出所有的突變。速度方面更是一騎絕塵,無論是序列比對(mapping)過程還是突變檢測過程,均比其他流程快上數量級。

FANSe算法由承啟首席科學家張弓教授開發,最初是專門用于大規模測序的序列比對,其準確度有數學證明,并已基本達到理論上限。隨后逐漸擴展其應用領域,目前已直接整合了快速的突變檢測和表達量檢測等常用分析,部署于承啟生物的云平臺上。2020年,承啟生物云平臺創造了單機5分鐘分析完成一個人全基因組測序數據集的世界紀錄并保持至今,用戶不再需要自己購買昂貴的服務器,只需要上傳數據即可享受免費、快速準確的基因測序分析服務。2022年,以FANSe為基礎的大規模測序云分析系統在AWS上部署成功,全世界的用戶都可以在數據不出境的前提下使用FANSe快速準確的分析。FANSe極高的效率也使得其成為唯一一種在純國產CPU上能達到應用上可接受的速度的分析流程,使得基因測序的全流程完全脫離國外技術,徹底避免“卡脖子”,保障中國精準醫學的安全。

此次FANSe被確認可以準確全面地檢測癌癥突變,將為癌癥診療等應用提供重要的標準化依據,也為行業樹立了一個新的標桿。

]]>
承啟生物基于FANSe算法的基因測序分析云平臺在AWS上運行成功 2022-09-19 11:59:00 FANSe(黑色線)和兩種國際常用算法(綠色和藍色線)在體細胞突變標準測試數據集上的靈敏度對比 FANSe算法由承啟生物全自主研發,歷經多次更新迭代,如今已發展到第四代,在基因組突變搜尋、轉錄組定量等常見應用中,其準確度和穩健性顯著超越傳統算法,是迄今為止穩健性和準確性 最高 的比對算法。在運行速度上,其曾創下并至今保持了單機5分鐘分析完一個30X人全基因組測序數據集的世界紀錄。承啟還自主開發了專用于FANSe的壓縮算法,能將測序數據壓縮至最高1/20進行傳輸,成倍降低了網絡傳輸耗時,且無需解壓即可被FANSe處理。承啟生物自主搭建的基于FANSe算法的私有云平臺表現出了優異的性能,用戶不必購買服務器,也不必掌握艱深的生物信息學知識,點點鼠標即可完成測序分析,得到穩健而精準的結果。但在私有云上由于帶寬的限制,隨著使用承啟云分析的客戶增多,就會出現數據"扎堆"傳不上,帶寬被"擠爆"的現象,這時,即使是FANSe這類快速精準的算法也失去了用武之地。 承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud 如今,基于FANSe算法的基因測序分析云平臺"搬"到了AWS公有云平臺上,首先解決的就是網絡帶寬問題。公有云分布式的網絡總帶寬極大,可以承載很多用戶海量數據的同時上傳,這對FANSe算法來說無疑是"如虎添翼",其極為高效的優勢在公有云彈性大的特點下得以充分展現:單任務完成速度快,小規模的應用上傳完畢稍等片刻即可得到結果,大型應用如全基因組測序分析也只是需要調用更多的計算核心而已。且FANSe完全不需要任何FPGA、GPU等硬件加速,僅靠CPU運算就可實現如此高的速度,通用性較好,云服務商也無需專門配置專用硬件,在現有硬件上就可以良好運行,易于不斷升級來適應層出不窮的新應用。 其次,基于FANSe算法的基因測序分析云平臺在AWS上的成功運行,可以讓來自全球的基因測序企業和科研機構在滿足各國敏感數據不出境的法律法規要求下享有精準高效的分析服務,此前,由于涉及人類遺傳資源,許多國家和地區政府立法規定基因測序數據和樣本不允許出境,這也就使得很多境外企業和科研機構不能應用FANSe云平臺進行基因測序數據分析。而由于AWS平臺在各國都設有數據中心,完美地符合法律法規要求,就可以讓全世界都獲得基于FANSe算法的基因測序分析服務,從而推動全球基因測序、精準醫學行業的快速發展。 于企業而言,FANSe在AWS的成功運行可以為其實現降本增效,而對于承啟生物而言,在如今中美貿易戰、科技戰愈演愈烈的國際大背景下,純國產自主研發的技術能獲得全球最大云服務商的高度認可并全球部署,是中美基因測序行業逆向技術溢出效應的一個良好開端,未來,承啟生物將繼續深耕組學技術領域,以更多的國產創新技術助推行業發展,在世界舞臺上發出更多的中國聲音,賦能"精準醫學更精準"。 ]]>

深圳2022年9月19日 /美通社/ -- 近日,承啟生物攜手亞馬遜云服務(AWS),在AWS上成功部署了基于FANSe算法的全自主基因測序分析云平臺,并免費向全世界開放使用。承啟生物將依托AWS構建的云計算加速系統,充分發揮FANSe算法精確高效、便捷快速、可擴展性強等性能優勢,為全世界的基因測序企業和科研機構做好服務。FANSe算法在AWS平臺的運行也標志著中國自主研發的精準組學技術解決方案走出國門走向世界,為精準醫療的發展貢獻力量。

速度慢、算不準 傳統算法短板不容忽視

隨著數字化時代的全面到來,越來越多的企業開始將應用向云端遷移,而且從外圍輔助型應用,逐步深入到生產和決策等核心業務系統,而AWS作為全球最大的云服務商,為全球數百萬企業提供了安全性高、擴展性強、可靠性高的云基礎設施,同時,還提供了來自全球數據中心的超200種功能服務,搭建了極具活力的生態系統,其較高的整體網絡質量,低延遲、低數據包丟失,應用程序靈活度高等特點滿足了公共事業政府部門、傳統企業、老牌互聯網企業、創業科技公司等不同機構企業的多元化需求。由于云計算彈性好、帶寬大、算力高、按需付費的特點,似乎十分適合基因測序分析的場景,在AWS平臺上,此前也確實有部分大規模測序分析算法運行,比如一些基于BWT的算法,然而卻少有在精準醫學和科研中的實際應用,因為應用體驗其實算不得好,主要集中在速度慢、算不準兩個問題上。

當前主流的二代基因測序是將DNA或RNA隨機打斷成無數個小片段進行并行測序,數據量極大,一個人全基因組測序數據集動輒高達300GB以上,采用通用壓縮算法可將其壓縮至1/4,上傳仍然需要幾個小時,傳完還得解壓。隨后,需要進行序列過濾、序列比對、統計檢驗、數據庫匹配等大量計算才能得出有意義的檢測結果,傳統算法運算效能不高,例如基因組突變搜尋常需要幾十個小時才能跑完整個流程。為了提升算法的速度,國內有云計算服務商部署了FPGA硬件加速的基因測序分析系統,但此類分析系統成本高昂、應用單一,難以適應日新月異的應用需求。盡管如此,其單任務處理速度耗時依然較長,例如分析完成一個人全基因組測序數據集(不計網絡傳輸)仍需接近2個小時,這種速度顯然無法適應精準醫學時代每天海量樣品的分析需求。此外,傳統測序分析算法參數復雜,如若沒有相應的專業知識和經驗試錯,不易設置最優化的參數,從而直接影響檢出率和準確率。因此,企業寧愿自行購買維護昂貴的服務器集群、花大價錢雇傭生信分析員在本地進行分析,也極少愿意在實際業務中使用云平臺。

FANSe在AWS公有云平臺上線 為基因測序行業降本增效

FANSe(黑色線)和兩種國際常用算法(綠色和藍色線)在體細胞突變標準測試數據集上的靈敏度對比
FANSe(黑色線)和兩種國際常用算法(綠色和藍色線)在體細胞突變標準測試數據集上的靈敏度對比

FANSe算法由承啟生物全自主研發,歷經多次更新迭代,如今已發展到第四代,在基因組突變搜尋、轉錄組定量等常見應用中,其準確度和穩健性顯著超越傳統算法,是迄今為止穩健性和準確性最高的比對算法。在運行速度上,其曾創下并至今保持了單機5分鐘分析完一個30X人全基因組測序數據集的世界紀錄。承啟還自主開發了專用于FANSe的壓縮算法,能將測序數據壓縮至最高1/20進行傳輸,成倍降低了網絡傳輸耗時,且無需解壓即可被FANSe處理。承啟生物自主搭建的基于FANSe算法的私有云平臺表現出了優異的性能,用戶不必購買服務器,也不必掌握艱深的生物信息學知識,點點鼠標即可完成測序分析,得到穩健而精準的結果。但在私有云上由于帶寬的限制,隨著使用承啟云分析的客戶增多,就會出現數據"扎堆"傳不上,帶寬被"擠爆"的現象,這時,即使是FANSe這類快速精準的算法也失去了用武之地。

承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud
承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud

如今,基于FANSe算法的基因測序分析云平臺"搬"到了AWS公有云平臺上,首先解決的就是網絡帶寬問題。公有云分布式的網絡總帶寬極大,可以承載很多用戶海量數據的同時上傳,這對FANSe算法來說無疑是"如虎添翼",其極為高效的優勢在公有云彈性大的特點下得以充分展現:單任務完成速度快,小規模的應用上傳完畢稍等片刻即可得到結果,大型應用如全基因組測序分析也只是需要調用更多的計算核心而已。且FANSe完全不需要任何FPGA、GPU等硬件加速,僅靠CPU運算就可實現如此高的速度,通用性較好,云服務商也無需專門配置專用硬件,在現有硬件上就可以良好運行,易于不斷升級來適應層出不窮的新應用。

其次,基于FANSe算法的基因測序分析云平臺在AWS上的成功運行,可以讓來自全球的基因測序企業和科研機構在滿足各國敏感數據不出境的法律法規要求下享有精準高效的分析服務,此前,由于涉及人類遺傳資源,許多國家和地區政府立法規定基因測序數據和樣本不允許出境,這也就使得很多境外企業和科研機構不能應用FANSe云平臺進行基因測序數據分析。而由于AWS平臺在各國都設有數據中心,完美地符合法律法規要求,就可以讓全世界都獲得基于FANSe算法的基因測序分析服務,從而推動全球基因測序、精準醫學行業的快速發展。

于企業而言,FANSe在AWS的成功運行可以為其實現降本增效,而對于承啟生物而言,在如今中美貿易戰、科技戰愈演愈烈的國際大背景下,純國產自主研發的技術能獲得全球最大云服務商的高度認可并全球部署,是中美基因測序行業逆向技術溢出效應的一個良好開端,未來,承啟生物將繼續深耕組學技術領域,以更多的國產創新技術助推行業發展,在世界舞臺上發出更多的中國聲音,賦能"精準醫學更精準"。

]]>
承啟生物聯合英氣科技建全國首個國家健將級運動員全基因組數據庫 2022-06-15 12:39:00 深圳2022年6月15日 /美通社/ -- 近日,承啟生物聯合英氣科技,以全國產的測序流程和分析設備,建立了全國首個健將級運動員全基因組數據庫,收錄的運動員中約13%曾獲奧運會金牌。此數據庫的建立,將賦能競技體育和大眾體育向著更卓越、更高效、更安全的方向前進,以精準醫學的視角將體育運動推向"精準體育"時代。

眾所周知,體育表現與基因關系極為密切,例如一個人幾乎不可能同時擅長長跑和短跑。因此西方國家很早就開始將基因檢測廣泛用于運動員的發掘選拔、個性化訓練和營養方案的制定上。國際知名體能教練胡賽因·阿卜德達耶指導過來自不同國家的上千名奧運運動員,2019年他接受采訪時說:"我們將對遺傳信息的理解融入訓練計劃的考量,……這可使我們精確地理解并幫助我們的運動員,在最短的時間內最有效地達到他們的目標。" 十幾年來一直為國家馬拉松隊、競走隊等提供保障的運動康復專家于尚雨說:"如果不顧個體的基因背景,都使用相同的運動和營養方案,有的人就是比另一些人更容易受傷,恢復得也慢。"

美國體能協會NSCA體能訓練專家、中國上海隊前體能教練、深圳市龍華區政府特聘專家李元杰創立的英氣科技,致力于將國際先進的體育訓練體系本地化,融合訓練體系、基因檢測、可穿戴物聯網設備、高水平運動員等資源,服務于大眾,尤其是青少年體質的高效提升。在基因檢測方面,英氣科技經過多方比較,最終選擇了承啟生物的基因檢測流程作為服務提供商,因為承啟的全自主基因檢測流程是《國家醫學生命組學質量控制標準》的重要藍本,準確度更高。在青少年體育訓練中結合目前公開文獻上的體育相關基因位點進行精準體育方案的制定,取得了驚人的成效:僅兩個月時間,試點學校體育優良率增長86%,有的中考學生一個月就能從不及格提升至滿分。"這說明承啟的基因測得準,我們也能很好地在體育實踐中應用這些信息。"李元杰說。"但已發表的研究大多基于歐美或非洲隊列,缺乏中國人隊列,在實踐中感覺到不夠完善,畢竟中國人的遺傳背景和歐美非很不同,一些優勢基因狀況肯定不能完全照搬歐美結果。西方國家研究早、實踐多,擁有龐大的數據庫,而且將這些數據作為保護國家利益的機密并不對外開放。只有自主研發建立中國自己的精準基因數據庫才行。"

因此,英氣科技利用其在體育界的影響力和廣泛的健將級運動員資源,開始打造國內首個健將級運動員全基因組數據庫,對標歐美國家的同類數據庫。出于對國家利益的考慮,整個全基因組測序和分析流程必須采用完全國產技術和設備,甚至連電腦都必須使用國產芯片以保證數據安全。"目前只有承啟的流程能做到全國產化。今年承啟實現了在國產CPU上用自主FANSe算法高效運算全基因組測序數據,徹底消除了數據泄露風險,因此我們的項目才正式啟動。整個項目完全符合現有法律法規的要求。"李元杰說。目前,第一批健將級運動員的全基因組數據已全部分析完畢,收錄進數據庫。

暨南大學體育學院副院長潘東教授說:"中國健將級運動員全基因組數據庫的建立,標志著我國打破國際體育科技壟斷,為我國體育走向精準化時代提供關鍵的基礎數據支撐,不僅將極大地助力競技體育人才的選拔與培養,賦能競技體育的發展,也將促進全民體質更高效、更安全地提升。"

]]>
承啟生物實現純國產硬件高性能分析大規模基因測序數據 2022-05-18 19:21:00 承啟生物在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據 日前,FANSe算法在純國產平臺上運行成功,CPU是兆芯開先KX-U6780A,固態硬盤來自長江存儲,內存芯片來自長鑫。與之對比的是一臺雙Intel E5V3 (共28核56線程)的服務器,都部署在承啟基因測序分析云平臺上。在常見的轉錄組、翻譯組、細菌菌群宏基因組等應用中,純國產計算機的性能僅比服務器慢1%~12%,使用中幾乎感覺不到其性能差異。這也是純國產計算設備在大規模測序數據處理上第一次在實際應用性能上幾乎追平國際主流服務器。 此前,承啟生物和華大智造聯合發布了國產大規模測序的全流程,將測序儀、試劑、分析算法等全面實現國產化,不依賴國外知識產權,有力地捍衛了中國精準醫學的自主權。 如今,承啟再進一步,憑借專門優化的FANSe算法,將純國產計算設備的應用性能提高到比肩國際主流的水平,標志著中國的基因測序的安全性和自主可控達到一個全新的高度,不僅能支撐諸多精準醫學應用,更能在檢驗檢疫、流行病控制、生物戰防治、法醫鑒定等直接關系到國家安全的方面大顯身手。 ]]> 深圳2022年5月18日 /美通社/ -- 日前,承啟生物首次實現了在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據,其速度與當前基于主流Intel和AMD處理器的臺式機和服務器相當。這實現了精準醫學基因測序領域的純國產流程實用化,在這一領域中國徹底擺脫了"卡脖子"問題。

大規模測序,又稱新一代測序、二代測序,將DNA或RNA打斷成許多小片段進行平行測序,一次測序即可得到幾百萬至幾億個小片段的核酸片段序列信息,在生物學研究、疾病診斷、流行病溯源等領域有著廣泛的應用。但產生的海量數據必須經過大量運算才能得到有生物學意義的結論,通常這需要很強算力的計算機或服務器才能在數小時內給出結果。

然而,高性能CPU和GPU高度依賴進口,不但有被國外斷供"卡脖子"的危險,而且進口CPU還可能存在后門,有泄密風險。在政府等對安全性要求極高的場合,以往一直沒有純國產計算機能滿足大規模測序的分析需求,這是由于國產CPU難以滿足需求。

承啟一直在生物信息國產化處理領域做努力,經過深入調研發現,兆芯開先CPU架構的整數性能理論上比較優秀,實際應用時需要軟件的特定優化才能發揮其全部性能潛力,因此選擇了兆芯開先CPU作為FANSe算法適配優化的目標。

承啟生物自研的FANSe算法是目前唯一規模化商用的純國產高性能大規模測序比對算法,2020年其曾創下單機5分鐘分析完一個30X人全基因組測序數據集的世界紀錄,并一直保持至今。算法完全自研帶來了顯著的優勢,可以任意根據CPU的特性而進行特別優化,而依賴于國外知識產權的傳統算法則難以做到。

承啟生物在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據
承啟生物在純國產電腦上使用自研FANSe算法高性能分析大規模基因測序數據

日前,FANSe算法在純國產平臺上運行成功,CPU是兆芯開先KX-U6780A,固態硬盤來自長江存儲,內存芯片來自長鑫。與之對比的是一臺雙Intel E5V3 (共28核56線程)的服務器,都部署在承啟基因測序分析云平臺上。在常見的轉錄組、翻譯組、細菌菌群宏基因組等應用中,純國產計算機的性能僅比服務器慢1%~12%,使用中幾乎感覺不到其性能差異。這也是純國產計算設備在大規模測序數據處理上第一次在實際應用性能上幾乎追平國際主流服務器。

此前,承啟生物和華大智造聯合發布了國產大規模測序的全流程,將測序儀、試劑、分析算法等全面實現國產化,不依賴國外知識產權,有力地捍衛了中國精準醫學的自主權。

如今,承啟再進一步,憑借專門優化的FANSe算法,將純國產計算設備的應用性能提高到比肩國際主流的水平,標志著中國的基因測序的安全性和自主可控達到一個全新的高度,不僅能支撐諸多精準醫學應用,更能在檢驗檢疫、流行病控制、生物戰防治、法醫鑒定等直接關系到國家安全的方面大顯身手。

]]>
張弓教授當選國際人類蛋白質組計劃常委 領銜人類蛋白質組研究 2022-04-29 23:29:00 國際人類蛋白質組計劃執行委員會常務委員、承啟生物首席科學家、暨南大學教授張弓 以多項領先科研成果?在全球學術舞臺上發出"中國聲音" 蛋白質是組成人體一切細胞、組織的必要成分,是生命活動的實際承擔者。在人類基因組計劃完成后,人類基因組各基因及其功能都有待在蛋白質層面予以揭示和闡明。事實上,蛋白質組比基因組復雜得多。據專家估計,人類基因組上約2萬個基因可變化出高達數百萬種蛋白質形體(Proteoforms),因此系統性研究人類蛋白質組勢在必行。為此,國際上成立了人類蛋白質組計劃(Human Proteome Project, HPP),這是人類基因組計劃之后的又一大型國際科學合作項目。2012年,"染色體中心的人類蛋白質組計劃(CHPP)"作為HPP的核心正式啟動,其主要目的是鑒定所有人類蛋白質,迄今為止仍在進行中。 此次,張弓教授被任命為國際人類蛋白質組計劃執行委員會常務委員,表明中國關于人類蛋白質的研究已躋身世界前列,并獲得國際學術界的高度認可,徹底掌握該領域的核心話語權。 事實上,此次張弓教授的當選絕非偶然,自2013年開始,張弓教授就和其他中國科學家一起,在人類蛋白質研究領域中不斷發出中國聲音。 HUPO2014大會上,張弓教授與國際人類蛋白質組計劃的發起人Young-Ki Paik(韓國延世大學教授)在完成翻譯組學的特邀報告后合影 2013年,張弓教授團隊研發成功翻譯組測序技術,并與王通教授、何慶瑜教授研究組一同提出,翻譯組測序可以為蛋白質組質譜解析提供獨立而精密的參考信息,從而極大提高解析蛋白質組的能力。該技術于2014年被作為CHPP的核心支柱之一,并在同年被人類蛋白質組組織列為國際人類蛋白質組計劃的首要突出貢獻; 2018年,張弓教授等人在核心生物期刊Nucleic Acids Research(《核酸研究》)上發表了目前最全的 翻譯組學數據庫TranslatomeDB,該數據為蛋白質組研究提供了重要的參照資源和獨立質控數據源; 2019年,張弓教授、王通教授、何慶瑜教授研究組通過翻譯組測序和蛋白質組質譜技術,發現了數千個此前被認為的"非編碼RNA"實際上可翻譯出蛋白質。該研究系統性地重新注釋了人類基因組,打開了一個全新的人類"暗蛋白質組"世界,也為研究各種重大疾病的機制、研發新型診斷和治療方法探索出了更多可能。 翻譯組(RNC-mRNA)被作為國際人類蛋白質組計劃的核心支柱之一。Reprinted with permission from J. Proteome Res. 2014, 13, 1, 50–59. Copyright 2014 American Chemical Society. 由于其突出貢獻,張弓教授被推選為2022-2024年CHPP新一屆執行委員會常委。此次張弓教授在國際舞臺上榮膺國際人類蛋白質組計劃執行委員會常務委員,亦是對其在過去10年不斷在翻譯組測序技術和蛋白質組質譜技術相關領域的肯定。未來,在以張弓教授為首的中國科學家帶領下,中國的人類蛋白質研究還將取得更多新突破,為解密人體的"健康密碼"貢獻更多力量。 以技術創新破局?促推行業發展 在學術研究者的身份之外,張弓教授的另一個身份是承啟生物的聯合創始人,在其帶領下,承啟生物也不斷為國際人類蛋白質組計劃貢獻企業力量。 作為一家致力于用基因科技為人們提供精準醫療及健康管理服務的科技公司,承啟生物建立了極為豐富的翻譯組學研究,是目前僅少數能提供多物種翻譯組測序及分析,并掌握著一系列翻譯組測序技術專利的公司,得益于此,2017年,承啟生物宣布為國際人類蛋白質組計劃免費提供翻譯組測序服務,助力國際人類蛋白質組計劃早日完成。 張弓教授受邀在HUPO2017大會上作關于發現人類“暗蛋白質組”的專題報告,并在會上宣布承啟生物將為國際人類蛋白質組計劃免費提供翻譯組測序服務 自2022年起,國際人類蛋白質組計劃的官方數據庫neXtProt的亞洲分站也由承啟生物建設、運營和維護。這是國際人類蛋白質組計劃第一次將官方數據庫 交由亞洲公司運維,需要團隊具備海量組學數據的精準處理能力和超大型生物信息數據庫的運維能力。最終,選由承啟生物作為該數據庫的承接者,對于中國在國際人類蛋白質組計劃中核心地位的提升具有重大意義。4月,位于瑞士的neXtProt數據庫團隊開始向承啟生物同步現有數據。 如果說,張弓教授是承啟生物的主心骨,那么其原創的"中國造"FANSe算法就是承接HPP官方數據庫建立的基石。FANSe系列核酸測序算法是迄今為止穩健性和準確性 最高的比對算法 ,同時具備很高的容錯性,被CHPP指定為核心支柱的推薦算法,可單機5分鐘分析完一個人全基因組測序數據集,刷新世界紀錄。FANSe算法另一個特性是全自主開發,這使得其可移植性和擴展性幾乎沒有任何限制,可高效運行于全國產的計算機上,在目前國際貿易爭端形勢嚴峻的情況下,無論在軟件還是硬件層面,使用FANSe算法都不會被國外卡脖子。以FANSe算法為基礎,張弓教授團隊和承啟生物陸續成功研發了一系列高精度算法和實驗方案,橫跨核酸測序、蛋白質組、代謝組等,建立了完整的國產化全組學高性能、高精度分析體系,確保了中國精準醫學的精準與安全。 未來,承啟生物將繼續依托自身的技術優勢和資源,將更多更創新的基因測序、翻譯組學、蛋白質組學等技術應用于臨床與科研,為全面解析人類蛋白質組貢獻一己之力,推動"以蛋白質組學驅動精準醫學"的發展。 ]]> 深圳2022年4月29日 /美通社/ -- 2021年底,承啟生物首席科學家、暨南大學張弓教授當選國際人類蛋白質組計劃執行委員會常務委員,這是目前在這一國際大型合作項目中,中國人任職的最高職位。與此同時,張弓教授還被任命領導8號染色體編碼蛋白質的研究,加上此前暨南大學何慶瑜教授已被任命領導20號染色體編碼蛋白質的研究,至此,暨南大學承擔了中國大陸三分之二的蛋白質研究任務,成為中國人類蛋白質組計劃的最大承擔單位

國際人類蛋白質組計劃執行委員會常務委員、承啟生物首席科學家、暨南大學教授張弓
國際人類蛋白質組計劃執行委員會常務委員、承啟生物首席科學家、暨南大學教授張弓

以多項領先科研成果 在全球學術舞臺上發出"中國聲音"

蛋白質是組成人體一切細胞、組織的必要成分,是生命活動的實際承擔者。在人類基因組計劃完成后,人類基因組各基因及其功能都有待在蛋白質層面予以揭示和闡明。事實上,蛋白質組比基因組復雜得多。據專家估計,人類基因組上約2萬個基因可變化出高達數百萬種蛋白質形體(Proteoforms),因此系統性研究人類蛋白質組勢在必行。為此,國際上成立了人類蛋白質組計劃(Human Proteome Project, HPP),這是人類基因組計劃之后的又一大型國際科學合作項目。2012年,"染色體中心的人類蛋白質組計劃(CHPP)"作為HPP的核心正式啟動,其主要目的是鑒定所有人類蛋白質,迄今為止仍在進行中。

此次,張弓教授被任命為國際人類蛋白質組計劃執行委員會常務委員,表明中國關于人類蛋白質的研究已躋身世界前列,并獲得國際學術界的高度認可,徹底掌握該領域的核心話語權。

事實上,此次張弓教授的當選絕非偶然,自2013年開始,張弓教授就和其他中國科學家一起,在人類蛋白質研究領域中不斷發出中國聲音。

HUPO2014大會上,張弓教授與國際人類蛋白質組計劃的發起人Young-Ki Paik(韓國延世大學教授)在完成翻譯組學的特邀報告后合影
HUPO2014大會上,張弓教授與國際人類蛋白質組計劃的發起人Young-Ki Paik(韓國延世大學教授)在完成翻譯組學的特邀報告后合影

2013年,張弓教授團隊研發成功翻譯組測序技術,并與王通教授、何慶瑜教授研究組一同提出,翻譯組測序可以為蛋白質組質譜解析提供獨立而精密的參考信息,從而極大提高解析蛋白質組的能力。該技術于2014年被作為CHPP的核心支柱之一,并在同年被人類蛋白質組組織列為國際人類蛋白質組計劃的首要突出貢獻;

2018年,張弓教授等人在核心生物期刊Nucleic Acids Research(《核酸研究》)上發表了目前最全的翻譯組學數據庫TranslatomeDB,該數據為蛋白質組研究提供了重要的參照資源和獨立質控數據源;

2019年,張弓教授、王通教授、何慶瑜教授研究組通過翻譯組測序和蛋白質組質譜技術,發現了數千個此前被認為的"非編碼RNA"實際上可翻譯出蛋白質。該研究系統性地重新注釋了人類基因組,打開了一個全新的人類"暗蛋白質組"世界,也為研究各種重大疾病的機制、研發新型診斷和治療方法探索出了更多可能。

翻譯組(RNC-mRNA)被作為國際人類蛋白質組計劃的核心支柱之一。Reprinted with permission from J. Proteome Res. 2014, 13, 1, 50–59. Copyright 2014 American Chemical Society.
翻譯組(RNC-mRNA)被作為國際人類蛋白質組計劃的核心支柱之一。Reprinted with permission from J. Proteome Res. 2014, 13, 1, 50–59. Copyright 2014 American Chemical Society.

由于其突出貢獻,張弓教授被推選為2022-2024年CHPP新一屆執行委員會常委。此次張弓教授在國際舞臺上榮膺國際人類蛋白質組計劃執行委員會常務委員,亦是對其在過去10年不斷在翻譯組測序技術和蛋白質組質譜技術相關領域的肯定。未來,在以張弓教授為首的中國科學家帶領下,中國的人類蛋白質研究還將取得更多新突破,為解密人體的"健康密碼"貢獻更多力量。

以技術創新破局 促推行業發展

在學術研究者的身份之外,張弓教授的另一個身份是承啟生物的聯合創始人,在其帶領下,承啟生物也不斷為國際人類蛋白質組計劃貢獻企業力量。

作為一家致力于用基因科技為人們提供精準醫療及健康管理服務的科技公司,承啟生物建立了極為豐富的翻譯組學研究,是目前僅少數能提供多物種翻譯組測序及分析,并掌握著一系列翻譯組測序技術專利的公司,得益于此,2017年,承啟生物宣布為國際人類蛋白質組計劃免費提供翻譯組測序服務,助力國際人類蛋白質組計劃早日完成。

張弓教授受邀在HUPO2017大會上作關于發現人類“暗蛋白質組”的專題報告,并在會上宣布承啟生物將為國際人類蛋白質組計劃免費提供翻譯組測序服務
張弓教授受邀在HUPO2017大會上作關于發現人類“暗蛋白質組”的專題報告,并在會上宣布承啟生物將為國際人類蛋白質組計劃免費提供翻譯組測序服務

自2022年起,國際人類蛋白質組計劃的官方數據庫neXtProt的亞洲分站也由承啟生物建設、運營和維護。這是國際人類蛋白質組計劃第一次將官方數據庫交由亞洲公司運維,需要團隊具備海量組學數據的精準處理能力和超大型生物信息數據庫的運維能力。最終,選由承啟生物作為該數據庫的承接者,對于中國在國際人類蛋白質組計劃中核心地位的提升具有重大意義。4月,位于瑞士的neXtProt數據庫團隊開始向承啟生物同步現有數據。

如果說,張弓教授是承啟生物的主心骨,那么其原創的"中國造"FANSe算法就是承接HPP官方數據庫建立的基石。FANSe系列核酸測序算法是迄今為止穩健性和準確性最高的比對算法,同時具備很高的容錯性,被CHPP指定為核心支柱的推薦算法,可單機5分鐘分析完一個人全基因組測序數據集,刷新世界紀錄。FANSe算法另一個特性是全自主開發,這使得其可移植性和擴展性幾乎沒有任何限制,可高效運行于全國產的計算機上,在目前國際貿易爭端形勢嚴峻的情況下,無論在軟件還是硬件層面,使用FANSe算法都不會被國外卡脖子。以FANSe算法為基礎,張弓教授團隊和承啟生物陸續成功研發了一系列高精度算法和實驗方案,橫跨核酸測序、蛋白質組、代謝組等,建立了完整的國產化全組學高性能、高精度分析體系,確保了中國精準醫學的精準與安全。

未來,承啟生物將繼續依托自身的技術優勢和資源,將更多更創新的基因測序、翻譯組學、蛋白質組學等技術應用于臨床與科研,為全面解析人類蛋白質組貢獻一己之力,推動"以蛋白質組學驅動精準醫學"的發展。

]]>
承啟生物發布超高精度蛋白質測序方案,蛋白質測序實用化時代到來 2022-03-21 20:45:00 參考資料:Highly Robust de Novo Full-Length Protein Sequencing, Anal. Chem. 2022, 94, 8, 3467–3475 ]]> 深圳2022年3月21日 /美通社/ -- 近日,承啟生物發布由其首席科學家、暨南大學張弓教授團隊研發的一種方便操作、超高精度蛋白質全長測序方案,準確率可達99-100%,刷新了迄今為止的世界紀錄。該方案使得蛋白質測序實用化,在生物學、醫學、生物安全、法醫物證等領域有廣闊的應用前景。

蛋白質是由20種氨基酸組成的長鏈,是所有生命功能的實際執行者。氨基酸序列決定著蛋白質的功能,絕大多數疾病都是由于蛋白質的異常而導致的。雖然絕大部分蛋白質由基因轉錄翻譯而來,但許多機制可以使蛋白質序列在這個過程中發生變化,一個基因可以產生少則一兩種、多則幾萬種不同的蛋白質,因此對蛋白質的序列進行直接研究就尤為重要。

蛋白質測序的精準化和實用化,在許多領域可以產生前所未有的應用。例如,利用蛋白質測序比核酸測序更快速、更不容易被污染干擾的特點,癌癥、老年癡呆等重疾的早篩和診斷將變得更加快捷方便;遇到生物安全事件(如重大疫情)時,蛋白質測序能幾個小時內快速鎖定病原體,大幅縮短疫情初期明確病原體的周期,為應對疫情爭取寶貴時間;抗體藥物研發過程中對篩選出的優秀抗體進行直接測序,將可以很快通過合成生物學方法大量生產這種抗體,大大縮短抗體藥物的研發周期;蛋白質測序技術也可以輕松破解被國外壟斷的蛋白質制劑,大幅度降低藥品價格;測定從環境中分離到的具有優異特性的蛋白質,如細菌真菌中降解各種污染物的酶,加以改造和工業應用,可實現綠色環保低碳的發展目標。

蛋白質測序技術在1967年就已出現,這比基因測序技術早了約10年,然而現在基因測序技術已高度成熟發達,蛋白質測序技術卻一直進展緩慢,完整度低、精準度低、成本高,導致蛋白質測序一直沒有得到大范圍的應用。這其中最大的區別在于,DNA可以準確地進行復制或互補配對,幾乎所有基因測序技術都基于此,而蛋白質無法復制,也無法依據序列來配對。

張弓教授團隊在基因測序方面深耕多年,其全自主開發的FANSe系列核酸測序算法是迄今為止穩健性和準確性最高的比對算法,同時具備很高的容錯性。團隊將基因組測序中的分步拼接和使用FANSe進行高精度校正的思想移植到蛋白質測序上,對蛋白質質譜分析進行了策略改進,對同一樣品的多份質譜數據進行自我比對和校正,最終對蛋白質全長序列的測序準確度達到了空前的99-100%,甚至可以發現買來的標準品蛋白中存在著突變。在不同結構特性的多個蛋白質的測試中,一律能達到近乎完美的全長測序結果,除非質譜儀測不出原始數據。更令人欣喜的是,這個策略甚至能應對質量較差的、有污染的實驗數據,同樣能穩健地輸出準確的結果。實驗操作簡便,算法也大部分可自動化運行,因此這種方法成本低、速度快、易于推廣。

正如基因測序精準化、廉價化之后引發人類生活和產業的巨變一樣,蛋白質測序精準化、廉價化,將又一次給人類社會帶來巨變。

目前,這一蛋白質測序方法的論文已在分析化學的權威期刊Analytical Chemistry上發表,算法可在承啟生物網站上免費下載:http://chi-biotech.com/mucs/

參考資料:Highly Robust de Novo Full-Length Protein Sequencing, Anal. Chem. 2022, 94, 8, 3467–3475

]]>
承啟生物承接國際人類蛋白質組計劃官方數據庫建設 2021-12-03 20:53:00 承啟團隊與neXtProt工作人員視頻連線會議 國際人類蛋白質組計劃(Human Proteome Project, HPP)是國際人類基因組計劃(Human Genome Project, HGP)的后續國際合作項目,最早可追溯至2000年。彼時,人類基因組計劃尚未完成,科學家們就已經意識到搞清楚人類基因組并不能完全理解人的生理病理過程,因為一個基因可以變化出幾種至數千種不同的蛋白質形體(proteoform),而蛋白質才是各種生理和病理功能的實際執行者。因此,各國科學家又策劃了人類蛋白質組計劃,力圖研究所有的人類蛋白質,這樣才能解開生命的奧秘。經過12年的前期準備,2012年人類蛋白質組計劃正式啟動。 人類蛋白質組計劃的官方數據庫是neXtProt (www.nextprot.org ),目的是建立一個人類蛋白質的百科全書。這個龐大的數據庫最初由瑞士生物信息學研究所(Swiss Institute of Bioinformatics) 和GeneBio SA 共同開發,不但存儲了大量的人類蛋白質知識庫,也有大量蛋白質組、微陣列、RNA、蛋白質相互作用、蛋白質-小分子相互作用等高質量數據集,其上的數據頻繁地更新,是人類蛋白質研究的集大成者,相當于研究人類蛋白質的基礎設施。 neXtProt數據庫網站界面 隨著人類蛋白質研究的不斷深入,neXtProt數據庫的容量越來越大,服務器負荷日漸沉重。中國日益增長的科研實力使得中國學者訪問該數據庫的需求與日俱增,但現有數據庫的資源卻遠遠不能滿足要求。為了推動人類科學界對人類蛋白質組的研究,尋找有實力、有口碑的單位進行合作就成為其最佳選擇。最終,承啟被選定為neXtProt亞洲分站的承建單位。 雖然承啟的主營業務主要是與大規模測序相關,由于其自研的FANSe系列高精度測序比對算法而被業界熟知,但承啟在蛋白質組上的積累很早就開始了。早在2014年,承啟首席科學家張弓教授所建立的翻譯組測序技術就被作為人類蛋白質組計劃的核心支柱之一,并連續被HUPO(人類蛋白質組組織)邀請在HUPO大會上做演講。2017年,承啟在HUPO大會上宣布免費為人類蛋白質組計劃提供翻譯組測序服務。2018年,承啟發布了當時 世界上最強的翻譯組學數據庫,為蛋白質組研究提供了重要的參考,該數據庫被發表在國際權威期刊Nucleic Acids Research上。2019年,張弓教授發表重大成果,通過翻譯組測序技術發現了數千個原本認為不可能編碼蛋白質的“非編碼基因”實際上能翻譯出50個氨基酸以上的蛋白質,并且這些蛋白質穩定存在,在癌癥中發揮著重要作用,人類基因組需要被系統性地重新注釋。承啟在這一研究中提供了核心的生物信息學分析服務。因此承啟被委以此重任,絕非偶然。 對承啟而言,常年具備處理海量組學數據的能力,可以完全承擔建立neXtProt所需的服務器資源和技術資源,因此neXtProt亞洲分站的建設和運維都將由承啟負責。 承啟承建人類蛋白質組計劃官方數據庫neXtProt的亞洲分站,標志著中國在人類蛋白質組計劃中的核心地位提升,這是承啟為推動人類蛋白質組計劃進展、為中國和亞洲的蛋白質科學發展的又一貢獻。]]> 深圳2021年12月3日 /美通社/ -- 近日,國際人類蛋白質組計劃確定,由承啟生物承接國際人類蛋白質組計劃的官方數據庫neXtProt(亞洲分站)的建設。這是國際人類蛋白質組計劃第一次將官方數據庫交由亞洲公司進行建設,標志著中國在人類蛋白質組計劃中的核心地位提升,也顯示出承啟生物不僅僅在測序領域取得國際聲譽,同時在蛋白質組學領域也受到國際學術界的權威認可。11月底,承啟與neXtProt數據庫工作人員進行視頻連線會議,neXtProt亞洲分站的建設正式開始。

承啟團隊與neXtProt工作人員視頻連線會議
承啟團隊與neXtProt工作人員視頻連線會議

國際人類蛋白質組計劃(Human Proteome Project, HPP)是國際人類基因組計劃(Human Genome Project, HGP)的后續國際合作項目,最早可追溯至2000年。彼時,人類基因組計劃尚未完成,科學家們就已經意識到搞清楚人類基因組并不能完全理解人的生理病理過程,因為一個基因可以變化出幾種至數千種不同的蛋白質形體(proteoform),而蛋白質才是各種生理和病理功能的實際執行者。因此,各國科學家又策劃了人類蛋白質組計劃,力圖研究所有的人類蛋白質,這樣才能解開生命的奧秘。經過12年的前期準備,2012年人類蛋白質組計劃正式啟動。

人類蛋白質組計劃的官方數據庫是neXtProt (www.nextprot.org),目的是建立一個人類蛋白質的百科全書。這個龐大的數據庫最初由瑞士生物信息學研究所(Swiss Institute of Bioinformatics) 和GeneBio SA 共同開發,不但存儲了大量的人類蛋白質知識庫,也有大量蛋白質組、微陣列、RNA、蛋白質相互作用、蛋白質-小分子相互作用等高質量數據集,其上的數據頻繁地更新,是人類蛋白質研究的集大成者,相當于研究人類蛋白質的基礎設施。

neXtProt數據庫網站界面
neXtProt數據庫網站界面

隨著人類蛋白質研究的不斷深入,neXtProt數據庫的容量越來越大,服務器負荷日漸沉重。中國日益增長的科研實力使得中國學者訪問該數據庫的需求與日俱增,但現有數據庫的資源卻遠遠不能滿足要求。為了推動人類科學界對人類蛋白質組的研究,尋找有實力、有口碑的單位進行合作就成為其最佳選擇。最終,承啟被選定為neXtProt亞洲分站的承建單位。

雖然承啟的主營業務主要是與大規模測序相關,由于其自研的FANSe系列高精度測序比對算法而被業界熟知,但承啟在蛋白質組上的積累很早就開始了。早在2014年,承啟首席科學家張弓教授所建立的翻譯組測序技術就被作為人類蛋白質組計劃的核心支柱之一,并連續被HUPO(人類蛋白質組組織)邀請在HUPO大會上做演講。2017年,承啟在HUPO大會上宣布免費為人類蛋白質組計劃提供翻譯組測序服務。2018年,承啟發布了當時世界上最強的翻譯組學數據庫,為蛋白質組研究提供了重要的參考,該數據庫被發表在國際權威期刊Nucleic Acids Research上。2019年,張弓教授發表重大成果,通過翻譯組測序技術發現了數千個原本認為不可能編碼蛋白質的“非編碼基因”實際上能翻譯出50個氨基酸以上的蛋白質,并且這些蛋白質穩定存在,在癌癥中發揮著重要作用,人類基因組需要被系統性地重新注釋。承啟在這一研究中提供了核心的生物信息學分析服務。因此承啟被委以此重任,絕非偶然。

對承啟而言,常年具備處理海量組學數據的能力,可以完全承擔建立neXtProt所需的服務器資源和技術資源,因此neXtProt亞洲分站的建設和運維都將由承啟負責。

承啟承建人類蛋白質組計劃官方數據庫neXtProt的亞洲分站,標志著中國在人類蛋白質組計劃中的核心地位提升,這是承啟為推動人類蛋白質組計劃進展、為中國和亞洲的蛋白質科學發展的又一貢獻。

 
]]>
承啟新冠論文獲深圳市首屆優秀自然科學學術論文獎 2021-11-23 15:56:00 承啟新冠論文獲“深圳市首屆優秀自然科學學術論文獎”榮譽證書 11月18日上午,2021年深圳市科協學術活動月啟動儀式暨首屆優秀自然科學學術論文成果評選頒獎活動在深圳量子科學與工程研究院舉行,張弓教授以獲獎論文作者身份受邀出席活動,穿著他標志性的Hello Kitty衣服上臺領獎。 深圳市首屆優秀自然科學學術論文成果評選頒獎 張弓教授的獲獎論文研究的是新冠病毒S蛋白與人類ACE2受體在不同溫度下的結合特性。結果顯示,38攝氏度 及以上的體溫可以有效降低新冠病毒S蛋白與ACE2的結合力,因而在新冠初期,發燒可降低新冠病毒侵染性,減輕癥狀,降低死亡率。而在新冠晚期,由于體內侵染和擴散已完成,高燒體溫則只會給人體帶來損害,無法降低死亡率。這與國內外大量臨床數據十分吻合,簡言之,“能發燒就沒大事”。這篇文章對新冠治療中第一時間降低體溫的做法發出質疑,為新冠治療方法的改進提供了重要依據。 該項研究發表在《Computational and Structural Biotechnology Journal》上,隨即得到廣泛關注,科技日報專門撰文報道。(詳情請看鏈接: http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2021-01/06/content_460576.htm?div=-1 ) 中國日報(China Daily)也對此進行專訪,并將此成果作為 Fighting COVID-19: the Chinese way (抗擊新冠的中國道路)專刊的一部分。(詳情請看鏈接: https://covid-19.chinadaily.com.cn/a/202101/06/WS5ff5600ba31024ad0baa0de7.html ) ? 難能可貴的是,這篇論文是本次獲獎的16篇論文中唯一一篇主要由公司完成的科研成果,其他論文均由大學或科研院所完成。2020年2月疫情爆發期間,全國多數大學和科研院所無法正常運轉。承啟組織力量,獨辟蹊徑采用分子動力模擬方法先行計算預測,得以在嚴格封城時推進研究,同時克服種種困難,利用公司的資源和力量進行實驗驗證,最終成就了這一重要成果。因此,此次獲獎彰顯了承啟高度的社會責任感與強大的科研實力。 ]]> 深圳2021年11月23日 /美通社/ -- 近日,由深圳市科學技術協會(以下簡稱市科協)主辦的首屆優秀自然科學學術論文征文活動評選結果揭曉,承啟張弓教授的論文《Temperature dependence of the SARS-CoV-2 affinity to human ACE2 determines COVID-19 progression and clinical outcome》榮獲2021年深圳市科學技術協會優秀自然科學學術論文獎。

本次優秀自然科學學術論文分新一代信息技術、生命健康、新材料三大類別進行評選,共有16篇論文獲獎,其中生命健康類僅有5篇論文獲獎。

承啟新冠論文獲“深圳市首屆優秀自然科學學術論文獎”榮譽證書
承啟新冠論文獲“深圳市首屆優秀自然科學學術論文獎”榮譽證書

11月18日上午,2021年深圳市科協學術活動月啟動儀式暨首屆優秀自然科學學術論文成果評選頒獎活動在深圳量子科學與工程研究院舉行,張弓教授以獲獎論文作者身份受邀出席活動,穿著他標志性的Hello Kitty衣服上臺領獎。

深圳市首屆優秀自然科學學術論文成果評選頒獎
深圳市首屆優秀自然科學學術論文成果評選頒獎

張弓教授的獲獎論文研究的是新冠病毒S蛋白與人類ACE2受體在不同溫度下的結合特性。結果顯示,38攝氏度及以上的體溫可以有效降低新冠病毒S蛋白與ACE2的結合力,因而在新冠初期,發燒可降低新冠病毒侵染性,減輕癥狀,降低死亡率。而在新冠晚期,由于體內侵染和擴散已完成,高燒體溫則只會給人體帶來損害,無法降低死亡率。這與國內外大量臨床數據十分吻合,簡言之,“能發燒就沒大事”。這篇文章對新冠治療中第一時間降低體溫的做法發出質疑,為新冠治療方法的改進提供了重要依據。

該項研究發表在《Computational and Structural Biotechnology Journal》上,隨即得到廣泛關注,科技日報專門撰文報道。(詳情請看鏈接:http://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2021-01/06/content_460576.htm?div=-1

中國日報(China Daily)也對此進行專訪,并將此成果作為 Fighting COVID-19: the Chinese way (抗擊新冠的中國道路)專刊的一部分。(詳情請看鏈接:https://covid-19.chinadaily.com.cn/a/202101/06/WS5ff5600ba31024ad0baa0de7.html  

難能可貴的是,這篇論文是本次獲獎的16篇論文中唯一一篇主要由公司完成的科研成果,其他論文均由大學或科研院所完成。2020年2月疫情爆發期間,全國多數大學和科研院所無法正常運轉。承啟組織力量,獨辟蹊徑采用分子動力模擬方法先行計算預測,得以在嚴格封城時推進研究,同時克服種種困難,利用公司的資源和力量進行實驗驗證,最終成就了這一重要成果。因此,此次獲獎彰顯了承啟高度的社會責任感與強大的科研實力。

]]>
國際領先:FANSe算法通過科技成果評價 2021-07-30 20:41:00 FANSe算法科技成果通過中科合創(北京)科技成果評價中心評價 目前,幾乎所有二代測序應用需要進行mapping(快速比對),鑒于所有生物學意義的分析都高度依賴于mapping的結果,尤其是存在于reads(短讀序列)中的錯配結果,因此mapping的速度和精度都很重要。但速度與精度通常不可兼得,比如基于BWT原理的算法速度提升,但對錯配的處理無法做到完美,在實際生物學應用中容易導致假陰性和假陽性問題,國際頂級科學雜志 Nature斥之為“可重復性危機”(2012年)。2017年,JAMA Oncology 雜志發布結果,將40份癌癥病人樣本送給兩家世界知名測序公司進行測序,絕大部分樣本的兩份突變報告完全不同。因此二代測序技術在臨床上亂象叢生,難以保證高通量下的準確性。 為此,張弓教授開始研發FANSe算法,力圖建立穩健精準的二代測序基礎技術。2011年,FANSe1代研發成功,奠定了準確穩健的數學基礎,錯誤率可低至10-9 以下,一定條件之下可以100%保證得到數學最優解;2014年, FANSe2代研發成功,實現了并行化處理,同年開始部署在承啟生物的云平臺上;2015年起,高性能的FANSe3開始研發,2017年開始在國際權威科學期刊上亮相,2018年首次實現了單機1小時全基因組、1秒鐘全轉錄組的驚人分析速度;2020年 , 云平臺專用的FANSe4代在承啟生物創造了單節點5分鐘分析完一個人全基因組測序數據集的新紀錄。由于其強悍的性能和全自主的特點,FANSe被作為科技部國家重點研發計劃《醫學生命組學數據質量控制關鍵技術研發與應用》核酸測序的底層算法,為組學領域的質控標準貢獻關鍵力量。 ]]> 深圳2021年7月30日 /美通社/ -- 2021年7月13日,經科技部批準成立的第三方專業科技成果評價機構中科合創北京科技成果評價中心,組織專家以視頻連線方式召開了科技成果評價會,對承啟張弓教授團隊完成的“全自主高性能高穩健的核酸測序快速比對算法及云分析系統”進行科技評價。經過專家評審,FANSe系列算法同時達到了極高計算速度與準確性的雙重目標,具有超強的容錯能力及遠超傳統算法的實驗可驗證性,在解決“精準醫學不精準”的世界性難題上做出了重要的貢獻。作為可商用的基因數據底層比對核心技術,其比對精度比歐美算法高出兩個數量級,其云平臺的投入應用得到了用戶的一致好評,體現出良好的商業效益和社會效益。FANSe系列算法完全自主研發,保障了中國的科研和精準醫學的獨立自主性。評價專家組一致認為,該項目具有很強的科學性、創新性和實用性,研究成果總體上達到國際領先水平。

這是國家權威機構對FANSe的“官方認證”。

FANSe算法科技成果通過中科合創(北京)科技成果評價中心評價
FANSe算法科技成果通過中科合創(北京)科技成果評價中心評價

目前,幾乎所有二代測序應用需要進行mapping(快速比對),鑒于所有生物學意義的分析都高度依賴于mapping的結果,尤其是存在于reads(短讀序列)中的錯配結果,因此mapping的速度和精度都很重要。但速度與精度通常不可兼得,比如基于BWT原理的算法速度提升,但對錯配的處理無法做到完美,在實際生物學應用中容易導致假陰性和假陽性問題,國際頂級科學雜志Nature斥之為“可重復性危機”2012年。2017年,JAMA Oncology雜志發布結果,將40份癌癥病人樣本送給兩家世界知名測序公司進行測序,絕大部分樣本的兩份突變報告完全不同。因此二代測序技術在臨床上亂象叢生,難以保證高通量下的準確性。

為此,張弓教授開始研發FANSe算法,力圖建立穩健精準的二代測序基礎技術。2011年,FANSe1代研發成功,奠定了準確穩健的數學基礎,錯誤率可低至10-9以下,一定條件之下可以100%保證得到數學最優解;2014年FANSe2代研發成功,實現了并行化處理,同年開始部署在承啟生物的云平臺上;2015年起,高性能的FANSe3開始研發,2017年開始在國際權威科學期刊上亮相,2018年首次實現了單機1小時全基因組、1秒鐘全轉錄組的驚人分析速度;2020年云平臺專用的FANSe4代在承啟生物創造了單節點5分鐘分析完一個人全基因組測序數據集的新紀錄。由于其強悍的性能和全自主的特點,FANSe被作為科技部國家重點研發計劃《醫學生命組學數據質量控制關鍵技術研發與應用》核酸測序的底層算法,為組學領域的質控標準貢獻關鍵力量。

]]>
承啟生物解碼全基因組破紀錄背后:中國原創醫學實現降本增效 2020-07-13 09:00:00 。 承啟生物創始人、首席科學家張弓教授表示,“承啟生物的解決方案Chi-Cloud+FANSe3在攻破了無數個難題后,成功提升基因檢測分析速度。這一突破最值得關注的是全自主研發的FANSe算法,實現精準度之上的速度飛躍;此外,這項中國原創技術不依賴專用加速芯片,讓基因測序不再被國外供應商‘扼住咽喉’,大幅降低成本,為精準醫療、普惠醫療貢獻力量。” 全自主技術 基因測序不再被扼住咽喉 核心技術是國家與企業的安身立命之本,只有實現核心技術自主才能不被扼住命運的咽喉。承啟生物歷經6年自主研發的FANSe算法已進入第3代,張弓教授透露,這一算法不依賴專用加速硬件,從根本上避免芯片禁運風險,這項中國高端醫學技術將不再受制于人。 承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud 當前全球基因組測序大部分使用的基礎算法為國外的BWA、Bowtie等系列算法,單機運行效率并不高。為提高單機運算速度,常見方案是采用GPU、FPGA等專用芯片進行加速。但受國內芯片技術局限,目前國內僅有自主CPU,而高性能通用計算GPU、FPGA等芯片依然被國外壟斷。承啟的FANSe3算法只使用CPU進行計算,不依賴專用加速芯片,可做到在國產硬件上高效運行。此外,單機5分鐘分析全基因組的高效能,意味著在對數據保密性要求的特殊領域(如軍事、公共安全、特定的醫療場景等),可直接采用單機分析方式(Chi-Cloud小云模式),無需連接互聯網。算法針對國產測序儀進行特別適配和優化,保障精準醫學的國家安全。 為應對國產CPU性能與國際頂尖水平的現實差距問題,FANSe3和承啟云平臺架構在設計之初便支持大規模分布式運算和自適應任務調度,擴展性強,可利用多個CPU共同運算一個任務。“單機的性能弱了怎么辦?可以把2臺、3臺、4臺甚至100臺機器捆起來一起用,彌補單個CPU性能的不足,達到同樣甚至更好的使用體驗。”張弓教授說。 “單機5分鐘”推動精準醫學“更快、更便宜” 由于核心技術完全自主,承啟生物團隊可以對算法不斷改進,使FANSe3代算法在運算速度上實現遠超國外算法的飛躍。“單機5分鐘”的意義不僅限于提升時間和效率,更在于助推精準醫學普及。 承啟生物實驗室一景 目前先進的測序儀已能在一天內完成測序實驗,但數據分析用單機通常需要幾十個小時才能完成,但對許多臨床急性病癥,時間就是生命。使用國外算法,各大云服務提供商在使用幾十上百臺服務器的情況下,僅能將分析時間壓縮至半小時到一小時,而使用FPGA等專用加速芯片,也只能實現1-2小時的分析時間,而這些都需要巨額的硬件投入和專業維護,能耗也居高不下。 本次承啟生物實現的單機5分鐘分析突破,可讓大型測序中心擺脫超算集群和專業人員維護需求;硬件購置費用大大降低,能耗也大為降低,綠色環保。 單機5分鐘的速度,網絡傳輸是整體分析中的瓶頸。一個人全基因組測序數據文件可高達240GB以上,以千兆網的速度都需要傳輸40多分鐘。為解決這一問題,承啟為Chi-Cloud開發了獨有的壓縮算法,達到了1:10以上甚至1:20的壓縮率,縮短原本漫長的傳輸時間,多節點間的任務調配也更得心應手;與FANSe3算法深度配合,無需解壓即可直接運算。 使用高速的網絡接入,將數據傳輸至承啟生物的服務器上,測序中心甚至不需購買和維護服務器,基因組測序的分析成本降至幾乎可以忽略不計的程度。 所有這些,都讓全基因組測序分析“更快”。以超高速的運算助力重癥患者“與死神賽跑”,盡力避免治療“遲了一步”的遺憾,為醫生、患者爭取更多時間。 FANSe3算法+全鏈條穩健 實現“更精準” 與速度同樣重要的是算法的準確性,張弓教授強調,“準確性是所有優勢的前提。FANSe3是全球罕見的準確率有數學證明的算法,錯誤率已可穩定在十億分之一以下。經大量實驗表明,FANSe系列算法在基因組突變分析、轉錄組表達分析等應用上,準確度幾乎為100%,秒殺國外基于BWA、Bowtie等算法方案,并在醫學科研和臨床應用中分析超過50萬例樣本。” 2014年,FANSe算法成為國際人類蛋白質組計劃核心支柱的首選分析算法,為全面解析人類蛋白質組做出了關鍵貢獻。2017年9月,在國際人類蛋白質組計劃世界大會上,以張弓教授等為代表的廣東科學家團隊利用FANSe系列算法,發現數千個以往被認為不可能存在的人類“新蛋白質”。最近,承啟云平臺在中國自主研發的基因組測序標準數據集的評測上,突變鑒定準確性在全部幾十個標準數據集上均明顯高于國外主流算法。 算法足夠準確了,但另一個無法回避的事實是要實現基因測序的準確性,算法只是一方面,另一方面,從采樣、運輸、前處理到測序的實驗全過程必須萬無一失,承啟生物稱之為“全鏈條穩健”。 承啟生物實驗室一景 張弓教授對“全鏈條穩健”進行解讀:“為什么有些分析結果容易出問題?除部分算法不準確的因素,樣本本身在采集、保存和運輸過程中發生改變,也會導致誤差出現。而分散、小型化測序由于高度依賴專業人員,在現有的經濟條件下暫時無法大量推廣,也就無法避免樣品保存和長途運輸,無形中增加精準醫療普及的難度。”正因為國內基因測序受限于各種技術的不穩定性,市場仍未實現真正發展。 而承啟生物的“穩”,來源于對整個實驗過程細節的精益求精和自主研發。承啟生物通過自有的保存運輸技術方案,在不使用干冰、冰袋的情況下,DNA和RNA樣品可以經受住-55~45°C的溫差波動三天而保持完好。在樣本前處理和建庫階段,承啟研發的實驗方案與“標準實驗方案”不同,即便樣本發生降解,也能通過實驗方法和算法容錯等方法,實現近乎100%的準確性。原創技術帶來的穩健性擴寬了基因檢測的應用場景,讓基因檢測不再依賴大量專業人員,門檻大大降低。穩健的體系也減少了因中間步驟造成的重復測定,進一步壓縮了時間、降低成本。 “快、穩、準”制定標準,助力精準醫療大爆發 當未來全基因組測序成為常規檢驗,全國每天處理的樣本將達到海量。基于承啟生物自主技術的超精準和超高速,可解決海量樣本分析中的瓶頸與痛點,讓基因測以低成本實現精準醫學的落地,迎來廣泛應用場景,為行業發展提供有力支撐。 當前,承啟生物的自主化“快、穩、準”的技術體系,被認定為國家重點計劃《醫學生命主學觀質量控制關鍵技術與示范應用》核酸組學部分的基礎,也將成為今后國家相關質控標準的重要依據。標準的建立,將規范整個行業,助力精準醫學應用的行業爆發,也為承啟生物開啟更廣闊的發展前景。 ]]> 深圳2020年7月13日 /美通社/ -- 單機解碼全基因組,從需要幾天到1小時,再到5分鐘,中國生物醫學原創技術究竟有多強?2020年6月,深圳承啟生物科技有限公司(以下簡稱“承啟生物”)利用自主研發的云平臺Chi-Cloud及高精度算法FANSe3,實現單機5分鐘分析完成一個人全基因組數據集,再度刷新世界紀錄

承啟生物創始人、首席科學家張弓教授表示,“承啟生物的解決方案Chi-Cloud+FANSe3在攻破了無數個難題后,成功提升基因檢測分析速度。這一突破最值得關注的是全自主研發的FANSe算法,實現精準度之上的速度飛躍;此外,這項中國原創技術不依賴專用加速芯片,讓基因測序不再被國外供應商‘扼住咽喉’,大幅降低成本,為精準醫療、普惠醫療貢獻力量。”

全自主技術 基因測序不再被扼住咽喉

核心技術是國家與企業的安身立命之本,只有實現核心技術自主才能不被扼住命運的咽喉。承啟生物歷經6年自主研發的FANSe算法已進入第3代,張弓教授透露,這一算法不依賴專用加速硬件,從根本上避免芯片禁運風險,這項中國高端醫學技術將不再受制于人。

承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud
承啟生物開發人員正在一臺高端家用電腦上調試Chi-Cloud

當前全球基因組測序大部分使用的基礎算法為國外的BWA、Bowtie等系列算法,單機運行效率并不高。為提高單機運算速度,常見方案是采用GPU、FPGA等專用芯片進行加速。但受國內芯片技術局限,目前國內僅有自主CPU,而高性能通用計算GPU、FPGA等芯片依然被國外壟斷。承啟的FANSe3算法只使用CPU進行計算,不依賴專用加速芯片,可做到在國產硬件上高效運行。此外,單機5分鐘分析全基因組的高效能,意味著在對數據保密性要求的特殊領域(如軍事、公共安全、特定的醫療場景等),可直接采用單機分析方式(Chi-Cloud小云模式),無需連接互聯網。算法針對國產測序儀進行特別適配和優化,保障精準醫學的國家安全。

為應對國產CPU性能與國際頂尖水平的現實差距問題,FANSe3和承啟云平臺架構在設計之初便支持大規模分布式運算和自適應任務調度,擴展性強,可利用多個CPU共同運算一個任務。“單機的性能弱了怎么辦?可以把2臺、3臺、4臺甚至100臺機器捆起來一起用,彌補單個CPU性能的不足,達到同樣甚至更好的使用體驗。”張弓教授說。

“單機5分鐘”推動精準醫學“更快、更便宜”

由于核心技術完全自主,承啟生物團隊可以對算法不斷改進,使FANSe3代算法在運算速度上實現遠超國外算法的飛躍。“單機5分鐘”的意義不僅限于提升時間和效率,更在于助推精準醫學普及。

承啟生物實驗室一景
承啟生物實驗室一景

目前先進的測序儀已能在一天內完成測序實驗,但數據分析用單機通常需要幾十個小時才能完成,但對許多臨床急性病癥,時間就是生命。使用國外算法,各大云服務提供商在使用幾十上百臺服務器的情況下,僅能將分析時間壓縮至半小時到一小時,而使用FPGA等專用加速芯片,也只能實現1-2小時的分析時間,而這些都需要巨額的硬件投入和專業維護,能耗也居高不下。

本次承啟生物實現的單機5分鐘分析突破,可讓大型測序中心擺脫超算集群和專業人員維護需求;硬件購置費用大大降低,能耗也大為降低,綠色環保。

單機5分鐘的速度,網絡傳輸是整體分析中的瓶頸。一個人全基因組測序數據文件可高達240GB以上,以千兆網的速度都需要傳輸40多分鐘。為解決這一問題,承啟為Chi-Cloud開發了獨有的壓縮算法,達到了1:10以上甚至1:20的壓縮率,縮短原本漫長的傳輸時間,多節點間的任務調配也更得心應手;與FANSe3算法深度配合,無需解壓即可直接運算。

使用高速的網絡接入,將數據傳輸至承啟生物的服務器上,測序中心甚至不需購買和維護服務器,基因組測序的分析成本降至幾乎可以忽略不計的程度。

所有這些,都讓全基因組測序分析“更快”。以超高速的運算助力重癥患者“與死神賽跑”,盡力避免治療“遲了一步”的遺憾,為醫生、患者爭取更多時間。

FANSe3算法+全鏈條穩健 實現“更精準”

與速度同樣重要的是算法的準確性,張弓教授強調,“準確性是所有優勢的前提。FANSe3是全球罕見的準確率有數學證明的算法,錯誤率已可穩定在十億分之一以下。經大量實驗表明,FANSe系列算法在基因組突變分析、轉錄組表達分析等應用上,準確度幾乎為100%,秒殺國外基于BWA、Bowtie等算法方案,并在醫學科研和臨床應用中分析超過50萬例樣本。”

2014年,FANSe算法成為國際人類蛋白質組計劃核心支柱的首選分析算法,為全面解析人類蛋白質組做出了關鍵貢獻。2017年9月,在國際人類蛋白質組計劃世界大會上,以張弓教授等為代表的廣東科學家團隊利用FANSe系列算法,發現數千個以往被認為不可能存在的人類“新蛋白質”。最近,承啟云平臺在中國自主研發的基因組測序標準數據集的評測上,突變鑒定準確性在全部幾十個標準數據集上均明顯高于國外主流算法。

算法足夠準確了,但另一個無法回避的事實是要實現基因測序的準確性,算法只是一方面,另一方面,從采樣、運輸、前處理到測序的實驗全過程必須萬無一失,承啟生物稱之為“全鏈條穩健”。

承啟生物實驗室一景
承啟生物實驗室一景

張弓教授對“全鏈條穩健”進行解讀:“為什么有些分析結果容易出問題?除部分算法不準確的因素,樣本本身在采集、保存和運輸過程中發生改變,也會導致誤差出現。而分散、小型化測序由于高度依賴專業人員,在現有的經濟條件下暫時無法大量推廣,也就無法避免樣品保存和長途運輸,無形中增加精準醫療普及的難度。”正因為國內基因測序受限于各種技術的不穩定性,市場仍未實現真正發展。

而承啟生物的“穩”,來源于對整個實驗過程細節的精益求精和自主研發。承啟生物通過自有的保存運輸技術方案,在不使用干冰、冰袋的情況下,DNA和RNA樣品可以經受住-55~45°C的溫差波動三天而保持完好。在樣本前處理和建庫階段,承啟研發的實驗方案與“標準實驗方案”不同,即便樣本發生降解,也能通過實驗方法和算法容錯等方法,實現近乎100%的準確性。原創技術帶來的穩健性擴寬了基因檢測的應用場景,讓基因檢測不再依賴大量專業人員,門檻大大降低。穩健的體系也減少了因中間步驟造成的重復測定,進一步壓縮了時間、降低成本。

“快、穩、準”制定標準,助力精準醫療大爆發

當未來全基因組測序成為常規檢驗,全國每天處理的樣本將達到海量。基于承啟生物自主技術的超精準和超高速,可解決海量樣本分析中的瓶頸與痛點,讓基因測以低成本實現精準醫學的落地,迎來廣泛應用場景,為行業發展提供有力支撐。

當前,承啟生物的自主化“快、穩、準”的技術體系,被認定為國家重點計劃《醫學生命主學觀質量控制關鍵技術與示范應用》核酸組學部分的基礎,也將成為今后國家相關質控標準的重要依據。標準的建立,將規范整個行業,助力精準醫學應用的行業爆發,也為承啟生物開啟更廣闊的發展前景。

]]>
<center id="kgssg"></center>
<center id="kgssg"><wbr id="kgssg"></wbr></center>
<noscript id="kgssg"><option id="kgssg"></option></noscript><optgroup id="kgssg"><wbr id="kgssg"></wbr></optgroup><optgroup id="kgssg"></optgroup>
<optgroup id="kgssg"><div id="kgssg"></div></optgroup>
<center id="kgssg"><div id="kgssg"></div></center>
<center id="kgssg"></center>
久久久亚洲欧洲日产国码二区