- +1
AI驅(qū)動研發(fā),如何破解高質(zhì)量數(shù)據(jù)缺乏困境?
傳統(tǒng)藥物研發(fā)模式存在效率低、周期長、失敗率高等多重挑戰(zhàn),當前AI正在深度重塑生物醫(yī)藥的研發(fā)范式,但缺乏結構化、高質(zhì)量、可復用的科研數(shù)據(jù)資源,嚴重制約了AI算法在新藥研發(fā)中的價值。

“模式生物、表型數(shù)據(jù)與AI驅(qū)動的生物醫(yī)藥源頭創(chuàng)新合作”研討會 主辦方 供圖
在6月15日舉行的“模式生物、表型數(shù)據(jù)與AI驅(qū)動的生物醫(yī)藥源頭創(chuàng)新合作”研討會上,廣州國家實驗室的特聘研究員、博士生導師李亦學直言,當前,我國生物醫(yī)學在數(shù)據(jù)科學領域面臨著“數(shù)據(jù)密集型科研起步晚、優(yōu)質(zhì)可用數(shù)據(jù)資源缺乏、算法創(chuàng)新和工具整合門檻高”等諸多難題,不符合AI驅(qū)動下快速建模、精準預測和靶點識別的科研需求。
在AI與生命科學融合過程中,人類表型組數(shù)據(jù)和模式生物表型數(shù)據(jù)(包括小鼠、斑馬魚等模型的形態(tài)學、行為學、生理指標和器官功能變化)不僅是連接“基因—表型—疾病”的關鍵節(jié)點,也為AI算法提供了實現(xiàn)機制建模與靶點預測的真實生物基礎。
盡管上海在人類表型組研究和基因修飾模式生物品系資源方面具有國際領先的優(yōu)勢,但是來自人類的正向遺傳學數(shù)據(jù)與來自模式生物的反向遺傳學研究長期脫節(jié),使這些科研資源無法轉(zhuǎn)化,未得到有效地發(fā)揮。
南模生物(688265)董事長費儉表示,“AI飛速發(fā)展的今天,如何把AI和上海本土的優(yōu)勢有效地結合起來,形成 ‘基因 - 表型 - 疾病 - 新藥’ 的研發(fā)新范式,是上海生物醫(yī)藥的破局路徑?!?/p>
南模生物副總經(jīng)理孫瑞林表示,南模生物圍繞基因修飾目前已建立了七大基礎平臺,目前擁有14萬種小鼠種類、70萬只大小鼠,基因修飾動物體系資源已經(jīng)與美國齊平,但他指出,目前模型核心種子資源仍然依賴于國外,此外,由于缺乏表型數(shù)據(jù)庫,模型銷售價格難以提高,當前又受中美競爭影響,可能會面臨數(shù)據(jù)獲取受限的問題。
為補齊基礎資源短板,研討會上,復旦大學特聘教授、實驗動物科學部主任丁玉強稱,復旦大學日前正在建設實驗小鼠資源庫,整合了全部動物設施,現(xiàn)配備5萬多個籠位動物設施,同時也計劃建立網(wǎng)上檢索數(shù)據(jù)庫,方便大家使用。
在表型數(shù)據(jù)方面,復旦大學石樂明團隊構建的全球人類表型組數(shù)據(jù)協(xié)同平臺(PhenoBank )已經(jīng)具備服務70個以上機構的能力。
李亦學指出,未來在AI的加持下,類似建立表型數(shù)據(jù)平臺、模式生物平臺這類基礎設施將發(fā)揮越來越重要的核心作用。這類平臺能夠高質(zhì)量地產(chǎn)出用于模型訓練的數(shù)據(jù),并且隨著需求的增加,平臺產(chǎn)生數(shù)據(jù)的能力會越來越被重視。
李亦學表示,為解決數(shù)據(jù)孤島的問題,廣州國家實驗室團隊開發(fā)了生物學分析智能體Bio-OS,能有效解決科研人員數(shù)據(jù)分析面臨的諸多難題。比如,開發(fā)門檻高、執(zhí)行復雜、復用性低等問題。
上海實驗動物研究中心主任范春在研討會上倡議建立 "上?;蚬こ绦∈髮嶒灅藴?,統(tǒng)一模型遺傳背景與表型數(shù)據(jù)采集規(guī)范。
費儉表示,南模生物將和上海國際人類表型組研究院石樂明合作共同探討表型數(shù)據(jù)標準化分析和標準品建設,確保提供高質(zhì)量的表型數(shù)據(jù)。
此次研討會匯聚了來自基因編輯、表型組學與AI計算等交叉領域的多位權威專家與產(chǎn)業(yè)界代表,出席研討會的還有復旦大學生命科學學院教授、人類表型組研究平臺 PhenoBank 負責人石樂明;復旦大學生命科學學院教授、教育部重點實驗室負責人盧大儒;復旦大學基礎醫(yī)學院教授、博士生導師黃芳,南模生物副總經(jīng)理、研究員孫瑞林等。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司