https://macro.com/app/pdf/56a50ffc-120d-4a9a-87e5-a18753430f22
https://github.com/google-deepmind/alphagenome
https://reurl.cc/1KrVeY
GoogleDeepMind推出AlphaGenome
能從1兆鹼基的DNA序列中預測數千種功能基因組特徵並以單一鹼基分辨率評估變異效應
它在基因表現、剪接、染色質可及性等任務上全面超越現有模型
模型經過預訓練和蒸餾兩階段訓練
首先用觀測資料產生折疊特異性模型和全折疊模型
前者採用4折交叉驗證法進行訓練以防止過擬合
後者在基因組全部可用區間上訓練並視作蒸餾的教師模型
蒸餾時用隨機增強的輸入序列法訓練單一學生模型
學習全折疊教師模型的輸出預測以實現穩健性和變異效應預測準確性
在NVIDIA H100 GPU上學生模型推理時間能達到一秒以內
AlphaGenome在臨床上可協助發現新的治療標靶
比如對T細胞急性淋巴性白血病 (T-ALL) 的研究中
AlphaGenome就透過引入MYB DNA結合基序成功解析TAL1基因附近的致癌變異
"我們首次擁有一個單一模型,它統一了整個基因組任務範圍內的遠端上下文、基本精度和
最先進的性能。 "