마이크로소프트 리서치와 Centre for Population Genomics, Australian Genomics, Broad Institute가 공동 개발한 오픈소스 게놈 재분석 도구 Talos가 미진단 희귀질환 환자 4735명을 대상으로 241건의 신규 진단을 이끌어냈다. 이는 5.1%의 추가 진단율에 해당하며, 확인된 변이 전부는 이후 인증 실험실에서 병원성 또는 가능성 있는 병원성으로 최종 판정됐다. Talos는 최신 공개 데이터베이스를 바탕으로 환자의 기존 변이 데이터를 자동 재해석하는 방식으로, 과학 지식이 갱신될 때마다 새로운 진단 가능성을 발굴한다.
게놈 검사를 처음 받은 환자의 절반 이상이 여전히 진단을 받지 못하고 있다. 유전체 지식은 매년 수백 개의 새로운 유전자-질환 연관성과 수천 건의 변이 분류가 추가될 만큼 빠르게 확장되고 있어, 초기 분석 시점에는 발견하지 못했던 원인을 재분석으로 찾아낼 수 있다. 메타분석에 따르면 약 2년간의 재분석은 9500명 규모 미진단 환자 코호트에서 진단율을 약 10% 끌어올렸다. 그러나 기존 재분석은 대부분 수작업에 의존해 실제로 재검토되는 사례는 극히 드물었다.

Talos는 낮은 위양성률을 핵심 설계 원칙으로 삼았다. 유전자-질환 관계를 제공하는 PanelApp Australia와 변이 수준 병원성 정보를 제공하는 ClinVar를 실시간으로 반영하며, 가족 구조와 환자 표현형을 추가 필터로 활용한다. 1089명의 환자로 구성된 두 독립 코호트 검증에서 진단 범위 내 사례의 90%를 탐지하면서도 가족당 중앙값 1.3개의 변이 후보만 전문가 검토용으로 제시했다. 29개월간의 월간 반복 주기 운영에서는 200명당 평균 1건의 신규 변이만 검토하면 됐고, 새 과학적 근거가 공개 데이터베이스에 등록된 뒤 평균 32일 만에 환자 진단이 이뤄졌다. 게놈 1000건 주석 처리 비용은 약 11달러, 월간 재분석 실행은 코호트당 수 센트 수준이었다.
241건의 신규 진단 원인을 분류하면 새로운 유전자-질환 연관성 발견이 32%, 변이 수준 증거 갱신이 22%, 개선된 필터링과 분석 방법이 45%를 차지했다. 특히 신규 유전자-질환 진단의 59%는 재분석 시점에 OMIM 데이터베이스에 아직 등재되지 않은 관계였다. 엑솜 대비 게놈 데이터는 비코딩 영역 변이까지 포착해 진단율이 4.8%에서 6.1%로 높았다. Talos는 Azure 등 클라우드 환경에 손쉽게 배포할 수 있는 오픈소스 소프트웨어로, 향후 더 발전된 AI 변이 예측 모델과의 연동도 계획 중이라고 연구팀은 밝혔다.














