세상 돌아가는 흐름, 한눈에 정리

쏟아지는 뉴스 속에서 당신이 놓치지 말아야 할 핵심을 하루 한 번, 신뢰 있는 정보로 정리합니다.

과학

구글, AI 기반 신약 개발 오픈소스 모델 'TxGemma' 공개… 의료 혁신 이끌까?

더쿼리 2025. 6. 21. 03:43
반응형

구글 딥마인드가 2025년 3월 25일 신약 개발 전 과정을 지원하는 오픈소스 AI 모델 'TxGemma'를 공개했습니다. 기존 신약 개발의 90% 실패율과 수십억 달러의 비용 문제를 AI로 해결하려는 야심찬 시도로, 의료 혁신의 새로운 전환점이 될 수 있을지 주목받고 있습니다.


TxGemma는 무엇이고 왜 중요한가?

신약 개발의 현실적 한계

신약 후보 중 90%가 제1상 임상 시험을 통과하지 못하고 실패하며, 신약 하나를 개발하는 데 수십억 달러 비용과 10년 이상의 시간이 소요됩니다. 이는 제약 업계가 직면한 가장 큰 도전 과제로, 혁신적인 해결책이 절실한 상황입니다.

Gemma 2 기반의 특화 모델

TxGemma는 구글 딥마인드의 경량화된 오픈소스 모델 Gemma 2를 기반으로 개발되었습니다. 700만 개의 치료 관련 학습 사례로 훈련되어 화합물과 단백질 구조를 분석하고, 유망한 타깃 식별부터 임상 시험 결과 예측까지 신약 개발 전 과정을 지원할 수 있습니다.

TxGemma의 핵심 특징

  • 모델 크기: 2B, 9B, 27B 파라미터 3가지 버전
  • 모델 유형: Predict(예측 전용)와 Chat(대화형) 버전 제공
  • 접근성: Vertex AI Model Garden과 Hugging Face를 통해 무료 제공
  • 확장성: 사용자 맞춤 파인튜닝 지원

기존 AI 신약 개발과 어떻게 다른가?

Tx-LLM의 진화된 후속작

TxGemma는 2024년 10월에 소개된 Tx-LLM의 후속 모델로, 치료 응용 분야에서의 사용 및 파인튜닝에 대한 지대한 관심을 확인한 후 개발된 실용적 규모의 개방형 모델입니다.

벤치마크 성능 결과

가장 큰 TxGemma 모델(27B 예측 버전)의 성능은 상당히 인상적입니다:

비교 대상 전체 작업 수 우위/동등 성능 우위 성능

Tx-LLM 66개 64개 45개
전문화 모델 66개 50개 26개

 

66개 작업 중 64개 작업에서 이전 모델보다 뛰어나거나 비슷한 성능을 보이며, 50개 작업에서 전문화된 모델과 동일한 수준의 성능을 나타냈습니다.


실제로 어떤 작업들을 수행할 수 있을까?

분류(Classification) 작업

  • 혈액-뇌 장벽 투과성: 약물이 뇌혈관 장벽을 통과할 수 있는지 예측
  • 독성 여부: 분자의 독성 정도 판별
  • 생체활성: 특정 타깃에 대한 약물의 활성 예측

회귀(Regression) 작업

  • 결합 친화도: 약물과 타깃 단백질 간의 결합 강도 추정
  • 지용성: 약물의 지방 용해도 계산
  • 생체이용률: 약물이 체내에서 얼마나 잘 흡수되는지 예측

생성(Generation) 작업

  • 반응물 생성: 화학 반응에서 필요한 시약 추론
  • 분자 최적화: 기존 분자 구조 개선

Agentic-Tx는 무엇이고 어떤 가능성을 제공하는가?

통합 연구 플랫폼의 등장

Gemini 2.0 Pro를 기반으로 한 치료법 중심의 에이전트 시스템 'Agentic-Tx'가 18가지 전문 도구를 통합하여 복잡한 다단계 연구 질문에 답할 수 있습니다.

 

Agentic-Tx 구성 요소

  • 데이터베이스 접근: PubMed, Wikipedia, 유전자/단백질 데이터베이스
  • 분석 도구: 분자 구조 분석, 화학적 성질 예측
  • 추론 시스템: 다단계 논리적 사고 과정

벤치마크 성과

Agentic-Tx는 ChemBench와 Humanity's Last Exam을 포함한 벤치마크에서 추론 집약적인 화학 및 생물학 작업에 대해 최첨단 결과를 달성했습니다.


실무에서는 어떻게 활용할 수 있을까?

연구자를 위한 접근 방법

1단계: 기본 활용

  • Vertex AI Model Garden 또는 Hugging Face에서 모델 접근
  • 제공된 Colab 노트북으로 기본 기능 테스트

2단계: 맞춤형 개발

  • TrialBench 데이터셋을 활용한 파인튜닝 예제 활용
  • 자체 연구 데이터로 모델 특화

3단계: 고급 활용

  • Agentic-Tx 시스템과 연동하여 복합 연구 워크플로 구축

대화형 AI의 활용 사례

연구자는 TxGemma-Chat에 특정 분자가 독성이 있다고 예측하는 이유를 묻고 분자의 구조를 기반으로 하는 설명을 얻을 수 있습니다. 이는 기존 블랙박스 AI의 한계를 극복하는 중요한 진전입니다.


한계와 주의사항은 무엇인가?

현실적 제약 요소

데이터 편향성

  • Therapeutic Data Commons(TDC) 기반 학습으로 데이터 편향 가능성
  • 실제 임상 환경과의 차이 존재

규제 및 라이선스 이슈

  • 모델의 라이선스 조건이 아직 명확하지 않은 상황
  • 상업적 활용 시 추가적인 승인 절차 필요

검증의 필요성

  • AI 예측 결과의 실험적 검증 필수
  • 임상 적용 전 엄격한 검토 과정 요구

업계의 엇갈린 평가

영국의 엑스사이엔시아(Exscientia)와 베네볼런트AI(BenevolentAI) 같은 기업들은 최근 몇 년간 AI를 활용한 신약 개발 과정에서 여러 차례 임상시험 실패를 경험했습니다. 이는 AI 신약 개발 기술이 아직 성숙 단계에 이르지 못했음을 시사합니다.


글로벌 AI 신약 개발 시장에 미치는 영향은?

시장 규모와 성장 전망

AI 신약 개발 분야에는 수백 개의 스타트업이 활동하고 있으며, 글로벌 시장 규모는 2023년 35억 달러에서 2030년 79억 달러로 연평균 12.2% 성장이 예상됩니다.

대형 제약사들의 전략 변화

기존 파트너십 사례

  • 아이소모픽 랩스와 일라이 릴리: 30억 달러 규모 협력
  • 아이소모픽 랩스와 노바티스: 30억 달러 규모 협력 + 추가 확장

한국 기업들에게 미치는 영향 TxGemma의 오픈소스 공개로 국내 제약사들도 상대적으로 저비용으로 AI 신약 개발 기술에 접근할 수 있게 되었습니다. 이는 글로벌 경쟁에서 한국 바이오 기업들의 기술 격차를 줄이는 기회가 될 수 있습니다.


🔍 핵심 요약

주요 특징과 성과

항목 내용

발표 기관 구글 딥마인드
발표 일시 2025년 3월 25일
모델 기반 Gemma 2 (2B, 9B, 27B 파라미터)
학습 데이터 700만 개 치료 관련 사례
성능 66개 작업 중 64개에서 기존 모델 대비 우위
접근성 Vertex AI, Hugging Face 무료 제공
확장 기능 Agentic-Tx 시스템과 연동 가능

자주 묻는 질문

Q: TxGemma는 완전 무료인가요? A: 연구 목적으로는 무료이지만, 상업적 이용 시 라이선스 조건 확인이 필요합니다.

Q: 기존 AI 신약 개발 모델과의 차이점은? A: 오픈소스 제공, 대화형 설명 기능, 그리고 66개 벤치마크 작업에서 검증된 높은 성능이 주요 차별점입니다.

Q: 실제 신약 개발에 바로 적용할 수 있나요? A: AI 예측 결과는 실험적 검증이 필수이며, 임상 적용 전 엄격한 검토 과정을 거쳐야 합니다.

Q: 한국 기업들이 활용할 수 있는 방법은? A: Hugging Face나 Vertex AI를 통해 모델에 접근하고, 자체 데이터로 파인튜닝하여 특화된 신약 개발 파이프라인을 구축할 수 있습니다.


AI가 신약 개발의 패러다임을 바꿀 수 있을지, 아니면 또 다른 기술적 한계에 부딪힐지는 향후 임상 성과가 결정할 것입니다. 더 많은 AI와 의료 혁신 소식이 궁금하시다면 구독과 댓글로 함께해 주세요.

반응형