top of page

생성형 AI가 이끄는 생명과학의 혁신: 1부 Research and early discovery: A new generation of treatments

  • 작성자 사진: Kyoung-Hwan Choi
    Kyoung-Hwan Choi
  • 2일 전
  • 4분 분량

다가오는 생성형 AI 기반 생명과학 혁신은 인간의 건강과 복지에 측정 불가능한 영향을 미친다. 가속화된 신약 개발 과정은 더 많은 질병을 더 빨리 치료할 수 있게 한다. 그로 인해 확보된 자원을 현재 소외된 영역에 투입할 수 있다. 방대한 환자 데이터를 분석해 인사이트와 패턴을 도출하는 능력은 맞춤형 치료를 촉진하고, 환자 치료 결과를 향상 시킨다. 생성형 AI 도구는 치료제 생산과 전달 과정에서 발생하는 편차를 줄여 환자 진료의 일관성도 강화한다. 마지막으로 문서 작성이나 기록 관리와 같은 반복적이고 시간이 많이 드는 업무를 자동화함으로써 연구자의 생산성을 높여 의사와 환자를 더 효과적으로 지원할 수 있게 된다.


생성형 AI는 방대한 양의 구조화·비구조화 데이터를 종합해 맞춤형 시각·텍스트·분자 단위의 콘텐츠를 만들어냄으로써 비즈니스 가치 사슬 전반에 걸쳐 가치를 창출한다. 모든 산업에 영향을 미치겠지만 특히 제약 산업에서 강력한 파급효과를 낼 것이다.



Source: McKinsey & Company
Source: McKinsey & Company


생성형 AI가 이끄는 생명과학의 혁신: Research and early discovery


질병에 대한 이해는 빠르게 진전된다. 그러나 신약을 발굴하고 개발하는 과정은 정반대의 길을 걸어왔다. 신약을 시장에 내놓는 평균 비용은 줄어들지 않고 오히려 증가하고 있는 것이다. 생성형 AI는 이러한 과정을 가속화하는 데 도움을 준다. 구체적으로는 표적을 신속히 규명하고 화합물 테스트를 위한 검증용 분석(assay)을 개발하며, 가장 유망한 후보 물질을 선별하고 전임상 단계에서 효과를 확인하는 과정을 지원한다.


제약사는 이미 이러한 목적으로 기초 모델(foundational model)을 활용한다. 자연어 모델인 BioGPT, Med-PaLM뿐 아니라 연구자들이 사용하는 모델은 현미경 및 병리 데이터를 분석하는 이미지 모델, 소분자(small molecule) 데이터의 기능적 판독을 예측하는 화학 모델, 단백질 접힘 및 예측을 위한 대분자(large molecule) 모델, 유망한 적응증에 개발 노력을 집중하도록 돕는 환자 여정 모델 그리고 여러 모달리티를 결합해 in silico 실험을 가능하게 하는 멀티모달 모델 등이 있다.


이러한 기초 역량을 컴퓨터 비전, 가상 스크리닝, 지식 그래프와 같은 보다 폭넓고 성숙한 AI 기술과 결합하면 생성형 AI의 연구 단계 파급력을 크게 높일 수 있다. 나아가 신약 발굴 소요 기간을 절반으로 줄일 가능성도 있다. 단기간 내 의미 있는 효과를 낼 수 있는 다섯 가지 핵심 활용 사례를 확인해 보도록 하자.



활용 사례 1: 과학적 지식 추출


질병과 약물 표적을 더 잘 이해하기 위해 과학자들은 특허, 학술 논문, 임상 시험 데이터와 같은 문서에서 정보를 추출하고 요약하는 데 상당한 시간을 들인다. 그러나 방대한 데이터를 처리해야 하기 때문에 이 과정은 어렵고 불완전하거나 부정확한 정보를 제공하기도 한다.


GPT 기반 지식 추출은 텍스트, 이미지 등 비정형 데이터를 분석하는 AI 알고리즘을 활용해 이러한 부담을 덜어준다. 기존 자연어처리(NLP) 기반 솔루션과 달리 새로운 생성형 AI 도구는 의학적 맥락과 의도를 더 깊고 넓게 이해한다. 연구자는 개방형 Q&A를 수행하고 다양한 작업 간 전환을 쉽게 하며 프롬프트 엔지니어링을 통해 새로운 증거를 유연하게 통합한다. 특정 용도에 맞춘 추가 학습도 거의 필요하지 않다.


잠재적 효과: 약물 표적에 대한 초기 수동 평가를 30% 이상 개선



활용 사례 2: In silico 화합물 스크리닝


신약 개발은 특정 질환 치료에 성공할 가능성이 높은 화합물을 식별하고 우선순위를 정하는 과정에서 종종 지연된다. 생성형 AI는 최신 화학 기초 모델을 활용해 수 백만 개의 알려진 화합물을 구조와 기능 별로 매핑 하고, 실험 된 분자의 결과와 결합해 스크리닝을 가속화한다.


GPT-4가 문장에서 다음 단어를 예측하듯, 이러한 모델은 소분자(예: 원자)나 대분자(예: 아미노산)의 구조에서 ‘다음 부분’을 예측한다. 반복 학습을 통해 대·소분자 화학의 기본 원리를 습득하고, 이를 기반으로 맞춤형 기계 학습 모델을 훈련해 더 정밀한 예측을 수행한다. 이 과정은 미개척 화학 영역에서도 유효하며, 기업은 후속 스크리닝 대상으로 우선순위를 부여할 수 있다.


잠재적 효과:

  • 화합물 활성 모델의 성능 최대 2.5배 향상

  • 신규 후보 물질 발굴 속도 4배 이상 향상 (수 개월 → 수주 단축)



활용 사례 3: 대분자 및 약물 전달체(drug vector) 설계 최적화


앞선 사례에서 설명한 도구는 소분자의 치료 잠재력을 예측하는 데 도움을 준다. 그러나 더 복잡한 대분자(예: 항체, 단백질, mRNA)에 대해 같은 작업을 수행하는 것은 훨씬 더 어렵다. 이들 분자는 표적 치료제와 백신에 큰 가능성을 지니지만, 복잡성이 높아 개발 비용과 기간이 크게 늘어난다.


차세대 대규모 언어 모델(LLM)은 대분자의 하위 구조(예: 핵산, 아미노산)를 예측하고, 대분자 화학에 대한 통찰을 제공함으로써 이 문제를 해결한다. 이러한 통찰은 in silico 환경에서 새로운 약물 전달체를 설계하고 다양한 신약 탐색 분석에서 그 효능을 예측하는 데 활용된다.


잠재적 효과: 대분자 설계 속도를 3배 이상 가속화



활용 사례 4: 적응증(indication) 선택을 통한 자산 전략 수립


생성형 AI의 지식 추출 기능은 특정 분자로 어떤 질환(적응증)을 공략할지 결정하는 데도 도움을 준다. 이는 바이오 제약 기업이 직면하는 가장 중요한 결정 중 하나다. 연구자는 결정을 내리기 위해 리더의 견해, 문헌 검토, 오믹스 분석, 임상 시험 데이터, 경쟁사 활동 등 다양한 정보를 종합해야 한다. 그러나 방대한 정보량 때문에 실제 적응증 선택은 종종 일부 근거에만 의존하게 되고, 그 결과 최적의 결론을 내리지 못할 수 있다.


생성형 AI는 구조화·비구조화 데이터 세트를 폭넓게 분석하여 이 문제를 보완한다. 예를 들어, 의사 방문 기록, 보험 청구, 전자의무기록(EMR), 병원 데이터 등 실세계 데이터(RWD)는 적응증 선택에 충분히 활용되지 않는 경우가 많다. 그러나 생성형 AI는 의료 이벤트를 단어로, 환자의 병력을 문서로 처리하는 기초 모델을 통해 서로 다른 이벤트의 의미적 유사성을 파악하고, 환자·임상 관점에서 적응증 간 생물학적 근접성을 추정한다.


또한 분자 지식을 활용해 단백질, 인간 생물학적 경로 등 문헌이나 공공 데이터에서 이미 확인된 개체 간 새로운 연결성을 밝혀낼 수 있다. 이러한 접근은 새로운 적응증을 발견하고, 이를 in vitro나 동물 모델을 통해 빠르게 검증함으로써 성공 가능성이 높은 적응증을 찾고 불필요한 시도를 줄이는 데 기여한다.


잠재적 효과:

  • 임상 승인으로 이어질 가능성이 높은 적응증을 우선순위에 두기

  • 실패 가능성이 높은 적응증을 사전에 배제

  • 동물 모델에서 검증 가능한 완전히 새로운 적응증 발굴



활용 사례 5: 임상 시험 및 포트폴리오 최적화


분자가 특정 적응증과 연결되면, 임상 환경에서의 시험이 시작된다. 그러나 적합한 환자를 선정하는 일은 쉽지 않다. 치료에 반응하지 않을 참가자가 포함되면서 개발 속도가 느려지기도 한다. 이 문제를 다루어 온 대표적 분야는 정밀 종양학(precision oncology)이다. 연구자들은 이미 바이오 마커를 활용해 환자를 진행 가능성이나 치료 반응 예측에 따라 층화(stratification)한다. 생성형 AI는 다른 분야에도 이를 적용해 임상시험 집단을 더 다양하고 대표성 있게 구성할 수 있도록 지원한다.


또한 유전·표현형 데이터와 함께 환자의 의무기록 등 실세계 데이터를 분석하는 모델을 통해 환자 하위 집단이 같은 치료에 대해 다른 반응을 보이는 이유를 더 잘 이해할 수 있다. 나아가 X선, CT, MRI 등 의료 영상 데이터로 학습한 생성형 AI 모델을 사용하면, 질병의 활동성과 중증도를 나타내는 새로운 바이오 마커를 발견해 완전히 새로운 치료법을 도출할 수도 있다. 모든 결과는 더 짧고 효율적이며 성공 가능성이 높은 임상 시험으로 이어진다.


잠재적 효과:

  • 임상 시험 성공 가능성(PoS) 약 10% 증가

  • 비용 및 기간 약 20% 감소

  • 승인까지 걸리는 기간 1~2년 단축

  • 자산·포트폴리오의 순현재가치(NPV)에 두 자릿수(%) 상승 효과




Comments


© 2021 Copyright by Healthcare Innovator. All Rights Reserved

bottom of page