1차 원고 작성: 2024-09-22
오늘은 "Prediction model for drug response of acute myeloid leukemia patients"라는 논문을 소개하고자 합니다. 이 연구는 급성 골수성 백혈병(AML) 환자의 약물 반응을 예측하기 위한 새로운 앙상블 기반 AI 모델인 MDREAM을 개발하고 검증했습니다.
출처: npj Precision Oncology (2023). https://doi.org/10.1038/s41698-023-00373-0
이 연구는 급성 골수성 백혈병(AML) 환자의 약물 반응을 예측하기 위한 MDREAM이라는 새로운 모델을 개발하고 검증한 것입니다. 주요 방법론적 특징은 다음과 같습니다:
- 데이터 통합:
- 유전자 변이 데이터
- 유전자 발현 데이터
- 대규모 약물 테스트 결과
- 모델 구조:
- 앙상블 기반 예측 모델
- 122개의 개별 모델로 구성 (각 모델은 하나의 약물에 대응)
- 학습 및 검증:
- 훈련 데이터: BeatAML 코호트 (n=278)
- 내부 검증: BeatAML 코호트 (n=183)
- 외부 검증 1: 스웨덴 AML 코호트 (n=45)
- 외부 검증 2: 재발/불응성 급성 백혈병 코호트 (n=12)
- 예측 신뢰도:
- 신뢰도 점수 메트릭 사용
- 신뢰도 점수 > 0.75인 예측 중 77%가 실제 좋은 반응을 보임
- 성능 평가:
- Spearman 상관계수 사용
- BeatAML 검증 세트: 0.68 (95% CI: [0.64, 0.68])
- 스웨덴 코호트: -0.49 (95% CI: [-0.53, -0.44])
- 재발/불응성 코호트: 0.59 (95% CI: [0.51, 0.67])
- 구현 및 공개:
- 웹 기반 구현
- 공개적으로 접근 가능 (https://www.meb.ki.se/shiny/truvu/MDREAM/)
이 연구의 주요 강점은 다양한 오믹스 데이터를 통합하고, 앙상블 모델을 사용하여 예측의 안정성을 높였다는 점입니다. 또한 내부 및 외부 검증을 통해 모델의 일반화 가능성을 평가했습니다. 신뢰도 점수를 도입하여 예측의 불확실성을 전달하는 것도 주목할 만한 특징입니다.
이 논문의 서론은 급성 골수성 백혈병(AML)의 치료에 있어 약물 반응 예측의 중요성과 현재의 한계점을 잘 설명하고 있습니다. 주요 내용을 요약하면 다음과 같습니다:
- AML의 특성:
- 높은 유전적 이질성
- 다양한 치료 반응
- 현재 AML 치료의 접근 방식:
- 유전적 바이오마커 기반 표적 치료
- WHO의 분자 아형 분류
- 특정 유전자 융합 또는 변이에 대한 표적 치료제 (예: ATRA, Midostaurin)
- 현재 접근 방식의 한계:
- 복잡한 유전적 패턴으로 인한 예측의 어려움
- 표적 치료제의 제한적 효과 (예: FLT3 변이와 Midostaurin)
- 주관적인 치료 선택
- 기존 연구의 한계:
- 소규모 샘플로 인한 AML의 이질성 포착 부족
- 제한된 검증
- MDREAM의 개발 목적:
- 통합 오믹스 데이터 사용
- 대규모 코호트를 통한 학습 및 검증
- 122개 약물에 대한 앙상블 모델
- 예측 불확실성을 측정하는 신뢰도 점수 도입
이 연구는 기존 접근 방식의 한계를 극복하고, 보다 정확하고 신뢰할 수 있는 AML 약물 반응 예측 모델을 개발하고자 하는 노력을 보여줍니다.
AML 특이적 약물 반응 예측 모델
MDREAM의 개요
- MDREAM은 유전자 발현과 돌연변이 프로파일 등의 오믹스 데이터를 입력으로 받고, BeatAML 코호트의 약물 민감도 데이터를 활용하여 약물 반응 예측 모델을 구축합니다.
- 모델은 내부 데이터와 외부 데이터셋을 사용하여 검증되며, 외부 검증을 위해 Clinseq 코호트와 LeeAML 코호트를 활용합니다.
- 총 461명의 AML 환자와 122개의 소분자 억제제에 대한 ex-vivo 약물 민감도 데이터가 분석에 포함되었습니다.
- 코호트에서 사용 가능한 두 가지 약물 민감도 지표인 IC50과 **AUC(Area Under the Curve)**를 기반으로 별도의 예측 모델을 구축하였습니다. 낮은 IC50/AUC 값은 더 나은 약물 반응을 의미합니다.
모델 구축 및 앙상블 접근법
- 앙상블 기반 예측 모델은 스태킹(stacking) 접근법을 사용하며, 두 개의 계층으로 구성됩니다:
- 첫 번째 계층: 122개의 기본 모델(D1, D2, ..., Dn)로 구성되며, 각 모델은 단일 약물의 데이터를 사용하여 구축됩니다.
- 두 번째 계층: 122개의 앙상블 모델(E1, E2, ..., En)로 구성되며, 첫 번째 계층의 예측 출력을 기반으로 구축됩니다.
- 앙상블 학습의 장점은 약물 간의 민감도 상관관계를 활용하여 예측의 견고성을 향상시킬 수 있다는 점입니다.
- 이러한 접근법은 약물이 모든 환자에게 스크리닝되지 않는 경우에도 모델의 성능을 개선하는 데 도움이 됩니다.
- 또한, 유사한 유전자 표적을 공유하는 약물들의 반응이 높게 상관되어 있는 점을 효과적으로 활용합니다.
MDREAM 모델의 장점
- 스태킹 접근법을 사용한 앙상블 모델은 기본 모델보다 예측의 견고성과 정확성이 향상됩니다.
- 약물 간 민감도 상관관계를 효과적으로 활용하여 예측 성능을 높입니다.
- 일부 약물이 모든 환자에게 테스트되지 않는 경우에도 모델의 성능 저하를 최소화할 수 있습니다.
예시를 통한 이해
- 기본 모델 단계:
- 환자의 오믹스 데이터를 기반으로 각 약물에 대한 반응을 예측하는 122개의 모델을 만듭니다.
- 예를 들어, 모델 A는 약물 A의 반응을 예측하고, 모델 B는 약물 B의 반응을 예측합니다.
- 메타 모델 단계:
- 기본 모델들이 예측한 결과를 모읍니다. 즉, 환자에 대한 약물 A, B, C...에 대한 예측값이 모입니다.
- 이 예측값들을 입력으로 받아 최종적으로 각 약물에 대한 반응을 다시 예측하는 메타 모델을 학습합니다.
AML 아형과 약물 반응의 관계
AML의 이질성과 분자 아형
- **급성 골수성 백혈병(AML)**은 매우 이질적인 임상 표현형과 분자적 특성을 보이며, 이는 임상 관리에 큰 어려움을 줍니다.
- 최근 Papaemmanuil 등은 11개의 독립적인 AML 분자 아형을 제안하여 질병의 분자적 작동 기전을 제시하였습니다.
- 많은 분자 아형이 기존의 임상 아형과 일치하며, 예를 들어 PML-RARA, RUNX1-RUNX1T1, CBFB-MYH11 융합과 관련된 아형 등이 있습니다.
- 이러한 분자 아형과 약물 간의 관계를 규명하면, 반응성 환자에서 약물의 분자적 메커니즘을 이해하는 데 도움이 될 수 있습니다.
분자 아형과 약물의 연관성 조사
- 분자 아형과 약물 간의 연관성을 조사하기 위해 약물 표적 유전자와 아형 특이적 유전자 간의 기능적 상호작용을 평가하였습니다.
- 아형 특이적 유전자는 **Mou 등**의 연구에서 수집하였습니다.
- 각 약물의 표적 유전자는 **DrugBank 데이터베이스**에서 수집하였습니다.
- 각 (아형, 약물) 쌍에 대해 **네트워크 풍부도 분석(NEA)**을 적용하여 두 유전자 집합 간의 **풍부도 점수(z-점수)**를 계산하였습니다.
- **높은 z-점수(>1.96)**는 약물의 표적 유전자와 아형 특이적 유전자 간의 강한 기능적 상호작용을 나타냅니다.
약물 반응과 풍부도 점수의 관계
- 하나의 약물에 대해, 풍부도 점수는 아형에 따라 다르며, 이는 약물의 민감도와 상관관계를 가질 수 있습니다.
- z-점수가 1.96보다 큰 아형들(수직 점선 오른쪽)은 통계적으로 유의하며(p 값 < 0.05), 여기에는 PML-RARA, splice, CBFB-MYH11, p53C 아형이 포함됩니다.
- 이 결과는 도비티닙이 PML-RARA, splice, CBFB-MYH11 아형의 환자들에게 좋은 반응을 보이며, 이는 약물의 표적 유전자와 아형 특이적 유전자 간의 기능적 상호작용으로 설명될 수 있음을 시사합니다.
- 반면, 도비티닙이 RUNX1-RUNX1T1, MLL, NPM1 아형에서도 좋은 반응을 보이지만, 표적 유전자와 아형 특이적 유전자 간의 상호작용만으로는 그 이유를 설명할 수 없습니다.
MDREAM에의 통합
- 이러한 아형-약물 상호작용 분석은 MDREAM 모델에 통합되었습니다.
- 새로운 환자의 아형을 예측하는 분류기도 제공되며, 이는 "AML의 약물 반응에 대한 예측 모델 및 게놈 특징" 섹션에서 자세히 다룹니다.
미래 방향
- 본 연구의 계산 모델은 서포트 벡터 머신(SVM) 알고리즘과 스태킹(stacking) 기법에 기반합니다.
- 향후에는 딥 러닝 알고리즘을 적용하고자 합니다.
- 최근 딥 러닝은 약물 개발과 약물 반응 예측에서 많은 잠재적 이점을 보여주고 있습니다.
- 딥 러닝의 두드러진 장점은 의미 있는 특징을 자동으로 추출하거나 사전 지식을 통합하여 전체 성능을 향상시킬 수 있다는 것입니다.
- 예를 들어, **전이 학습(transfer learning)**은 사전 학습된 모델의 지식을 활용하여 새로운 데이터셋에서 예측 모델의 성능을 향상시킵니다.
- Mourragui 등은 세포주와 환자 유래 이식편의 약물 반응 예측자를 인간 종양으로 전이하는 접근법을 제안하였습니다.
- 또 다른 잠재적 방향은 MDREAM을 약물 시너지 효과로 확장하는 것입니다.
- 최근 일부 연구는 고혈압에서 단일 요법보다 약물 조합의 효과를 보여주었습니다.
- AML에서 Jafari 등은 최근 이분 그래프 네트워크 모델을 개발하여 복합 요법을 설계하였습니다.