조직병리학(Histopathology)은 종양의 형태(morphology)와 표현형(phenotype)등 진단을 위한 부가적인 정보를 연구하는 학문입니다. 대부분 조직병리학에서는 H&E(Hematoxylin & Eosin)으로 조직을 염색합니다. 이때, 표현형의 정보를 부가적으로 더 얻기위해서, 유전학정보를 추가하기도합니다. 유전학 관련 정보에서는 환자의 생존율, 항암제 반응등을 추가로 더 연계합니다. 2021년기준으로 FDA에 243종의 항암제가 승인되어서, 관련 연구는 더 활발해지고 있습니다. 최근에는 AI을 이용한 연구로 DP을 접목시키고자하는데 관련 연구들이 어떤 것들이 있는지 개괄적으로 살펴보겠습니다.
딥러닝을 이용한 조직병리학
- 조직병리학에서는 고형암을 병리학(pathology)이나 세포학(Cytology)을 이용하여 검사합니다. 이 때 슬라이드이미지(Whole slide image)을 얻게되는데요. 이 슬라이드 이미지 내에, label에 해당하는 조직이 포함되어있는지를 Slide level label로 사용합니다. 예를들어, 슬라이드이미지 내에 종양이 있는지가 이에 해당합니다. 그렇기에 전체 슬라이드 중에 하나의 종양이라도 있으면 positive로 분류하는 weakly supervised learning형태로 주로 연구가되고있습니다.
시대적으로 주요했던 연구는 아래와 같습니다.
Fundamental task
- 2015 (Erosun and Rubin) : Brain tumor에서의 histologycal grading.
- 2017 (Cruz-Roa et al): Breast Ca tumor dectection. 타일링(Tesselating)도 진행. Accurate and reproducible invasive breast cancer detection in whole-slide images: A Deep Learning approach for quantifying tumor extent. Sci Rep(https://doi.org/10.1038/srep46450.)
- 2019 (Campanella G et al): weakly supervised learnig. Clinical-grade computational pathology using weakly supervised deep learning on whole slide images
- 2020 : 고형암의 subtyping 을 예측 (Gleason grade 예측 및 segmentation). Artificial intelligence for diagnosis and grading of prostate cancer in biopsies: a population-based, diagnostic study. Automated deep-learning system for Gleason grading of prostate cancer using biopsies: a diagnostic study.
- 2021: Breast ca 에서의 HER2 enriched, luminal A, luminal B, normal, basal 등의 분자진단에 사용되는 서브타입 예측.A deep learning image-based intrinsic molecular subtype classifier of breast tumors reveals tumor heterogeneity that may affect survival
Advanced task
1. Biomarker prediction (or genetic mutation)
- 2020: TCGA 17,000 WSI을 모두 학습한 딥러닝모델 연구. 높은 분류성능. 분자진단에 활용가능한 바이오마커(TP53, BRAF, TIL)도 예측이 가능. 2) MSI(Microsatellite instability)의 바이오 마커도 예측
A deep learning image-based intrinsic molecular subtype classifier of breast tumors reveals tumor heterogeneity that may affect survival
Pan-cancer computational histopathology reveals mutations, tumor composition and prognosis
2. Clinical outcome 예측
2.1 Response 예측
- biomarker은 환자의 outcome을 예측할 수 있는 간접적지표(proxy)임.
- 2020: CTx 반응을 예측 (Nasopharygeal Ca)[48]. Neuadjuvant CTx후에 CR(Complete response)예측[49]. 면역항암제 예측 반응 예측[50]
[48] Deep learning pathological microscopic features in endemic nasopharyngeal cancer: Prognostic value and protentional role for individual induction chemotherapy
[49] Deep learning-based predictive biomarker of pathological complete response to neoadjuvant chemotherapy from histological images in breast cancer
[50] Using Machine Learning Algorithms to Predict Immunotherapy Response in Patients with Advanced Melanoma. Clin Cancer Res
2.2. Prognosis 예측
- Survival 등의 예측입니다.
- 2019: Tissue proportion [52]와 모양형태가 환자 survival에 연관있을 수 있음을 예측[51]
[51] Comprehensive analysis of lung cancer pathology images to discover tumor shape and boundary features that predict survival outcome
[52] Predicting survival from colorectal cancer histology slides using deep learning: A retrospective multicenter study
3 Clinical genomics
- 암의 고유한 특징은 유전체 정보에 녹아있습니다. 그렇기에 인간유전체에 대한 해석을 연구하는 것이 암의 임상유전학에서 매우 중요합니다.
3.1 Subtyping
- 2022: Molecular subtyping (Non negative matrix factorization)을 이용한 unspervised ML로 클러스터링
3.2. Discover novel variants
- 2018: Cancer driver mutation 찾기.
3.2. Drug efficacy
- 2018: Cancer cell line에서 drug efficiacy 예측
4. Multimodality
- 임상적으로 환자의 치료과정을 이해할 때, 한 데이터만 분석하는게 아니라 다른 데이터도 분석합니다. 마찬가지로 최근 연구는 여러 데이터를 혼합(multi-modality)하여 분석하는 것을 연구합니다.
- 2018: Surival prediction. WSI와 IDH mutation, 1p/19q 데이터를 혼합하여 gliomas 환자의 survival을 예측 [99]
[99] Predicting cancer outcomes from histology and genomics using convolutional networks. PNAS
- 2019: WSI와 RNA expression data을 혼합하여 survival prediction을 예측 [100]
- 2021: Gliomas의 Grading 예측 [103]
- 2022: WSI, genomic data, radiology image 합친 연구
[100] Deep learning with multimodal representation for pancancer prognosis prediction. Bioinformatics
[103] Deep Neural Network Analysis of Pathology Images With Integrated Molecular Data for Enhanced Glioma Classification and Grading. Front Oncology
Outlook
- 데이터 많이 필요: Cacncer은 너무 heterogenous하기에 작은 사이즈의 데이터로는 편향이 있을 수밖에 없습니다.
- Internal bias: 성, 인종, 사회경제적 특징들에 따라 제한적
- Regulatory approval: 마켓에 나가기까지는 QC팀, 재무팀등의 지원이 필요
- Explainablity가 필요: Black box모델이라는 한계
반응형