Motivation
- 약물 독성 연구에서 전형적인 병리적 이상(anomaly)을 사람이 일일이 찾아야 함.
- 그리고 찾아야하는 병적 분류(class)도 정의되어있지 않으면 찾기도 어려움.
Methods
1. 정상조직에 대한 표현 학습(representation learning)
- total loss = center_loss + classification loss: classification loss에 사용되는 분류(종 분류 * 장기분류* 염색분류, 16개)
- CNN + global average pooling: 8x8xC -> 1x1xC로 압축. 다양한 해상도 가능 + 병리이미지는 패치내에 동등한 중요
- center loss: feature-map hypersphere 의 크기를 작게 (=정상조직의 임베딩은 공간상에 잘 뭉쳐있게)
- $\mathcal{L}_{\text{cen}} = \sum_{k \in K \subseteq [1,n]} \frac{1}{2} \cdot \frac{ \sum_{i=1}^{m} \| x_i - a_k \|^2 \cdot \delta(y_i - k) }{ \sum_{i=1}^{m} \delta(y_i - k) }$: 각 클레스별로 inter-class distance을 작게
- $a_{k}$: 은 해당클레스의 특패치들의 평균(medoid)
2. Class mix-up augmentation: 다른 클레스의 히스토그램으로 변환하는 방법
- k 클레스별로 픽셀 강도를 모음: RGB값의 픽셀강도의 분포(histogram)을 획득. 평균을하든 어찌하든 집계
- 히스토그램을 누적합하여 CDF로 만듬: np.cumsum(cdf) + 정규화
- 클래스간 매핑 함수 생성: $M_{k1->k2}(x) = CDF_{k2}^{-1}(CDF_{k1}(x))$. 이함수를 lookup table로 만듬 16 x16

Results
1. ImageNet 학습보다 one-class classifiter (+ auxillary task)로 학습한게 더 분류가 분포상 쉬워보임

2. 특정질환에서 이상치에 해당하는 타일이 어느정도 발생했는지,

3. 약 부작용을 감지하는데 사용. 임상시험시에 low-dose, mid, high에서 anomaliy detection에서의 이상치패치의 비

Conclusion
- One-class SVM 용으로 학습할 때도, auxillary task가 꽤 유용하다.
- mix-up class augmentation 도 꽤 유용함.
https://arxiv.org/pdf/2210.07675v7
반응형