본문 바로가기

Digital pathology23

Domain generalization, Domain adaptation, stain normalization, stain augmentation 설명 Preliminaries IID(Independent and identical distributed) : 인공지능 알고리즘들은 IID로 소스/타깃 데이터에 대한 주요 가정을 합니다. 이 가정은 주로 2가지입니다 [1].독립성(Independence): 각 데이터 포인트가 서로 독립적이라는 것을 의미합니다. 즉, x1이 다른 x2에 영향을 미치지 않는 것을 의미합니다.동일 분포(identically distributed): 모든 데이터가 같은 확률분포에서 추출되었다는 것을 의미합니다.  즉 x1을 뽑든 x2을 뽑든, test data에서 x3을 뽑든 동일분포에서 나왔음을 가정합니다. 따라서, 데이터 셋이 통계적으로 유사한 통계량값을 가진다는 것을 의미합니다. Domain shift: training(sou.. 2024. 6. 21.
Openslide level 과 Deepzoom level의 차이 사전지식Openslide-python은 파이썬 바인딩된 openslide의 패키지입니다. 여기서는 일반적인 WSI(whole slide Image)의 이미지 피라미드 구조로 다운 샘플링하여 처리함Deepzoom은 Deepzoom은 OpenSlide와 함께 사용되는 강력한 도구로, 대형 이미지를 다양한 줌 레벨에서 효율적으로 탐색할 수 있게 해줍니다. 이는 특히 WSI와 같은 고해상도 이미지에 유용 요약Openslide의 level 0가 가장 초해상도 이미지 (mpp)Deepzoom의 level max가 가장 초고해상도 이미지 (mpp).  Deepzoom level과 openslide level의 매핑Deepzoom level_count와 openslide.Openslide.level_count의 숫자가.. 2024. 6. 1.
[5분 컷 리뷰] Prov-GigaPath : A whole-slide foundation model for digitalpathology from real-world data Microsoft에서 발표한 Foundation 모델인 Prov-GigaPath입니다. 26개의 테스크에서 25개가 SOTA로 outperform을 주장했던 논문입니다. 자세한 개발방법은 아래와 같습니다.Data collectionslides: H&E stained, and IHC(immunohistochemistry) 171,189 slides백그라운드 제외: Tissue sementation. 자세히는 Otsu 알고리즘을으로 저해상도에서 진행해서 전경을 뽑은 후에 배율에 맞춰 사용함(HIPT에서도 활용)해상도 조정: 0.5mpp (20x)에 맞춰 진행 (URL)**Tiling: 256 x 256 픽셀로 타일링 (2번에 오츄알고리즘으로 배경이 10% 이상인 경우만 활용) * 기타: 200node (32.. 2024. 5. 28.
[5분 컷 리뷰] PULTO (PathAI) 학습 방법: 자기지도학습 방법, 데이터 1. 데이터 소스다양한 염색, 스캐너, 생물학적 오브젝트의 데이터셋을 구성했습니다. 공공데이터 뿐만아니라, 따로(Private)모은 데이터셋을 포함해서 총 158,852 Slide이미지를 구했습니다. 이 약 16만장의 이미지를 4개 종류의 Resolution으로 1억 9천만장의 패치를 얻었습니다. 장기 수: 50개 이상질환 그룹: 28종류 이상스캐너: 11종류배율: 20x, 40x 각조직 영역 검출(Tissue regions): ArtifactDetection라는 PathAI의 Fore/Background 이미지를 분리하는 로직을 넣었습니다. 전경만 뽑았구요. 외부로 공개되지 않았지만 오츄알고리즘 보다, 다양한 상황(스캐너/염색) 등에서 더 좋은 성능을 보인다고합니다.타일링(Tiling): 40x (0... 2024. 5. 27.
structure-preserving color normalization (vahadane method) 정리 matrix factorization 하면 되는거 아님?기존 방법론에는 SVD, BCD 등의 방법론이 있습니다.SVD 의 문제점: 벡터의 방향을 고유벡터의 5%, 95%값 사이의 있는 벡터를 고름에따라서 이미지 간의 컬러분포(inter-image variation)에 좀 강건하다고는 합니다. 하지만, 전문가가 타깃이미지를 따로 정해주는것대비 별로 성능이 좋지 않다고합니다. 그리고, 고유벡터들이 음의값을 가지거나, 희소성을 보장하지 못하는 경우가 있어서 사용하긴 어렵습니다. 희소성을 가져야하는 이유는 염색이 된 밀도가 각각의 픽셀에서 균등하게 흩어져있으면, 물체(조직)의 구분이 뚜렷하지 않기에 희소성을 갖도록합니다. + 음의 값이 나오면 해석이 어렵습니다. stain density값이 (-)의면 빛이 발산.. 2024. 5. 21.
[버그해결] OSError: libopenslide.so.0: cannot open shared object file: No such file or directory 문제점파이썬 바인딩 오픈슬라이드(python-openslide)는 OpenSlide을 필요로합니다. 파이썬 바인딩 오픈슬라이드(python-openslide) 설치되었는데, OpenSlide가 설치되지 않아서 발생하는 에러입니다. 해결방법아래와 같은 명령어로 openslide을 운영체제 내에 설치해줍니다.sudo apt-get install openslide-tools   추가 버그1ImportError: /lib/x86_64-linux-gnu/libgobject-2.0.so.0: undefined symbol: ffi_type_uint32, version LIBFFI_BASE_7.0해결방법conda install openslide -c conda-forge https://github.com/elerac.. 2024. 4. 12.