본문 바로가기

분류 전체보기198

[5분 컷 리뷰] Prov-GigaPath : A whole-slide foundation model for digitalpathology from real-world data Microsoft에서 발표한 Foundation 모델인 Prov-GigaPath입니다. 26개의 테스크에서 25개가 SOTA로 outperform을 주장했던 논문입니다. 자세한 개발방법은 아래와 같습니다.Data collectionslides: H&E stained, and IHC(immunohistochemistry) 171,189 slides백그라운드 제외: Tissue sementation. 자세히는 Otsu 알고리즘을으로 저해상도에서 진행해서 전경을 뽑은 후에 배율에 맞춰 사용함(HIPT에서도 활용)해상도 조정: 0.5mpp (20x)에 맞춰 진행 (URL)**Tiling: 256 x 256 픽셀로 타일링 (2번에 오츄알고리즘으로 배경이 10% 이상인 경우만 활용) * 기타: 200node (32.. 2024. 5. 28.

[5분 컷 리뷰] PULTO (PathAI) 학습 방법: 자기지도학습 방법, 데이터 1. 데이터 소스다양한 염색, 스캐너, 생물학적 오브젝트의 데이터셋을 구성했습니다. 공공데이터 뿐만아니라, 따로(Private)모은 데이터셋을 포함해서 총 158,852 Slide이미지를 구했습니다. 이 약 16만장의 이미지를 4개 종류의 Resolution으로 1억 9천만장의 패치를 얻었습니다. 장기 수: 50개 이상질환 그룹: 28종류 이상스캐너: 11종류배율: 20x, 40x 각조직 영역 검출(Tissue regions): ArtifactDetection라는 PathAI의 Fore/Background 이미지를 분리하는 로직을 넣었습니다. 전경만 뽑았구요. 외부로 공개되지 않았지만 오츄알고리즘 보다, 다양한 상황(스캐너/염색) 등에서 더 좋은 성능을 보인다고합니다.타일링(Tiling): 40x (0... 2024. 5. 27.

[5분 컷 리뷰] DINO v2: Learning Robust Visual Features without Supervision 요약iBOT(masked image modeling)과 DINO(knowledge distillation with no label)방법을 혼합한 방법 Transactions on Machine Learning Research (01/2024) Data processing: LVD-142M dataset의 생성과정많은 양의 데이터 학습을 위해, 데이터 처리방식을 1) 라벨, 비라벨 이미지 수집, 2) 중복이미지 제거, 3) 이미지 검색데이터 수집: 데이터 수집은 라벨링된 데이터와 라벨링 안된 데이터 크게 2가지의 데이터셋을 구축했습니다. 라벨링 된 데이터는 classifcation, segmentation, depth estimation 등의 다양한 문제에 사용되는 공공데이터를 수집했습니다. 다른 한편으로.. 2024. 5. 24.

structure-preserving color normalization (vahadane method) 정리 matrix factorization 하면 되는거 아님?기존 방법론에는 SVD, BCD 등의 방법론이 있습니다.SVD 의 문제점: 벡터의 방향을 고유벡터의 5%, 95%값 사이의 있는 벡터를 고름에따라서 이미지 간의 컬러분포(inter-image variation)에 좀 강건하다고는 합니다. 하지만, 전문가가 타깃이미지를 따로 정해주는것대비 별로 성능이 좋지 않다고합니다. 그리고, 고유벡터들이 음의값을 가지거나, 희소성을 보장하지 못하는 경우가 있어서 사용하긴 어렵습니다. 희소성을 가져야하는 이유는 염색이 된 밀도가 각각의 픽셀에서 균등하게 흩어져있으면, 물체(조직)의 구분이 뚜렷하지 않기에 희소성을 갖도록합니다. + 음의 값이 나오면 해석이 어렵습니다. stain density값이 (-)의면 빛이 발산.. 2024. 5. 21.

[5분 컷 리뷰] Cyclic learning rate 리뷰 및 사용법 요약Cyclic learning rate (CLR) 은 learning rate을 수동으로 조절해갈 필요없이, 자동으로 최적의 값을 찾는 과정의 스케쥴링입니다. CLR은 LearningRateReduceOnPlatue와 같이 감소하는 방향으로만 학습율을 조절하는 것이 아니라, 특정 영역에서 증감을 반복합니다. 그리고 이를 실험적으로 증명했습니다. Deep learning 에서의 Learning rate딥러닝의 파라미터 업데이트은 stochastic gradient descent로, 아래와 같은 식으로 학습합니다.$\theta^{t}=\theta^{t-1}-\epsilon_{t}\frac{\partial L}{\partial \theta}$L: 손실함수$\epsilon_{t}$: 학습문제는 학습률이 .. 2024. 5. 13.

Poetry로 의존성관리하기 / CI을 위한 pytest Poetry 설치Poetry은 "https://install.python-poetry.org/"에 있고, 파이썬으로 excute가능하게 되어있어서, Linux, MacOS, WSL에서아래와 같은 명령어로 설치가능합니다.$ curl -sSL https://install.python-poetry.org | python3 -// 환경변수까지 추가합니다.// .bashrc에 "excutebable binary을 바로 환경변수로 추가합니다"$ vi ~/.bashrc// vi에서 아래를 추가"export PATH="/home/heon/.local/bin:$PATH"$ poetry --versionPoetry (version 1.8.3) TOML(Tom's obvious Minimal Language) 포맷TOML파.. 2024. 5. 10.

이전 1 ··· 7 8 9 10 11 12 13 ··· 33 다음

티스토리툴바