본문 바로가기

분류 전체보기216

In context MIL 2026.06.04 arXiv Motivation1. in-context learning의 필요성: 기존 병리 MIL에서는 WSI 하나를 bag, tile/patch embedding을 instance로 보고 slide-level label만으로 학습합니다. 문제는 실제 병리 데이터셋이 생각보다 작거나, organ/task마다 label 수가 적다는 점입니다. 예를 들어 rare cancer detection, 새로운 biomarker prediction, gastric biopsy에서 특정 grading task처럼 slide-level label은 있지만 수백 장 이하인 경우 ABMIL/TransMIL을 매번 학습하면 overfit, hyperparameter instability, seed vari.. 2026. 6. 29.
S/W 의료기기 보호되어 있는 글 입니다. 2026. 6. 24.
OrdinalCLIP: Learning Rank Prompts forLanguage-Guided Ordinal Regression NeurIPS 2022 Main Conference Track 순서가 있는 라벨을 예측하는 문제를 CLIP의 language prior로 풀어보자는 논문입니다. 기존 ordinal regression은 나이 16, 17, 18세 또는 severity 0, 1, 2, 3 같은 rank를 사실상 독립 class처럼 다루는 경우가 많습니다. 그러면 “class 간 순서성”을 충분히 반영하지 못하고, rank concept을 training data에서만 학습하기 때문에 few-shot이나 distribution shift 상황에서 overfitting이 생길 수 있습니다. 논문은 이를 해결하기 위해 각 rank label을 text prompt로 바꾸고, CLIP text encoder를 통해 각 rank에 .. 2026. 6. 9.
리눅스에서 파일이 너무 많은 디렉토리가 느려지는 이유와 해결책 사전 지식: 리눅스는 파일을 어떻게 관리할까?이 현상을 이해하려면 리눅스 파일 시스템의 두 가지 핵심 개념인 아이노드(Inode)와 디렉토리 엔트리(Dentry)를 알아야 합니다.디렉토리 엔트리 (Directory entry): 이름과 번호표의 짝꿍 리눅스에서는 디렉토리(폴더)도 결국 하나의 특수한 파일입니다. 달리말하면, 파일시스템이 해석하는 구조화된 엔트리들의 집합입니다. 디렉토리라는 특수한 파일 안에는 그 폴더 안에 있는 파일들의 이름'과 그 파일의 '아이노드 번호'가 1:1로 매핑된 목록(Dentry)이 텍스트처럼 쭉 적혀 있습니다. 이것도 디스크 내에 저장되어있습니다. 주의해야할 것은 dentry라는 개념이 있는데, 이건 메모리에 있는 것입니다.아이노드 (Inode): 파일의 주민등록증. 파일의.. 2026. 3. 25.
LDAP을 이용한 계정 등록 ldapadd -x -D "cn=admin,dc=mf,dc=seegene,dc=com" -W -f [등록팔 ldif 파일명]사내 서버를 여러 대 운영하다 보면, 서버마다 계정을 따로 만드는 대신 LDAP을 이용해 계정을 중앙에서 관리하는 경우가 많다.이렇게 하면 사용자 계정, UID/GID, 비밀번호를 통일할 수 있어서 어느 서버에 접속하든 같은 계정으로 로그인할 수 있다. 우리 환경도 여러 서버가 있고, LDAP 기반으로 계정을 공유하고 있다.이번 글에서는 신규 사용자 new_user를 LDAP에 등록하는 방법을, 서버 관리 경험이 많지 않은 사람도 따라할 수 있도록 step-by-step으로 정리해본다. 1. LDAP 계정 추가가 왜 필요한가? 일반적으로 리눅스 서버에서 useradd로 계정을 만.. 2026. 3. 23.
DEG(Differentially Expressed Genes analysis) 분석 요약두 집단(또는 여러 조건) 사이에서 발현량이 유의하게 달라지는 유전자들을 찾는 분석. 즉, 두 집단에 어떤 유전자가 더 많이 발현되는지(up-regulated), 어떤 유전자가 덜 발현되는지(down-regulated)를 찾는 방법. t-test 사전지식1. library size: 한 샘플에서 얻은 총 read의 수(총 카운트의 수)2. CPM normaliation (Counts Per Million) = CPM = (gene count / sample total count) * 10^{6}. 10^{6}을 곱하는 이유는 단순히 보기좋게 스케일로 바꾸기 위한 관례3. RNA-seq: 샘플안에 RNA을 시퀀싱해서, 각 유전자에서 나온 조각(read)이 몇개 관측되었는지 세어내는 방법. 세포/조직에.. 2026. 3. 22.