분류 전체보기214 OrdinalCLIP: Learning Rank Prompts forLanguage-Guided Ordinal Regression NeurIPS 2022 Main Conference Track 순서가 있는 라벨을 예측하는 문제를 CLIP의 language prior로 풀어보자는 논문입니다. 기존 ordinal regression은 나이 16, 17, 18세 또는 severity 0, 1, 2, 3 같은 rank를 사실상 독립 class처럼 다루는 경우가 많습니다. 그러면 “class 간 순서성”을 충분히 반영하지 못하고, rank concept을 training data에서만 학습하기 때문에 few-shot이나 distribution shift 상황에서 overfitting이 생길 수 있습니다. 논문은 이를 해결하기 위해 각 rank label을 text prompt로 바꾸고, CLIP text encoder를 통해 각 rank에 .. 2026. 6. 9. 리눅스에서 파일이 너무 많은 디렉토리가 느려지는 이유와 해결책 사전 지식: 리눅스는 파일을 어떻게 관리할까?이 현상을 이해하려면 리눅스 파일 시스템의 두 가지 핵심 개념인 아이노드(Inode)와 디렉토리 엔트리(Dentry)를 알아야 합니다.디렉토리 엔트리 (Directory entry): 이름과 번호표의 짝꿍 리눅스에서는 디렉토리(폴더)도 결국 하나의 특수한 파일입니다. 달리말하면, 파일시스템이 해석하는 구조화된 엔트리들의 집합입니다. 디렉토리라는 특수한 파일 안에는 그 폴더 안에 있는 파일들의 이름'과 그 파일의 '아이노드 번호'가 1:1로 매핑된 목록(Dentry)이 텍스트처럼 쭉 적혀 있습니다. 이것도 디스크 내에 저장되어있습니다. 주의해야할 것은 dentry라는 개념이 있는데, 이건 메모리에 있는 것입니다.아이노드 (Inode): 파일의 주민등록증. 파일의.. 2026. 3. 25. LDAP을 이용한 계정 등록 ldapadd -x -D "cn=admin,dc=mf,dc=seegene,dc=com" -W -f [등록팔 ldif 파일명]사내 서버를 여러 대 운영하다 보면, 서버마다 계정을 따로 만드는 대신 LDAP을 이용해 계정을 중앙에서 관리하는 경우가 많다.이렇게 하면 사용자 계정, UID/GID, 비밀번호를 통일할 수 있어서 어느 서버에 접속하든 같은 계정으로 로그인할 수 있다. 우리 환경도 여러 서버가 있고, LDAP 기반으로 계정을 공유하고 있다.이번 글에서는 신규 사용자 new_user를 LDAP에 등록하는 방법을, 서버 관리 경험이 많지 않은 사람도 따라할 수 있도록 step-by-step으로 정리해본다. 1. LDAP 계정 추가가 왜 필요한가? 일반적으로 리눅스 서버에서 useradd로 계정을 만.. 2026. 3. 23. DEG(Differentially Expressed Genes analysis) 분석 요약두 집단(또는 여러 조건) 사이에서 발현량이 유의하게 달라지는 유전자들을 찾는 분석. 즉, 두 집단에 어떤 유전자가 더 많이 발현되는지(up-regulated), 어떤 유전자가 덜 발현되는지(down-regulated)를 찾는 방법. t-test 사전지식1. library size: 한 샘플에서 얻은 총 read의 수(총 카운트의 수)2. CPM normaliation (Counts Per Million) = CPM = (gene count / sample total count) * 10^{6}. 10^{6}을 곱하는 이유는 단순히 보기좋게 스케일로 바꾸기 위한 관례3. RNA-seq: 샘플안에 RNA을 시퀀싱해서, 각 유전자에서 나온 조각(read)이 몇개 관측되었는지 세어내는 방법. 세포/조직에.. 2026. 3. 22. Class-Balanced Loss Based on Effective Number of Samples https://openaccess.thecvf.com/content_CVPR_2019/papers/Cui_Class-Balanced_Loss_Based_on_Effective_Number_of_Samples_CVPR_2019_paper.pdf 요약Balanced CrossEntropy(=weigthed CE)에서의 가중치가 빈도수의 역수로 들어가면 과하게 들어가서 성능이 안좋음. 유효수를 이용하여 좀 더 이론적으로 타당하고 부드러운(re-smooth된) re-weight 을 하자\Motivation 현실 세계의 데이터들은 대부분 클래스 분포가 균형을 이루지 않고, 몇 개 클래스에 많은 샘플이 몰리고 나머지 클래스는 적은 샘플을 가진 long-tailed 분포를 갖게이런 분포 하에서 학습된 모델은 다수 클.. 2025. 11. 14. SLURM 단위 (Job, Task) 이해 JOB: sbatch 명령어로 실험 1개의 단위. jobId가 부여되는 하나의 단위임. QoS, Partition 자원같은게 Job단위로 일단 크게 구성됨.Task: Job내에서 SLURM이 띄우는 프로세스의 단위. 개수는 "#SABTACH--ntask=..."으로 결정. 직접 띄우는 OS프로세스임. 즉. "ps -u [사용자명]"으로 띄우는 테스크임. slurm이 관리하는 병렬 프로세스 수임. 즉, slurm이 띄운 프로세스가 자식프로세스로 여러개 병렬로 돌리는 것은 해당되지 않음. 아래의 경우는 테스크가 Job 하나에 Task가 한 개인 상태#SBATCH --nodes=1#SBATCH --ntasks=1 # SLURM task는 1개만#SBATCH --gres=gpu:2 .. 2025. 11. 13. 이전 1 2 3 4 ··· 36 다음