From Medical Imaging
to Drug Discovery

Foundation Models & Agentic AI

이현수 Hyeonsoo Lee | Research Scientist, Lunit Inc.

Foundation Models Agentic AI 12 Publications

01

Research Trajectory

2019 — 2021

M.S. Thesis

Scribble-supervised
Segmentation
MICCAI 2020

2021 — 2023

FDA Products

Detection + Risk Prediction
4 vendors, 2× speed
ICCV · MICCAI 2023

2023 — 2024

Foundation Model

7M+ CXR images
VLM > Google · Microsoft
Report Generation · RAG

2025 — Now

Agentic AI

Chain of Evidence
MCP-Atlassian
6M+ installs

Supervised Learning → Foundation Models → Agentic AI

02

Medical Imaging AI

FDA-Approved Products · Risk Prediction · Weak Supervision

INSIGHT MMG & DBT — FDA-cleared breast cancer detection, 4 vendors (Hologic, GE, Siemens, Fujifilm), 2× inference speed
Risk Prediction — Current-Prior Comparison architecture, +7% AUC over SOTA (MICCAI 2023)
Scribble2Label — 30% labels → 94% performance (MICCAI 2020)

5 Publications 1 US Patent FDA Approved

PRIME+ CPC Architecture — Current-Prior Comparison for breast cancer risk prediction

PRIME+ Architecture — Current-Prior Comparison (MICCAI 2023)

03

Foundation Model: 7M+ CXR Images

대규모 CXR 데이터 기반 — 리포트 생성, LLM 기반 정보 추출, RAG 도입

7M+

CXR Images

SOTA

> Google · Microsoft

RAG

유사 사례 기반 생성

LLM 기반 정보 추출 — 비정형 의료 리포트에서 구조화된 소견 추출, JSON-guided Generation으로 Hallucination 제어
리포트 생성 모델 — LLaMA 계열 LoRA fine-tuning, Microsoft·Google 벤치마크 초과 달성
RAG 프로토타입 — 유사 사례 참조를 통한 생성 품질 향상 (첫 RAG 경험)

→ HITS 연결: 도메인 특화 FM + LLM 파이프라인 경험 — 비정형 데이터에서 구조화된 정보를 추출하는 과정은 신약개발 데이터에도 동일하게 적용됩니다.

04

MCP-Atlassian Open Source

MCP를 "사용"이 아닌 "창조" — LLM Agent ↔ Confluence/Jira

6M+

Installs

4,600+

Stars

95

Contributors

Toolset Architecture — 72개 도구를 21개 toolset으로 그룹화, 환경별 선택적 노출로 LLM 토큰 효율 최적화
95명 기여자 — OAuth, Helm chart, 보안 수정 등 커뮤니티 주도 확장
Cloud + Server/DC — 유일한 dual-deployment Atlassian MCP

→ HITS: 신약개발 에이전트도 수십 개 도구 중 필요한 것만 동적으로 선택해야 합니다.

GitHub Trending Developer #1 — Hyeonsoo Lee (sooperset), above LangChain creator

GitHub Trending Developer #1 (2026-02-28)

05

Chain of Evidence

정부 과제 대규모 다기관 컨소시엄 — 바이오메디컬 RAG 인프라 담당

다기관

기업·대학·병원 컨소시엄

PubMed

수백만 문헌 RAG

Agentic

CDSS · BMCS 서비스

LlamaIndex
FunctionAgent

Agent Orchestration

→

Tool Layer

검색 · 약물 조회
DDI · 가이드라인

→

Vector DB

PubMed 문헌
Multi-index RAG

→

Citation
Pipeline

No Citation,
No Answer

→ HITS 연결: 바이오메디컬 문헌 RAG + 도구 호출 에이전트 = HITS가 구축하려는 연구 자동화 시스템과 구조적으로 동일합니다.
문헌 검색 → 근거 수집 → 인용 검증 → 구조화된 출력 파이프라인은 신약개발에 직접 전이 가능합니다.

06

Structural Parallels

모달리티는 다르지만 AI 과제는 구조적으로 동일합니다

🏥 Medical Imaging	💊 Drug Discovery
CXR · 유방 촬영 이미지	분자 구조 (SMILES, Graphs)
방사선 리포트 (텍스트)	과학 논문 · Assay 결과
VLM (이미지 + 텍스트)	Multi-modal FM (구조 + 물성)
Risk Prediction (생존 분석)	ADMET Prediction
PubMed RAG — 임상 근거	PubMed RAG — 문헌 리뷰

"도메인 지식은 수개월이면 학습 가능합니다.
AI 시스템 전문성은 수년이 필요합니다."

07

HITS에서의 관심 영역

HITS 연구 주제 중 즉시 기여 가능한 3개 영역

PRIMARY

FM 기반 분석

Foundation Model + RAG + Agent 결합으로 신약 데이터 분석 시스템 구축

CXR FM 경험 RAG 인프라

STRONG FIT

멀티에이전트 연구 자동화

논문 분석 → 가설 수립 → 코드 작성 → 검증 파이프라인

MCP Creator CoE Agent

TRANSFERABLE

세포 효능 · 물성 예측

생존 분석 → 약물 반응 모델링 전이, Representation Learning

Survival Analysis VLM

08

First 90 Days

구체적인 기여 계획

Month 1 — Learn

HyperLab 아키텍처 deep-dive
분자 표현 학습 (SMILES, 분자 그래프, fingerprints)
Drug FM 논문 서베이 (MolBERT, ChemBERTa, Uni-Mol)
기존 Agent 인프라 파악 & quick wins 식별

Month 2 — Build

CoE 아키텍처 기반 신약 문헌 RAG 구축
MCP tools 프로토타입 (BLAST, docking, ADMET API)
HyperLab 기존 인프라와 통합
에이전트 평가 파이프라인 설계

Month 3 — Deliver

첫 working agent 납품
연구 질문 → 문헌 검색 → 분자 데이터 → 다음 단계 제안
벤치마크 & 반복 개선
팀 내 지식 공유 & 문서화

09

Why Me for HITS

Foundation Models

7M+ image FM
VLM > Google · Microsoft
LLM Fine-tuning (LoRA)

Agentic AI

MCP Creator (6M+ installs)
Biomedical RAG (PubMed)
LlamaIndex + MCP tools

Research Rigor

12 Publications
1 Granted US Patent
MICCAI · ICCV · NeurIPS

모달리티는 바뀌어도
문제를 정의하고 시스템을 만드는 방식은 같습니다.

From Medical Imagingto Drug Discovery

Research Trajectory

Medical Imaging AI

Foundation Model: 7M+ CXR Images

MCP-Atlassian Open Source

Chain of Evidence

Structural Parallels

HITS에서의 관심 영역

FM 기반 분석

멀티에이전트 연구 자동화

세포 효능 · 물성 예측

First 90 Days

Month 1 — Learn

Month 2 — Build

Month 3 — Deliver

Why Me for HITS

Foundation Models

Agentic AI

Research Rigor

From Medical Imaging
to Drug Discovery