From Medical Imaging
to Drug Discovery

Foundation Models & Agentic AI

이현수 Hyeonsoo Lee | Research Scientist, Lunit Inc.
Foundation Models Agentic AI 12 Publications
01

Research Trajectory

2019 — 2021
M.S. Thesis
Scribble-supervised
Segmentation
MICCAI 2020
2021 — 2023
FDA Products
Detection + Risk Prediction
4 vendors, 2× speed
ICCV · MICCAI 2023
2023 — 2024
Foundation Model
7M+ CXR images
VLM > Google · Microsoft
Report Generation · RAG
2025 — Now
Agentic AI
Chain of Evidence
MCP-Atlassian
6M+ installs
Supervised Learning Foundation Models Agentic AI
02

Medical Imaging AI

FDA-Approved Products · Risk Prediction · Weak Supervision

  • INSIGHT MMG & DBT — FDA-cleared breast cancer detection, 4 vendors (Hologic, GE, Siemens, Fujifilm), 2× inference speed
  • Risk Prediction — Current-Prior Comparison architecture, +7% AUC over SOTA (MICCAI 2023)
  • Scribble2Label — 30% labels → 94% performance (MICCAI 2020)
5 Publications 1 US Patent FDA Approved
PRIME+ CPC Architecture — Current-Prior Comparison for breast cancer risk prediction

PRIME+ Architecture — Current-Prior Comparison (MICCAI 2023)

03

Foundation Model: 7M+ CXR Images

대규모 CXR 데이터 기반 — 리포트 생성, LLM 기반 정보 추출, RAG 도입

7M+
CXR Images
SOTA
> Google · Microsoft
RAG
유사 사례 기반 생성
  • LLM 기반 정보 추출 — 비정형 의료 리포트에서 구조화된 소견 추출, JSON-guided Generation으로 Hallucination 제어
  • 리포트 생성 모델 — LLaMA 계열 LoRA fine-tuning, Microsoft·Google 벤치마크 초과 달성
  • RAG 프로토타입 — 유사 사례 참조를 통한 생성 품질 향상 (첫 RAG 경험)

→ HITS 연결: 도메인 특화 FM + LLM 파이프라인 경험 — 비정형 데이터에서 구조화된 정보를 추출하는 과정은 신약개발 데이터에도 동일하게 적용됩니다.

04

MCP-Atlassian Open Source

MCP를 "사용"이 아닌 "창조" — LLM Agent ↔ Confluence/Jira

6M+
Installs
4,600+
Stars
95
Contributors
  • Dynamic Toolset — 21개 toolset 동적 필터링으로 LLM 토큰 효율 최적화
  • 95명 기여자 — OAuth, Helm chart, 보안 수정 등 커뮤니티 주도 확장
  • Cloud + Server/DC — 유일한 dual-deployment Atlassian MCP

→ HITS: 신약개발 에이전트도 수십 개 도구 중 필요한 것만 동적으로 선택해야 합니다.

GitHub Trending Developer #1 — Hyeonsoo Lee (sooperset), above LangChain creator

GitHub Trending Developer #1 (2026-02-28)

05

Chain of Evidence

정부 과제 대규모 다기관 컨소시엄 — 바이오메디컬 RAG 인프라 담당

다기관
기업·대학·병원 컨소시엄
PubMed
수백만 문헌 RAG
Agentic
CDSS · BMCS 서비스
LlamaIndex
FunctionAgent
Agent Orchestration
Tool Layer
검색 · 약물 조회
DDI · 가이드라인
Vector DB
PubMed 문헌
Multi-index RAG
Citation
Pipeline
No Citation,
No Answer

→ HITS 연결: 바이오메디컬 문헌 RAG + 도구 호출 에이전트 = HITS가 구축하려는 연구 자동화 시스템과 구조적으로 동일합니다.
문헌 검색 → 근거 수집 → 인용 검증 → 구조화된 출력 파이프라인은 신약개발에 직접 전이 가능합니다.

06

Structural Parallels

모달리티는 다르지만 AI 과제는 구조적으로 동일합니다

🏥 Medical Imaging 💊 Drug Discovery
CXR · 유방 촬영 이미지 분자 구조 (SMILES, Graphs)
방사선 리포트 (텍스트) 과학 논문 · Assay 결과
VLM (이미지 + 텍스트) Multi-modal FM (구조 + 물성)
Risk Prediction (생존 분석) ADMET Prediction
PubMed RAG — 임상 근거 PubMed RAG — 문헌 리뷰

"도메인 지식은 수개월이면 학습 가능합니다.
AI 시스템 전문성은 수년이 필요합니다."

07

HITS에서의 관심 영역

HITS 연구 주제 중 즉시 기여 가능한 3개 영역

PRIMARY

FM 기반 분석

Foundation Model + RAG + Agent 결합으로 신약 데이터 분석 시스템 구축

CXR FM 경험 RAG 인프라
STRONG FIT

멀티에이전트 연구 자동화

논문 분석 → 가설 수립 → 코드 작성 → 검증 파이프라인

MCP Creator CoE Agent
TRANSFERABLE

세포 효능 · 물성 예측

생존 분석 → 약물 반응 모델링 전이, Representation Learning

Survival Analysis VLM
08

First 90 Days

구체적인 기여 계획

Month 1 — Learn

  • HyperLab 아키텍처 deep-dive
  • 분자 표현 학습 (SMILES, 분자 그래프, fingerprints)
  • Drug FM 논문 서베이 (MolBERT, ChemBERTa, Uni-Mol)
  • 기존 Agent 인프라 파악 & quick wins 식별

Month 2 — Build

  • CoE 아키텍처 기반 신약 문헌 RAG 구축
  • MCP tools 프로토타입 (BLAST, docking, ADMET API)
  • HyperLab 기존 인프라와 통합
  • 에이전트 평가 파이프라인 설계

Month 3 — Deliver

  • 첫 working agent 납품
  • 연구 질문 → 문헌 검색 → 분자 데이터 → 다음 단계 제안
  • 벤치마크 & 반복 개선
  • 팀 내 지식 공유 & 문서화
09

Why Me for HITS

Foundation Models

  • 7M+ image FM
  • VLM > Google · Microsoft
  • LLM Fine-tuning (LoRA)

Agentic AI

  • MCP Creator (6M+ installs)
  • Biomedical RAG (PubMed)
  • LlamaIndex + MCP tools

Research Rigor

  • 12 Publications
  • 1 Granted US Patent
  • MICCAI · ICCV · NeurIPS
모달리티는 바뀌어도
문제를 정의하고 시스템을 만드는 방식은 같습니다.