수의학 AI, 왜 Veterinary LLM이 필요한가? _ JARVIS-4B 이야기
- 5월 1일
- 3분 분량
최종 수정일: 5월 1일

최근 몇 년 사이 범용 LLM은 다양한 분야에서 빠르게 활용되고 있습니다.
하지만 의료와 수의학 영역에서는 여전히 하나의 질문이 남아 있습니다.
범용 LLM만으로 의료 의사결정을 충분히 지원할 수 있을까?
이 질문에서 JARVIS-4B 프로젝트는 시작되었습니다.
이번 글에서는 수의학 도메인 특화 LLM이 어떤 고민에서 출발했고, 어떤 방향으로 설계되었는지 그 흐름을 소개하고자 합니다.
1. 수의학 AI, 왜 Veterinary LLM을 만들기로 했는가?
최근 몇 년 사이 범용 LLM은 다양한 분야에서 놀라운 성과를 보여주고 있습니다.
텍스트 생성, 요약, 코드 작성 등 많은 영역에서 이미 실용적인 수준에 도달했습니다.
하지만 의료와 수의학 영역에서는 조금 다른 문제가 존재합니다.
바로 정보의 신뢰성입니다.
잘못된 정보가 단순한 오류가 아니라임상 판단에 영향을 줄 수 있는 위험 요소가 될 수 있기 때문입니다.
특히 의료 환경에서는 다음과 같은 요구사항이 동시에 존재합니다.
정보의 정확성
판단 과정의 일관성
근거 기반 설명 가능성
이러한 이유로 의료 및 수의학 영역에서는 단순히 답을 생성하는 모델이 아니라,
신뢰할 수 있는 추론 과정을 유지할 수 있는 모델
이 필요했습니다.
그리고 이 필요성에서 수의학 특화, 'Veterinary LLM 구축 프로젝트'가 시작되었습니다.
2. 춘옥컴퍼니 수의학 AI, 어떤 모델에서 시작했는가
도메인 특화 모델을 구축하기 위해 가장 먼저 고려해야 했던 것은 어떤 기반 모델에서 출발할 것인가 였습니다.
기반 모델 선택은 단순히 성능만의 문제가 아니라,
모델의 신뢰성 및 안전
확장 가능성
도메인 적응 가능성
과 같은 다양한 요소를 함께 고려해야 하는 문제였습니다.
JARVIS-4B에서는 기존 모델의 일반적인 언어 이해 능력을 유지하면서 도메인 지식을 점진적으로 학습시키는 방식이 선택되었습니다.
이러한 접근은 모델이 기존 언어 능력을 유지하면서도 수의학 지식을 자연스럽게 내재화하도록 만드는 데 목적이 있습니다.
3. 데이터는 어떻게 구성했는가
도메인 특화 모델에서 가장 중요한 요소는 모델 자체가 아니라 데이터의 구성 방식입니다.
특히 의료와 수의학 영역에서는 데이터의 양보다 데이터의 신뢰성과 다양성이 훨씬 더 중요한 요소로 작용합니다. JARVIS-4B의 사전학습 데이터는 단일 출처가 아닌 여러 종류의 전문 데이터를 조합하는 방식으로 구성되었습니다.
대표적으로 다음과 같은 유형의 데이터가 포함되었습니다.
상업적 이용이 가능한 학술 논문
실제 임상 기록 기반 데이터
전문 용어 데이터
일반 언어 이해 능력을 유지하기 위한 보조 데이터 등
특히 임상 데이터는 실제 진료 환경에서 생성된 기록을 기반으로 구성되었으며, 다양한 진료 상황을 반영할 수 있도록 신중하게 선별되었습니다.
이를 통해 모델이 단순한 지식 암기가 아니라 임상적 맥락 이해 능력을 갖추는 것을 목표로 했습니다.
4. 무엇을 기대하고 있는가
JARVIS-4B 프로젝트의 목표는 단순히 더 큰 모델을 만드는 것이 아닙니다.
궁극적인 목표는 임상 현장에서 실제로 도움이 되는 판단 보조 도구를 만드는 것입니다.
특히 다음과 같은 영역에서 의미 있는 변화를 기대하고 있습니다.
복잡한 임상 상황에서의 정보 정리 지원
감별진단 과정에서의 사고 흐름 보조
치료 계획 수립 과정에서의 근거 제시
의료 지식 접근성 향상
도메인 특화 모델은 단순한 정보 제공 도구를 넘어, 의료 전문가의 사고 과정을 보조하는 도구가 될 수 있습니다.
이러한 방향성은 향후 모델의 활용 방식에도 중요한 영향을 미칠 것입니다.
5. 첫 번재 공개 모델, VetJarvis-4B

이러한 방향 속에서, 프로젝트의 첫 번째로 VetJarvis-4B-Instruct 모델이 오픈소스로 공개되었습니다.
VetJarvis-4B-Instruct는 수의학 연구와 교육 환경에서 활용할 수 있도록 설계된 생성형 언어 모델로, 수의학 전문 지식을 기반으로 한 데이터 학습 구조를 통해 도메인 이해도를 높이는 방향으로 개발되었습니다.
이 모델은 특정 임상 의사결정을 대체하기 위한 목적이 아니라, 연구와 학습 환경에서 활용될 수 있는 기초 모델(base model)로 공개되었습니다. 모델 가중치는 Hugging Face 플랫폼을 통해 배포되어, 연구자와 개발자가 다양한 실험과 확장을 시도할 수 있도록 제공되고 있습니다.
VetJarvis-4B는 하나의 완성된 모델이라기보다, 앞으로 확장될 Veterinary LLM 개발 과정의 첫 번째 기술적 단계에 해당합니다.
이 모델 공개는 단일 결과물의 의미를 넘어,수의학 도메인 AI 모델을 점진적으로 확장해 나가기 위한출발점으로서의 의미를 갖습니다.
6. 앞으로의 단계
사전학습 모델 공개는 개발 과정의 끝이 아니라, 오히려 다음 단계를 준비하기 위한 시작에 가깝습니다.
앞으로는 다양한 방식의 모델 확장을 단계적으로 진행할 계획입니다.
예를 들어,
사용자 환경에 맞춘 추가 학습 과정
실제 사용 환경 기반 성능 검증
다양한 임상 분야를 반영한 모델 확장
모델 평가 기준 정립을 위한 벤치마크 체계 구축
특히 현재는 수의학 AI 모델을 보다 객관적으로 평가할 수 있는 벤치마크 체계(VetBench) 구축도 함께 준비하고 있습니다.
VetBench는 다양한 모델을 동일한 기준에서 비교할 수 있는 환경을 제공함으로써, 향후 수의학 AI 모델의 신뢰성을 높이는 데 중요한 역할을 할 것으로 기대됩니다.
또한 향후에는 보다 확장된 규모의 차세대 모델 개발을 통해, 연구 환경 뿐 아니라 다양한 실제 활용 환경까지 고려한 기술 확장을 단계적으로 추진해 나갈 예정입니다.
7. 마무리
도메인 특화 LLM을 구축하는 과정은 단순히 모델을 학습시키는 작업이 아닙니다.
그것은,
문제를 정의하고
데이터를 설계하고
판단 기준을 정립하는
하나의 긴 과정에 가깝습니다.
JARVIS-4B 프로젝트는 이러한 과정의 첫 번째 단계에 해당합니다.
앞으로도 Veterinary AI가 실제 임상 환경에서 의미 있는 도구가 될 수 있도록, 지속적인 개선과 검증을 이어갈 예정입니다.





댓글