데이터 기관 넘어 AI 플랫폼으로… 심평원 'CDM 기반 의료 AI' 구축

기획·분석·결과까지 자동화, 보건의료 데이터 활용 패러다임 전환

심사평가원이 단순 데이터 제공기관을 넘어 인공지능(AI) 기반 연구지원 플랫폼으로의 전환에 속도를 내고 있다.

전 국민 진료정보 공통데이터모델(CDM)을 기반으로 한 보건의료 특화 생성형 AI 파운데이션 모델을 구축하고, 2027년까지 빅데이터 개방시스템의 클라우드 전환을 완료해 데이터 경제 시대 주도권을 확보하겠다는 전략이다.

건강보험심사평가원 빅데이터실(실장 국선표)은 23일 원주 본원에서 전문기자단 간담회를 열고 이 같은 추진 계획을 공개했다.

핵심은 '전 국민 진료정보 CDM 기반 AI 파운데이션 모델'이다. 건강보험 데이터와 보건의료 전문 지식을 집중 학습한 해당 모델은 연구자가 질의를 입력하면 분석 SQL을 자동 생성하고 통계 결과를 실시간으로 도출한다. 연구 기획부터 분석, 결과 산출까지 전 과정을 AI가 지원하는 구조다.

사업은 3단계 로드맵으로 추진된다. 2026년에는 연구 설계와 방법론을 학습한 '연구지원 AI 모델(HIRA-Q)'을 구축한다. CDM 연구 도구인 Atlas, Hades 관련 자료와 데이터 구조, 표준용어 사전 등이 학습 데이터로 활용된다. 2027년에는 분석 쿼리 및 통계 코드 자동 설계 기능을 갖춘 '분석지원 AI 모델'을 개발하고, 2028년에는 AI가 직접 결과값을 도출하는 '연구수행 AI 모델'로 고도화한다.

이와 함께 과학기술정보통신부가 추진 중인 독자 AI 파운데이션 모델 개발에도 참여해 보건의료 특화 AI 생태계 확장도 병행한다.

국선표 빅데이터실장은 "이번 사업은 단순한 기술 도입이 아니라 보건의료 데이터 활용 방식 자체를 바꾸는 구조적 전환"이라며 "연구자가 전 과정을 실시간으로 지원받는 환경을 구현해 데이터 활용의 진입장벽을 낮추고 연구 생산성을 획기적으로 끌어올리겠다"고 강조했다.

인프라 혁신의 축은 클라우드 전환이다. 심평원은 2027년까지 빅데이터 개방시스템을 클라우드 네이티브 구조로 전환하고, 총 8대 과제 18개 세부 사업을 단계적으로 추진한다.

주요 과제로는 OpenAPI 전용 시스템 구축, 기관공유데이터 관리시스템 도입, 연구분석용 DB 교체, 데이터 구축 시스템 및 ETL 통합, 원격 분석 시스템 고도화 등이 포함된다. 하루 300만 건 이상 발생하는 API 트래픽을 안정적으로 처리하고, 데이터 처리 속도와 품질을 동시에 개선하는 데 초점을 맞췄다.

국 실장은 "클라우드 전환은 급증하는 공공 데이터 수요에 대응하기 위한 필수 인프라 전략"이라며 "범정부 데이터 공유 플랫폼과의 연계를 강화해 공공 데이터 활용도를 높이고, 국내 보건의료 AI 산업 발전의 기반을 구축하겠다"고 밝혔다.

연구자 접근성 개선도 병행한다. 가명정보 처리 가이드라인 개정에 따라 데이터 위험도 기반 차등 심사가 적용되면서 저위험 데이터는 제출 서류와 심사 기간이 대폭 축소된다. 기존 한 달 이상 소요되던 데이터 제공 기간도 단축될 전망이다.

또한 'HIRA Data Playground(가칭)'를 도입해 연구자가 데이터 신청 이전에 가상 환경에서 데이터 구조를 탐색하고 분석을 사전 검증할 수 있도록 한다. 대조군 데이터는 표준화된 샘플 형태로 구축해 9월부터 제공하며, 치과 연구 활성화를 위한 치식코드 변수도 추가 개방한다. 사망원인정보 연계 역시 관계기관 협력을 통해 추진한다.

가명정보 결합 활용도 확대되고 있다. 의료기관 코호트와 심평원 청구 데이터를 결합해 대상포진 백신 효과를 검증하는 등 실제 진료환경 기반 연구가 활발히 진행 중이다. 공공 분야에서는 소방공무원 건강 분석을 통해 국립소방병원 설립 근거를 마련했고, 반도체 근로자 산업보건 연구에도 데이터가 활용되고 있다.

심평원은 2026~2029년 제3기 보건의료 데이터 결합전문기관 재지정을 앞두고 있으며, 폐쇄망 분석 환경, 반출 전 재식별 위험 검증, 데이터 파기 등 다중 안전장치를 지속적으로 강화할 계획이다.

국선표 실장은 "데이터가 축적에 머무르지 않고 산업과 정책으로 연결되는 가치 창출 플랫폼으로 기능해야 한다"며 "강화된 개인정보 보호 체계를 기반으로 연구자와 기업이 체감할 수 있는 데이터 혁신 환경을 구축해 나갈 것"이라고 말했다.
 


홍유식 기자의 전체기사 보기
  • 이 기사를 공유해보세요  
  • 카카오톡
  • 네이버
  • 페이스북
  • 트위치