서울대병원·네이버, 건강검진 데이터 기반 AI로 생물학적 나이 예측

트랜스포머 기반 모델 개발, 실제 생존율 연관성 입증... 개인 맞춤형 건강 위험 관리 기대

서울대병원과 네이버 공동 연구팀이 약 15만 명의 건강검진 데이터와 질병 유병, 사망 정보를 학습시킨 트랜스포머 기반 인공지능(AI) 모델을 개발했다.

이 모델은 개인의 생물학적 나이(BA)와 실제 나이(CA)의 차이(BA-CA 갭)를 산출하여 건강 위험도를 정확하게 예측하며, 이 갭이 클수록 실제 생존율이 통계적으로 낮아진다는 점을 입증했다.

이번 연구는 기존 모델의 한계를 극복하고 개인 맞춤형 질병 예방 및 건강 위험 관리에 기여할 AI 기반 도구의 가능성을 제시했다.

서울대병원 내분비대사내과 조영민·배재현·윤지완 교수팀과 네이버 Digital Healthcare LAB 유한주·문성은 박사팀은 건강검진 데이터를 활용해 개인의 생물학적 나이와 건강 위험을 함께 평가할 수 있는 AI 모델을 공동 개발했다고 7일 밝혔다.

생물학적 나이(BA)는 유전, 생활습관, 질병 이력 등을 종합해 신체의 실제 노화 정도를 나타내는 지표다. 기존 BA 예측 모델은 건강한 사람 데이터를 주로 사용해 만성질환자와 사망 위험을 반영하지 못하는 한계가 있었다.

연구팀은 이 한계를 극복하기 위해 2003년부터 2020년까지 서울대병원 강남센터에서 건강검진을 받은 151,281명의 신체계측, 혈액·소변검사, 폐기능 검사뿐만 아니라 질병 유무 및 사망 정보까지 포함된 대규모 데이터를 분석했다.

연구팀은 이 데이터를 바탕으로 트랜스포머(Transformer) 구조의 AI 모델을 설계하고, 혈압, 혈당, 콜레스테롤 등 다양한 건강 지표를 통합 분석해 개인의 BA를 예측하도록 했다. AI는 예측된 BA와 실제 나이(CA)의 차이인 BA–CA 갭을 산출한다.

개발된 AI 모델은 학습을 통해 정상군, 질환 전단계군, 질환군을 명확하게 구분했다. 정상군은 BA가 CA보다 낮게(BA < CA), 질환군은 높게(BA > CA) 나타나는 뚜렷한 경향을 보였다. 특히, 혈당·혈압·지질 수치가 악화되거나 심혈관질환, 암이 있는 경우 이 BA–CA 갭이 유의하게 증가했다.

연구팀이 AI가 산출한 BA–CA 갭을 기준으로 ▲건강군(BA–CA < −1) ▲기준군(−1≤BA–CA≤1) ▲비건강군(BA–CA > 1)으로 나누어 생존 분석을 수행한 결과, 비건강군이 건강군보다 생존율이 통계적으로 유의하게 낮았다(남성 P<0.001, 여성 P=0.07). 이는 AI가 산출한 BA–CA 값이 클수록 실제 사망 위험이 증가한다는 점을 입증한 것이다.

조영민 교수(내분비대사내과)는 "이번 연구는 질병 유병 상태와 사망 정보를 동시에 학습한 최초의 트랜스포머 기반 BA 예측 모델이라는 점에서 의미가 크다"며 "AI가 개인의 건강 상태와 미래 위험을 함께 반영하는 새로운 임상 도구로 발전했다"고 평가했다.

이번 연구 결과는 의료정보학 분야의 국제학술지 'Journal of Medical Internet Research' 최근호에 게재됐다.


 


홍유식 기자의 전체기사 보기
  • 이 기사를 공유해보세요  
  • 카카오톡
  • 네이버
  • 페이스북
  • 트위치