Korean Post

재외국민 뉴스채널 인터넷신문등록번호 경기 아 54541

Advertisement

의료 인공지능에 ‘블랙박스’ 표준 등장…AI 신뢰성·감사체계 새 전기

의료 인공지능(AI)의 사용 이력과 작동 과정을 투명하게 기록하기 위한 국제 표준 논의가 본격화되고 있다. 최근 미국 주요 연구기관 전문가들이 공동으로 의료용 AI 활동로그 표준 포맷 ‘MedLog’를 제안했다.
이 표준은 AI가 언제, 어디서, 누구에 의해, 어떤 환자를 대상으로 어떤 데이터를 처리했는지를 일관된 형식으로 남기는 규격으로, 사실상 의료 AI의 ‘블랙박스’를 만들자는 취지다.

현재 전 세계 병원들이 대규모 언어모델(LLM)과 AI 기반 의사결정 지원 시스템을 빠르게 도입하고 있지만, 실제 임상현장에서 이들이 어떤 데이터를 어떻게 사용했는지를 공통 규격으로 기록할 프로토콜이 부재하다. 이로 인해 ▲AI의 실사용 성능(real-world performance)과 임상 결과(outcomes) 평가 불가 ▲오류·편향·데이터 드리프트 탐지 불가 ▲감사 및 감독의 불투명성 등이 지속적으로 지적돼 왔다.

연구진이 제시한 MedLog는 기존 시스템 로그 표준인 syslog(RFC 5424)와 유사한 구조를 갖는다. AI가 동작할 때마다 **‘MedLog record’**라는 표준화된 기록을 자동 생성하며, ▲헤더(Header) ▲모델 인스턴스 ▲사용자 신원(User identity) ▲대상 신원(Target identity) ▲입력값(Inputs) ▲내부 산출물(Internal artifacts) ▲출력값(Outputs) ▲임상 결과(Outcomes) ▲사용자 피드백(User feedback) 등 9개 핵심 필드로 구성된다.

MedLog는 이벤트 발생 시점마다 로그가 순차적으로 쌓이는 점진적(incremental) 구조를 채택했다. 시스템 장애가 발생하더라도 일부 로그를 확보할 수 있도록 설계됐으며, **위험 기반 샘플링(risk-based sampling)**과 수명주기 기반 보존정책, 쓰기 후 캐싱(write-after caching) 기능을 포함해 저자원 환경에서도 활용할 수 있게 했다.

이 움직임은 EU AI Act가 활동로그 기록을 의무화한 조항을 포함한 것과 궤를 같이한다. 국제표준화기구(ISO)도 이에 맞춰 ‘AI 시스템 로깅 표준(ISO/IEC 24970)’을 개발 중이다. 전문가들은 MedLog가 향후 FHIR(의료데이터 교환표준), OpenTelemetry(분산 추적 표준), PROV-O(데이터 계보 표현 표준) 등과 연계되며 국제 상호운용성 표준으로 확장될 가능성이 크다고 본다.

다만 연구진은 입력·출력 로그가 모델 도용이나 멤버십 공격에 악용될 위험도 존재한다고 지적했다. 이에 따라 보안 기술과 데이터 거버넌스 체계 확립이 병행돼야 한다는 의견도 제시됐다.

업계에서는 MedLog가 각국의 병원과 규제기관에서 시범 도입될 경우, 의료 AI의 실시간 감사·검증·성능평가 인프라로 자리 잡을 것으로 보고 있다.
AI의 투명성과 안전성을 강화하려는 글로벌 규제 흐름 속에서, 한국 의료계 역시 의료 AI 활동기록 표준화를 선제적으로 논의할 필요성이 커지고 있다.

댓글 남기기

Korean Post에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기