[비즈니스포스트] 미국 인공지능(AI) 스타트업 앤트로픽의 차세대 AI 모델 ‘클로드 미토스 프리뷰’가 취약점을 연결해 실제 해킹 공격 가능성까지 도출하는 능력을 보인 것으로 분석됐다.
클라우드 보안·인프라 서비스 회사 클라우드플레어는 20일 미토스를 적용해 테스트한 내용을 담은 보고서를 통해 미토스의 가장 차별화된 특징으로 취약점 연계 분석 능력을 꼽았다.
| ▲ 20일 클라우드플레어가 앤트로픽의 프로젝트 글래스윙에 참여해 클로드 미토스 프리뷰를 데스트한 보고서를 발표했다. <앤트로픽> |
클라우드플레어는 다른 AI 모델들은 개별 취약점을 발견할 수 있었으나, 이를 연결해 실제 공격 가능성까지 이어내지는 못한 것으로 분석했다.
반면 미토스는 일반적으로 잘 드러나지 않는 저위험 취약점을 조합해 심각한 수준의 실제 해킹 공격 경로로 발전할 수 있는지를 증명해 내는 성능을 보인 것으로 파악됐다.
다만 미토스는 보안 정책 우회에 상대적으로 쉽게 반응하고 오탐 여부를 완전히 걸러내지 못하는 한계도 보인 것으로 분석됐다.
미토스는 테스트 과정에서 보안 정책을 이유로 일부 취약점 연구 요청을 거부했으나 분석 대상 코드 자체는 전혀 수정하지 않은 채 숨겨진 .git 폴더만 삭제하고 다시 요청하자 거부 반응을 풀고 취약점 분석을 그대로 수행했다.
클라우드플레어는 미토스가 실제 취약점과 오탐을 구분하기 위해 인간이 개입해 검토해야 하는 경우도 다수 존재했다고 밝혔다.
클라우드플레어는 앤트로픽의 프로젝트 글래스윙에 참여해 대기업과 기관 약 50곳에 제공된 클로드 미토스 프리뷰를 50여 개 자체 리포지토리에 적용한 뒤, 미토스가 찾아내는 데이터와 작동 방식을 검증했다고 설명했다.
미토스는 운영체제(OS) 보안 취약점과 결함을 탐지하는 데 그치지 않고 이를 활용해 스스로 공격 수행 능력까지 갖춘 것으로 평가된다.
지난 27년간 발견되지 않았던 보안 취약점까지 찾아낸 사실이 알려지며 보안 업계에 큰 충격을 안겼다.
앤트로픽은 파장 확산을 우려해 클로드 미토스 공개 시점을 늦추고 프로젝트 글래스윙이라는 폐쇄형 그룹을 통해 제한적으로 활용하는 방안을 택했다. 조승리 기자