프로젝트 글래스윙: 초기 업데이트
요약
앤트로픽의 '프로젝트 글래스윙'을 통해 AI 모델이 수만 건의 소프트웨어 취약점을 찾아냈지만, 이제 문제는 인간이 이 취약점들을 검증하고 패치하는 속도가 AI의 발견 속도를 따라가지 못하는 새로운 사이버 보안 과제에 직면했다는 내용이에요.
인사이트
- **AI의 폭발적인 취약점 발견 속도**: 앤트로픽의 Mythos Preview 모델은 수만 건의 고위험/치명적 취약점을 인간보다 10배 이상 빠르게 찾아내어, AI가 사이버 보안의 게임 체인저가 될 수 있음을 보여줬어요.
- **인간 중심의 패치 병목 현상**: AI가 취약점을 찾아내는 속도는 상상 이상으로 빨라졌지만, 이를 검증하고, 보고하고, 패치하는 과정은 여전히 인간의 역량에 의존해서 전체 보안 프로세스의 가장 큰 병목 현상으로 작용하고 있어요.
- **새로운 사이버 보안 시대에 대한 적응 필요성**: AI 모델의 확산으로 취약점 발견과 악용이 더 쉬워지는 만큼, 소프트웨어 개발자와 네트워크 방어자 모두 패치 주기를 단축하고, AI를 활용한 방어 도구를 적극 도입하며, 핵심 보안 통제를 강화하는 등 새로운 위협 환경에 빠르게 적응해야 해요.
왜 중요한가
AI 모델이 소프트웨어 취약점을 찾아내는 능력이 엄청나게 발전하면서, 사이버 보안 환경이 근본적으로 바뀌고 있어요. 이제 문제는 취약점을 찾는 것이 아니라, 발견된 취약점들을 인간이 제때 처리하고 패치하는 능력에 달려있죠. 이 병목 현상을 해결하지 못하면, AI가 찾아낸 수많은 취약점이 공격자들에게 악용될 수 있는 위험이 커질 거예요. 결국, AI의 강력한 능력을 방어에 효과적으로 활용하고, 새로운 위협에 맞춰 보안 전략을 전반적으로 재정비해야 하는 중요한 시점이라는 걸 알려주는 글이에요.
프로젝트 글래스윙: 초기 업데이트

지난달, 앤트로픽 팀은 갈수록 강력해지는 AI 모델들이 소프트웨어 공격에 사용되기 전에 전 세계에서 가장 중요한 소프트웨어를 안전하게 보호하려는 협력 노력인 프로젝트 글래스윙을 시작했어요.
그 이후로 앤트로픽 팀과 약 50여 개의 파트너들은 클로드 미토스 프리뷰(Claude Mythos Preview)를 사용해서 전 세계에서 가장 시스템적으로 중요한 소프트웨어에서 만 건 이상의 고위험 또는 치명적 심각도 취약점을 발견했어요. 이전에는 소프트웨어 보안 발전이 새로운 취약점을 얼마나 빨리 찾아내느냐에 따라 결정되었죠. 그런데 이제는 AI가 찾아낸 수많은 취약점을 얼마나 빨리 검증하고, 공개하고, 패치하느냐가 더 중요해졌어요.
이 글에서는 프로젝트 글래스윙이 시작된 첫 몇 주 동안 사이버 보안 분야에서 직면한 이 중요한 과제에 대해 앤트로픽 팀이 무엇을 배웠는지 이야기해 볼게요. 미토스 프리뷰의 성능에 대한 초기 공개 증거, 수천 개의 오픈소스 소프트웨어 프로젝트를 스캔한 초기 결과, 그리고 이 발전이 오늘날 사이버 방어자들에게 어떤 의미인지에 중점을 둘 거예요. 또한, 프로젝트 글래스윙의 다음 단계와 앞으로 미토스(Mythos)급 모델을 어떻게 출시할지에 대해서도 다룰 예정입니다.
초기 결과
미토스 프리뷰의 발견 사항을 논의하는 방식
소프트웨어 산업의 오랜 관행은 새로운 취약점이 발견된 후 90일 이내에 공개하는 거예요 (혹은 90일이 되기 전에 패치가 만들어지면, 패치가 출시된 후 약 45일 후에 공개하죠). 이는 공격자들이 취약점을 악용하기 전에 최종 사용자들이 소프트웨어를 업데이트할 시간을 주기 위함이에요. 앤트로픽 팀의 조정된 취약점 공개 정책도 이런 접근 방식을 따르고 있어요.
하지만 이는 공개된 취약점들이 AI 모델의 사이버 역량이 가속화되는 현 상황을 뒤늦게 보여주는 지표라는 걸 의미해요. 아직은 미토스 프리뷰로 파트너들이 발견한 모든 내용을 최종 사용자들을 위험에 빠뜨리지 않고 완전히 자세히 설명할 수 있는 시점은 아니에요. 대신, 모델 성능에 대한 예시와 지금까지의 진행 상황에 대한 총계 통계를 제공하고 있어요. 미토스 프리뷰가 발견한 취약점들에 대한 패치가 널리 배포되면, 배운 점에 대해 훨씬 더 자세한 내용을 제공할게요.
파트너 및 외부 테스터들의 증거
프로젝트 글래스윙의 초기 파트너들은 인터넷과 기타 필수 인프라의 기능에 근간이 되는 소프트웨어를 개발하고 유지보수하고 있어요. 이들의 코드에서 결함을 수정하는 것은 해당 코드에 의존하는 수많은 다른 조직들의 위험을 줄이고, 결과적으로 수십억 명의 최종 사용자들의 위험을 줄여줘요.
한 달이 지난 지금, 대부분의 파트너들은 각자 소프트웨어에서 수백 개의 치명적 또는 고위험 취약점을 발견했어요. 모두 합쳐 만 개 이상을 찾아냈고요. 몇몇 파트너는 버그 발견율이 10배 이상 증가했다고 말했어요. 예를 들어, 클라우드플레어(Cloudflare)는 핵심 시스템에서 2,000개의 버그(그중 400개가 고위험 또는 치명적 심각도)를 발견했는데, 클라우드플레어 팀은 오탐율이 인간 테스터보다 낫다고 평가했어요.
이는 미토스 프리뷰의 성능에 대한 외부 테스터들의 경험과 최근 모델에 대한 추가 평가와도 일치해요.
**영국 AI 보안 연구소(UK’s AI Security Institute)**는 보고서에서 미토스 프리뷰가 두 가지 사이버 레인지(다단계 사이버 공격 시뮬레이션)를 처음부터 끝까지 해결한 최초의 모델이라고 밝혔어요. **모질라(Mozilla)**는 미토스 프리뷰를 테스트하면서 파이어폭스 150에서 271개의 취약점을 발견하고 수정했어요. 이는 클로드 오푸스 4.6으로 파이어폭스 148에서 발견한 것보다 10배 이상 많은 수치예요. 독립 보안 플랫폼인 XBOW는 보고서에서 미토스 프리뷰가 웹 익스플로잇 벤치마크에서 “모든 기존 모델보다 상당히 발전했다”고 평가했고, 토큰 단위로는 “전례 없는 정밀도”를 제공한다고 언급했어요. 모델의 익스플로잇 개발 역량을 측정하기 위해 최근 출시된 두 가지 학술 벤치마크인 **익스플로잇벤치(ExploitBench)**는 미토스 프리뷰가 가장 강력한 성능을 보여준다고 해요. 앤트로픽 팀은 이 벤치마크들이 모델에 대해 무엇을 말해주는지 익스플로잇짐(ExploitGym) 프론티어 레드팀 블로그에서 더 자세히 다루고 있어요.
좀 더 넓은 의미에서, 패치된 소프트웨어가 훨씬 더 빠르게 배포되고 있다는 걸 확인할 수 있어요. 최근 팔로알토 네트웍스(Palo Alto Networks)의 출시에는 평소보다 5배 많은 패치가 포함되어 있었어요. 마이크로소프트는 보고서에서 앞으로 출시될 새로운 패치 수가 “당분간 계속 늘어날 것”이라고 말했어요. 그리고 오라클은 이전보다 몇 배 더 빠르게 제품과 클라우드 전반의 취약점을 찾아내고 수정하고 있고요.
미토스 프리뷰는 다른 종류의 보안 작업에서도 유용하다는 것이 입증되었어요. 예를 들어, 글래스윙 파트너 은행 중 한 곳에서는 위협 행위자가 고객의 이메일 계정을 침해하고 스푸핑 전화 통화를 한 후, 미토스 프리뷰가 150만 달러 상당의 사기성 송금 거래를 탐지하고 방지하는 데 도움을 주기도 했어요.
오픈소스 소프트웨어
지난 몇 달 동안 앤트로픽 팀은 미토스 프리뷰를 사용해서 1,000개 이상의 오픈소스 프로젝트를 스캔했어요. 이 프로젝트들은 인터넷의 많은 부분, 그리고 앤트로픽 팀의 자체 인프라의 많은 부분에 근간이 되고 있어요.
지금까지 미토스 프리뷰는 이 프로젝트들에서 고위험 또는 치명적 심각도로 추정되는 취약점을 6,202개 발견했어요 (중간 또는 낮은 심각도로 추정되는 것들을 포함하면 총 23,019개예요).
그중 고위험 또는 치명적 등급으로 평가된 1,752개의 취약점은 현재 6개의 독립 보안 연구 회사 중 한 곳이나, 소수의 경우 앤트로픽 팀이 직접 신중하게 평가를 마쳤어요. 이들 중 90.6% (1,587개)가 유효한 실제 취약점으로 판명되었고, 62.4% (1,094개)는 고위험 또는 치명적 심각도로 확인되었어요. 이는 미토스 프리뷰가 더 이상 취약점을 찾지 않는다고 해도, 현재의 트리아지 후 실제 취약점 비율을 감안하면, 오픈소스 코드에서 약 3,900개의 고위험 또는 치명적 심각도 취약점을 발견할 예정이라는 의미예요. 이는 프로젝트 글래스윙 파트너들을 위해 찾아낸 것 외에 추가되는 수치고요. 분명히 말하자면, 앤트로픽 팀은 앞으로도 한동안 오픈소스 코드를 계속 스캔할 계획이므로 이 숫자는 더 늘어날 것으로 예상하고 있어요.
미토스 프리뷰가 탐지한 오픈소스 취약점의 한 예시는 울프SSL(wolfSSL)에서 발견되었어요. 울프SSL은 보안성으로 유명하며 전 세계 수십억 개의 장치에서 사용되는 오픈소스 암호화 라이브러리예요. 미토스 프리뷰는 공격자가 인증서를 위조하여 (예를 들어) 은행이나 이메일 제공업체의 가짜 웹사이트를 호스팅할 수 있게 하는 익스플로잇을 구성했어요. 이 웹사이트는 공격자가 제어함에도 불구하고 최종 사용자에게는 완벽하게 합법적으로 보일 수 있었어요. 이제 패치된 이 취약점(CVE-2026-5194로 할당되었어요)에 대한 전체 기술 분석은 몇 주 안에 공개할 예정이에요.
위에서 언급했듯이, 이런 버그들을 수정하는 데 있어 병목 현상은 그것들을 트리아지하고, 보고하고, 패치를 설계하고 배포하는 인간의 역량에 있어요. 미토스 프리뷰 덕분에 애초에 버그를 찾는 일은 훨씬 더 간단해졌죠. 앤트로픽 팀은 아래에 스캔한 오픈소스 취약점 대시보드를 만들었어요. 이는 공개 프로세스의 다양한 단계를 보여주며 시간 경과에 따른 진행 상황을 추적할 예정이에요. 이 대시보드는 미토스 프리뷰가 처음 고위험 또는 치명적 심각도로 평가한 하위 집합뿐만 아니라 모든 심각도 수준의 취약점을 보여줍니다. 각 단계에서 급격한 감소가 보이는데, 이는 각 취약점을 검증하고 수정하는 데 필요한 인간 노력의 양을 반영하고 있어요.

앤트로픽 팀의 취약점 트리아지 프로세스는 매우 집중적이에요. 먼저, 앤트로픽 팀 또는 협력하는 외부 보안 회사 중 한 곳에서 미토스가 발견한 문제를 재현하고 심각도를 재평가해요. 취약점이 실제임을 확인하면, 이미 수정 사항이 있는지 확인하고, 소프트웨어 유지보수 담당자에게 자세한 보고서를 작성하죠. 여기서 상당한 주의를 기울여요. 오픈소스 소프트웨어 유지보수의 일반적인 어려움 외에도, 유지보수 담당자들은 품질이 낮은 AI 생성 버그 보고서의 홍수에 직면해 왔거든요. 실제로 여러 유지보수 담당자들은 현재 인력 부족으로 심각한 제약을 받고 있으며, 일부는 패치를 설계할 시간이 더 필요하다며 공개 속도를 늦춰달라고 요청하기도 했어요. (평균적으로 미토스 프리뷰가 발견한 고위험 또는 치명적 심각도 버그는 패치하는 데 2주가 걸려요.)
유지보수 담당자들의 요청에 따라, 앤트로픽 팀은 추가 평가 없이 버그를 직접 공개하기도 해요. 지금까지 앤트로픽 팀은 검증되지 않은 버그 1,129개를 보고했는데, 이 중 미토스 프리뷰는 175개가 고위험 또는 치명적 심각도라고 추정했어요.
앤트로픽 팀은 지금까지 유지보수 담당자들에게 530개의 고위험 또는 치명적 심각도 버그를 공개했다고 추정하고 있어요. 이는 직접 공개의 경우 클로드의 심각도 평가를 기반으로 하고, 가능한 경우 유지보수 담당자나 보안 파트너의 평가를 기반으로 해요. 같은 방식으로 고위험 또는 치명적 심각도로 추정되는 827개의 추가 확인된 취약점은 최대한 빨리 공개하는 것을 목표로 하고 있어요.
앤트로픽 팀이 보고한 530개의 고위험 또는 치명적 심각도 버그 중 75개는 현재 패치되었고, 그중 65개는 공개 권고가 발행되었어요. 패치 수가 아직 상대적으로 적은 이유는 세 가지예요. 첫째, 앤트로픽 팀의 조정된 취약점 공개 정책에 명시된 90일 기간의 초기 단계에 있기 때문에 곧 더 많은 패치가 나올 것으로 예상하고 있어요. 둘째, 일부 취약점은 공개 권고 없이 패치되기 때문에 패치 수를 과소평가하고 있을 가능성도 있어요. 그런 경우, 앤트로픽 팀은 클로드를 사용해서 직접 패치를 스캔하는 데 의존하고 있어요. 셋째, 적은 패치 수는 실제 문제를 반영하는데, 앤트로픽 팀이 상대적으로 느린 공개 속도를 유지하고 있음에도 불구하고, 미토스 프리뷰는 이미 과부하 상태인 보안 생태계에 부담을 더하고 있어요.
취약점을 찾는 것의 상대적 용이성과 이를 수정하는 것의 어려움은 사이버 보안에 있어 큰 과제로 다가오고 있어요. 이 과제를 성공적으로 해결하면 소프트웨어가 이전보다 훨씬 더 안전해질 거예요. 아래에서는 사이버 방어자들이 어떻게 적응할 수 있는지 몇 가지 방법을 논의해 볼게요.
새로운 사이버 보안 단계에 적응하기
미토스 프리뷰와 비슷한 사이버 보안 능력을 가진 모델들이 곧 더 널리 보급될 거예요. 이러한 모델들이 생성할 수많은 발견들을 관리하기 위해 소프트웨어 산업 전반에 걸쳐 더 큰 노력이 필요한 것이 분명하죠.
현재 취약점 발견, 패치 생성, 그리고 최종 사용자들에 의한 패치 광범위 배포 사이에는 종종 긴 지연이 발생해요. 이는 공격자들이 중요한 소프트웨어를 악용할 수 있는 상당한 시간적 여지를 남기죠. 미토스급 모델들은 취약점을 찾고 악용하는 데 필요한 시간과 비용을 크게 줄여서, 이러한 시간 지연과 관련된 위험을 증폭시켜요. 궁극적으로 미토스급 모델들은 개발자들이 버그가 배포되기 전에 잡아냄으로써 훨씬 더 안전한 소프트웨어를 구축할 수 있도록 도울 거예요. 하지만 취약점이 빠르게 발견되고 느리게 패치되는 이 중간 기간은 새로운 위험을 안겨줘요.
소프트웨어 개발자와 사용자들은 이러한 위험에 대한 노출을 줄이기 위해 지금 행동해야 해요. 아래 조언은 새로운 것이 아니며, 많은 연구자들(앤트로픽 팀 포함)이 현재 더 좋고 지속적인 해결책을 연구하고 있어요. 그동안 기본적인 사항들을 제대로 지키는 것이 중요합니다.
소프트웨어 개발자들은 패치 주기를 단축하고 보안 수정 사항을 가능한 한 빨리 제공해야 해요. 공개적으로 사용 가능한 AI 모델을 신중하게 사용하면 도움이 될 수 있어요. 앤트로픽 팀은 이를 지원하기 위해 도구를 구축하고 연구를 공유하고 있어요 (자세한 내용은 아래 참조). 개발자들은 또한 업데이트를 가능한 한 쉽게 설치할 수 있도록 해서 사용자들이 소프트웨어를 최신 상태로 유지하도록 도와야 하고요. 가능한 한, 알려진 취약점이 있는 소프트웨어를 계속 실행하는 사용자들에게는 더 끈질기게 업데이트를 요청해야 해요. 네트워크 방어자들은 패치 테스트 및 배포 시간을 단축해야 해요. 국립 표준 기술 연구소(National Institute of Standards and Technology)나 영국 국가 사이버 보안 센터(National Cyber Security Centre)와 같은 조직이 제시하는 핵심 제어 수단들은 이제 그 어느 때보다 중요해요. 이는 제때 도착하는 특정 패치에 의존하지 않고도 보안을 개선하기 때문이죠. 여기에는 네트워크의 기본 구성을 강화하고, 다단계 인증을 강제하며, 탐지 및 대응을 위한 포괄적인 로그를 유지하는 등의 단계가 포함됩니다.
공개적으로 사용 가능한 AI 모델을 활용한 사이버 방어 도구
많은 범용 AI 모델들도 이미 수많은 소프트웨어 취약점을 찾아낼 수 있어요. 클로드 미토스 프리뷰처럼 가장 정교한 취약점을 찾거나 효과적으로 악용하지는 못하더라도 말이죠. 프로젝트 글래스윙은 이미 다른 많은 조직들이 이러한 범용 모델들을 사용해서 자체 코드베이스에 대해 조치를 취하도록 자극했어요. 앤트로픽 팀은 이 작업을 훨씬 쉽게 만들려고 노력하고 있어요.
시작으로, 앤트로픽 팀은 클로드 엔터프라이즈(Claude Enterprise) 고객을 위한 클로드 시큐리티(Claude Security)를 공개 베타로 출시했어요. 이는 팀이 코드베이스에서 취약점을 스캔하고 제안된 수정 사항을 생성하는 데 도움이 되는 도구예요. 출시 이후 3주 동안 클로드 오푸스 4.7은 2,100개 이상의 취약점을 패치하는 데 사용되었어요. (이는 위에서 설명한 오픈소스 패치보다 빠른 속도인데, 기업들은 자체 코드를 수정하는 반면, 오픈소스 수정은 일반적으로 조정된 공개를 통해 작업하는 자원봉사 유지보수 담당자가 필요하기 때문이에요.)
또한 앤트로픽 팀은 사이버 검증 프로그램(Cyber Verification Program)을 시작했어요. 이를 통해 보안 전문가들은 합법적인 사이버 보안 목적(예: 취약점 연구, 침투 테스트 및 레드팀)으로 앤트로픽 팀의 모델을 사용할 때 사이버 오용을 방지하기 위한 특정 보호 장치 없이 사용할 수 있어요.
이제 앤트로픽 팀과 파트너들이 미토스 프리뷰와 함께 사용했던 도구들을 요청하는 자격 있는 고객의 보안 팀에 제공하고 있어요. 목표는 광범위한 설정 없이도 고성능 공개 모델에서 최고의 성능을 훨씬 쉽게 얻을 수 있도록 하는 거예요. 이 릴리스에는 다음이 포함됩니다.
- 앤트로픽 팀과 파트너들이 구축하고 공유한 스킬(skills) (반복 작업을 위한 사용자 지정 지침)
- 클로드가 코드베이스를 매핑하고, 스캔 서브 에이전트를 가동하고, 발견 사항을 트리아지하고, 보고서를 작성하는 데 도움이 되는 하네스
- 코드베이스를 매핑하여 공격의 잠재적 대상을 식별하고 이에 따라 모델의 작업을 우선순위화하는 위협 모델 빌더
프로젝트 글래스윙 파트너 중 하나인 시스코(Cisco)도 최근 파운드리 시큐리티 스펙(Foundry Security Spec)을 오픈소스로 공개하여 다른 방어자들이 자체적으로 사용하는 것과 유사한 평가 시스템을 구축하는 데 도움을 주고 있어요.
생태계 지원
앤트로픽 팀은 오픈소스 보안 재단의 알파-오메가(Alpha-Omega) 프로젝트와 파트너십을 맺었어요. 이는 유지보수 담당자들이 버그 보고서를 처리하고 트리아지하는 노력을 지원할 예정이에요. 또한, 프론티어 모델의 역량이 사이버 방어자들을 가장 잘 지원할 수 있는 방법에 대한 연구도 계속 발표하고 있어요.
앤트로픽 팀은 익스플로잇벤치(ExploitBench)와 익스플로잇짐(ExploitGym) 개발을 지원했어요. 이 두 가지 새로운 벤치마크는 연구자들이 시간 경과에 따른 프론티어 AI 모델의 익스플로잇 개발 역량을 추적할 수 있도록 해주며, 이에 대한 내용은 여기에서 자세히 다루고 있어요. 외부 연구자 접근 프로그램(External Researcher Access Program)을 통해서도 다른 고품질 정량적 벤치마크 개발을 지원하고 있어요. 마지막으로, 오픈소스를 위한 클로드(Claude for Open Source)는 유지보수 담당자와 기여자들을 지원하며, 앤트로픽 팀은 앞으로 직접 채택할 모든 오픈소스 패키지를 스캔하기로 약속했어요.
프로젝트 글래스윙의 다음 단계
AI 발전 속도가 워낙 빨라서 미토스 프리뷰와 같은 역량을 가진 모델들이 곧 많은 AI 회사에 의해 개발될 거예요. 현재 앤트로픽 팀을 포함한 어떤 회사도 그러한 모델들이 오용되고 잠재적으로 심각한 해를 끼치는 것을 막을 만큼 강력한 보호 장치를 개발하지 못했어요. 그래서 앤트로픽 팀은 아직 미토스급 모델을 일반에 공개하지 않고 있어요. 하지만 이것이 바로 프로젝트 글래스윙을 시작한 이유이기도 해요. 만약 비슷한 역량을 가진 모델이 그러한 보호 장치 없이 출시된다면, 전 세계 거의 모든 사람이 결함 있는 소프트웨어를 악용하는 것이 극적으로 저렴하고 쉬워질 것이기 때문이죠.
글래스윙은 가장 시스템적으로 중요한 사이버 방어자들이 비대칭적 우위를 확보하는 데 도움을 줘요. 하지만 가능한 한 많은 조직이 사이버 방어를 강화해야 할 긴급한 필요가 있어요. 앤트로픽 팀의 범용 모델과 함께 제공되는 새로운 도구, 리소스 및 연구가 이러한 조직들이 사이버 보안 태세를 개선하는 데 도움이 되기를 바랍니다.
다음으로, 앤트로픽 팀은 미국 및 동맹국 정부를 포함한 핵심 파트너들과 협력하여 프로젝트 글래스윙을 추가 파트너에게 확장할 거예요. 그리고 가까운 미래에는 필요한 훨씬 더 강력한 보호 장치를 개발한 후, 일반 출시를 통해 미토스급 모델을 제공할 수 있기를 기대하고 있어요.
이러한 위험 너머에는 우리에게 고무적인 세상이 기다리고 있어요. 중요한 코드가 오늘날보다 훨씬 더 잘 강화되고, 해킹이 훨씬 덜 만연한 세상 말이죠. 많은 장애물이 있지만, 앤트로픽 팀은 프로젝트 글래스윙이 우리를 그곳으로 이끄는 데 도움이 될 것이라고 확신합니다.
관련 콘텐츠
2028년: 글로벌 AI 리더십의 두 가지 시나리오
미국과 중국 간의 AI 경쟁에 대한 앤트로픽 팀의 견해예요.
자연어 오토인코더: 클로드의 생각을 텍스트로 전환하기
클로드와 같은 AI 모델은 단어로 말하지만 숫자로 생각해요. 이 연구에서 앤트로픽 팀은 클로드가 자신의 생각을 사람이 읽을 수 있는 텍스트로 번역하도록 훈련하고 있어요.