Anthropic-xAI Colossus-1: GPU 22만 개, 월 12.5억 달러, 그리고 사용량 제한

Anthropic이 xAI의 Colossus-1 클러스터 독점 이용권 계약: GPU 22만 개, 월 12.5억 달러, Claude 사용량 제한 즉시 상향.

Anthropic-xAI Colossus-1: GPU 22만 개, 월 12.5억 달러, 그리고 사용량 제한

Anthropic가 확보한 것: Colossus 2가 아닌 Colossus 1

2026년 5월 6~7일 발표된 Anthropic–xAI 컴퓨트 파트너십을 통해 Anthropic은 테네시주 멤피스에 위치한 Colossus 1 슈퍼컴퓨터 클러스터에 독점 접근권을 확보했다 — 초기 보도 대부분이 xAI의 전체 인프라 규모와 혼동했던 바로 그 특정 자산이다. xAI는 자체 Grok 모델 훈련 및 추론을 위해 더 새로운 Colossus 2 시설을 유지하며, Anthropic은 Colossus 1 전체를 임차했다 — NVIDIA H100 약 15만 개, H200 약 5만 개, GB200 Blackwell 가속기 약 3만 개, 총 22만 개 이상의 GPU에 300MW 이상의 전력 용량이 뒷받침된다. Colossus 1과 Colossus 2의 구분은 대부분의 보도에서 빠져 있지만, Anthropic이 실제로 통제하는 범위와 xAI의 운영 스택 내에 남아 있는 범위를 정확히 파악하는 데 있어 중요한 차이다.

핵심 요약: Anthropic은 xAI의 Colossus 1 클러스터 전체를 임차했다 — 멤피스에 위치한 NVIDIA GPU 22만 개 이상(H100, H200, GB200 Blackwell)과 300MW+ 전력을 월 12억 5천만 달러에 2029년 5월까지 사용한다. xAI는 Colossus 2를 보유하며, 양측 모두 90일 사전 통보로 계약을 해지할 수 있고, Musk는 공개적으로 일방적 회수 조건을 유보해 뒀다.

xAI의 Colossus 2 구축 사양은 아직 공개된 바 없으며, xAI는 제3자에게 임대할 계획이 있다는 어떠한 신호도 보내지 않았다. Anthropic이 통제하는 것은 동일한 멤피스 데이터센터 부지 안에 세 세대의 GPU가 함께 있는 단일 시설 클러스터다. GPU 구성 비율은 워크로드 배분 측면에서 중요하다: H100과 H200이 기존 Claude 추론 워크로드의 대부분을 담당하고, GB200 Blackwell 3만 개는 와트당 처리량과 대형 모델 컨텍스트 창에 최적화된 최첨단 컴퓨트 계층을 대표한다.

Colossus 1은 원래 xAI가 멤피스에서 122일 만에 구축·가동했다 — 이 공사-운영 전환 타임라인은 2024년 업계의 주목을 받았으며, 전통적인 하이퍼스케일 일정 밖에서 대규모 GPU 인프라를 얼마나 빠르게 세울 수 있는지의 기준점이 됐다. 그 속도 우선 접근 방식은 아래 멤피스 섹션에서 다루는 환경 법규 준수 이력을 형성하기도 했다 — 122일 건설을 가능케 한 그 긴박함이 규제 절차보다 속도를 앞세운 허가 방식으로도 이어졌다.

Colossus 1 GPU 현황 — 2026년 5월 기준 Anthropic 임차
가속기 모델 추정 수량 아키텍처 메모리 구성
NVIDIA H100 SXM5 ~150,000 Hopper HBM2e / HBM3 (80 GB)
NVIDIA H200 SXM5 ~50,000 Hopper (HBM3e 변형) HBM3e (141 GB)
NVIDIA GB200 ~30,000 Blackwell HBM3e (차세대, 고대역폭)
합계 >220,000

Sources: Tom's Hardware, Latent Space

계약 조건: 월 12.5억 달러, 할인 적용 초기 구간, 그리고 90일 해지 조항

Anthropic-xAI Colossus-1: 220K GPUs, $1.25B/Month, and Rate Limits

Anthropic–xAI 협약의 재무 조건은 AI 기업 간 컴퓨트 임대 계약치고는 이례적으로 구체적이다. 2026년 5월 20일 TechCrunch 보도에 따르면, Anthropic은 Colossus 1 독점 사용료로 월 12억 5천만 달러를 xAI에 지불하며, xAI가 인프라 구축을 마무리하는 초기 두 달은 할인 요금이 적용된다. 초기 할인 구간은 계약 체결 시점에 Colossus 1이 Anthropic의 추론 워크로드에 완전히 최적화돼 있지 않았던 사정을 반영한다. 랙 구성, 네트워킹, 소프트웨어 스택을 정식 과금 전에 수 주에 걸쳐 조정해야 했다. 계약 기간은 2029년 5월까지다.

정상 요금 기준으로 연환산 계약 가치는 약 50억 달러이며, 전체 기간 누적 계약 금액은 400억 달러를 상회한다 — AI 역사상 공개된 컴퓨트 계약 중 최대 규모에 해당한다.

"Anthropic/xAI 컴퓨트 딜은 연환산 약 50억 달러 규모이며, 1~2개월 할인 적용 후 2029년 5월까지 전체 기간 기준 최대 약 400억 달러 이상에 달한다." — Latent Space AI News, 2026년 5월

90일 해지 조항은 Claude를 프로덕션 의존성으로 운영하는 모든 주체에게 가장 중요한 운영상 조건이다. 양측 모두 90일 사전 통보만으로 계약을 해지할 수 있다 — 즉 Anthropic은 단 한 개 회계 분기의 여유를 두고 대체 용량을 급히 확보해야 하는 상황에 놓일 수 있고, xAI 역시 비슷하게 짧은 통보로 월 12억 5천만 달러 이상의 수익을 회수할 수 있다. 이는 수개월의 단계적 축소 및 마이그레이션 기간이 내장된 일반적인 클라우드 공급자 SLA가 아니다. 계약 전 기간에 걸쳐 양측을 지속적인 협상 상태에 묶어두는 양방향 탈출구이며, 통상적인 다년 하이퍼스케일 계약이 제공하는 운영 확실성을 어느 쪽에도 보장하지 않는다.

Claude 추론은 5월 6~7일 발표 후 수일 내에 Colossus 1 하드웨어에서 가동됐으며, 이는 Anthropic이 배포를 사전 준비해 공개 직후 거의 즉시 프로덕션 트래픽을 라우팅할 수 있었음을 시사한다. 신속한 프로덕션 전환은 이것이 미래를 위한 용량 옵션이 아니었음을 보여준다 — 이미 실수요 압박을 받고 있던 긴급 안전판이었다.

Anthropic이 외부 컴퓨팅 인프라를 필요로 한 이유

2026년 초 Anthropic의 컴퓨팅 부족 사태는, 어떤 현실적인 내부 조달 일정도 따라잡을 수 없을 만큼 빠르게 커진 수요 증가가 직접적인 원인이었습니다. 회사의 ARR은 전년 대비 약 80배 성장했으며 — 연환산 기준 약 8,000% 증가율 — 이 속도에서는 자본이 충분한 GPU 조달 파이프라인조차 12~18개월씩 뒤처지게 됩니다. 헤드라인 규모가 아무리 크더라도, 분기 단위가 아닌 몇 주 만에 발생하는 수요 급등은 단일 장기 인프라 계약 하나로는 해결되지 않습니다.

직접적인 촉발 요인은 Claude Code였습니다. 특히 지속적인 고강도 추론 부하를 유발하는 에이전틱(agentic) 장문 컨텍스트 코딩 작업에서 개발자들 사이에 빠르게 확산되면서, 기존 계약 용량으로는 감당할 수 없는 GPU 부족을 일으켰습니다. 에이전틱 사용 사례는 용량 계획 측면에서 일반 대화형 채팅과 본질적으로 다릅니다. 사용자 한 명의 세션이 수 시간 동안 추론을 지속하며 분당 여러 번의 모델 호출을 발생시킬 수 있어, 평균 사용자 기준으로 하루치 수요를 단 한 오후의 활발한 개발 작업으로 압축해 버립니다. 이런 세션이 동시에 대규모로 실행되면, 필요한 GPU 여유 용량은 Anthropic이 이전에 최적화해 온 대화형 사용 모델 대비 비선형적으로 확대됩니다.

Anthropic에는 물론 상당한 규모의 장기 컴퓨팅 계약이 이미 체결되어 있습니다. Amazon과의 최대 5 GW 파트너십이 진행 중이며, 2026년 말까지 약 1 GW가 가동될 것으로 예상됩니다. Google 및 Broadcom과의 별도 5 GW 계약은 2027년부터 순차적으로 가동될 예정입니다. Microsoft·NVIDIA와의 300억 달러 규모 Azure 용량 파트너십, 그리고 Fluidstack과의 500억 달러 규모 구축 계획은 더욱 장기적인 수평선을 다루고 있습니다. 이를 합산하면 네 곳의 인프라 파트너에 걸쳐 수 기가와트에 달하는 약정이 확보되어 있습니다. 그러나 이 계약들의 공통점은, 2026년 1~2분기에 벌어진 용량 공백을 해소하는 데 아무런 도움이 되지 않는다는 것입니다.

장기 계약 중 가장 진척된 것은 Amazon 계약입니다. 2026년 말까지 1 GW 미만이 가동된다는 것은, 올해 후반기부터 일부 기여하고 2027년에 걸쳐 본격 확대된다는 의미입니다. Google/Broadcom 계약은 2027년이 되어야 유의미한 기여가 가능합니다. Azure와 Fluidstack은 계약 단계를 넘어 실제 운영 용량으로 전환되기까지 더 긴 시간이 걸립니다. 이 계약들이 충분한 생산 규모에 도달하기까지의 공백 — 대략 향후 12~18개월 — 을 메울 수 있는, 새 인프라를 구축하지 않고도 즉시 활용 가능한 대규모 GPU 풀은 Colossus 1이 유일합니다.

이는 계획 실패가 아니라 AI 인프라의 구조적 현실입니다. 최전선 GPU 클러스터는 계약 체결부터 생산 준비까지 12~24개월이 걸리지만, LLM 채택 곡선은 몇 주 만에 가파르게 치솟을 수 있습니다. Colossus 1 리스 계약은 Amazon과 Google 용량이 Anthropic의 수요 증가를 독자적으로 흡수할 수 있는 충분한 규모에 도달할 때까지를 잇는 브리지입니다.

개발자 관점의 변화: 사용량 제한 및 API 할당량

개발자 입장에서 Colossus 1 계약이 가져온 가장 즉각적이고 구체적인 신호는, 파트너십 발표와 동시에 공지된 사용량 제한 변경이었습니다. Claude Code의 5시간 사용 제한이 발표 시점에 Pro, Max, Team, Enterprise 전 티어에서 두 배로 늘어났습니다. Pro 및 Max 계정의 피크 시간대 스로틀링은 폐지되었습니다. Claude Opus 모델의 API 속도 제한도 계약 발효와 동시에 대폭 상향되었습니다. 이 변경 사항들은 5월 6~7일 발표 후 며칠 안에, Colossus 1 용량이 Claude 추론 트래픽에 투입되면서 즉시 적용되었습니다.

Claude Code로 활발하게 개발 중인 개발자들에게, 5시간 한도가 두 배로 늘어난 것은 기존 제한에 자주 근접하던 장시간 에이전틱 세션의 마찰을 크게 줄여 줍니다. 대규모 리팩토링, 장시간 테스트 생성, 다중 파일 컨텍스트 분석 같은 작업을 체크포인트-재시작 없이 더 길게 연속 실행할 수 있게 됩니다. 피크 시간대 스로틀링 제거는 지연 시간과 가용성 계획에서 시간대 변수를 없애 줍니다 — 자연스러운 비피크 시간대가 스케줄에 내재되지 않은 자동화 파이프라인을 운영하는 팀에게는 특히 의미 있는 단순화입니다.

Opus 속도 제한 인상은 Opus가 선호 성능 티어로 사용되는 API 연동에서 특히 중요합니다. 기존 제한을 맞추기 위해 적극적인 캐싱이나 요청 큐잉을 구현해 왔던 팀들은 이제 속도 제한에 걸리기 전까지 더 많은 여유를 확보하게 됩니다. 다만 Anthropic이 구체적인 신규 수치를 공개하지 않았다는 점에 유의하세요 — 제3자 추정치는 실제 적용 값과 차이가 있을 수 있으므로, 자신의 티어에 적용되는 실제 할당량은 대시보드와 최신 API 문서에서 직접 확인하세요.

Colossus 1 용량의 일부는 데이터 레지던시 요건이 있는 아시아 및 유럽의 엔터프라이즈 고객을 위해 별도로 할당되어 있습니다. 데이터 주권 요건이 있는 규제 산업이나 지역을 위한 서비스를 구축 중이라면, Memphis 물리 인프라 및 관련 데이터 처리 계약이 해당 관할권의 특정 기준을 충족하는지 Anthropic 엔터프라이즈 팀에 직접 확인하세요. 미국 시설과의 물리적 근접성과 데이터 레지던시 요건에 대한 계약적 준수는 별개의 사안으로, 각각 별도로 확인해야 합니다.

반환 조항: 머스크의 조건과 xAI의 동시 행보

Anthropic-xAI Colossus-1: 220K GPUs, $1.25B/Month, and Rate Limits

Anthropic–xAI 계약에는 일반적인 컴퓨트 임대 계약과 구별되는 공개 조건이 포함되어 있습니다. 엘론 머스크는 Anthropic의 AI가 "인류에 해로운 행동을 할 경우" 컴퓨트를 회수할 권리를 유보했습니다. 이 조항에 대한 구체적인 피해 기준, 판정 절차, 통보 기간, 또는 SLA에 준하는 내용은 공개된 바 없습니다. 발동 기준이 정의되지 않은 일방적 조건으로, 실제로 행사될 가능성과 무관하게 계약 측면에서 이례적인 형태입니다.

"아무도 내 악인 감지기를 울리지 않았다"고 머스크는 Anthropic 경영진에 대해 말하면서, "그들의 AI가 인류에 해로운 행동을 할 경우 컴퓨트를 회수할 권리를 유보한다"고 밝혔습니다. — Tom's Hardware 보도 기준 엘론 머스크 발언

머스크는 이번 거래를 정렬(alignment) 기반으로 설명하며, 서명 전 Anthropic 경영진과 클로드의 미션을 직접 논의했고 자신의 평가가 순수한 상업적 판단이 아닌 가치 검증이었다고 밝혔습니다. 이러한 설명이 실제 계약 조항을 반영하는지, 또는 반환 조항이 공개 발언과 동일한 형태로 서명된 계약서에 존재하는지 여부는 알려지지 않았습니다. 양측 모두 계약서를 공개하지 않았습니다. 상업적 조건은 TechCrunch 보도로 확인되었지만, 거버넌스 조항은 계약서 본문을 통해 독립적으로 검증된 바 없습니다.

클로드를 프로덕션 의존성으로 활용하는 개발자와 기업 팀에게 이 반환 조항은 표준 SLA 프레임워크가 다루지 않는 거버넌스 불확실성을 도입합니다. 일반적인 클라우드 제공업체 SLA는 가동 시간 보장, 장애 대응 일정, 다운타임 보상 메커니즘을 명시합니다. Colossus 1 계약이 추가하는 것은—적어도 공개 발언 기준으로는—주관적인 피해 평가에 근거한 일방적 발동 조건으로, 표준 90일 양방향 해지 외에 이의 절차, 통보 기간, 또는 중요성 기준이 전혀 공개되지 않았습니다. 클로드의 공급망을 평가하는 기업 법무팀은 하이퍼스케일 계약에는 없는 리스크 범주를 검토해야 합니다. 바로 운영 의존성으로서의 가치 정렬 리스크입니다.

xAI의 동시 진행된 용량 관련 행보의 시점은 주목할 만합니다. 2026년 5월 6일—Anthropic 발표와 동일한 날—xAI는 여러 Grok 4.1 Fast 모델에 대한 지원 종료 공지를 발표하며 사용자에게 5월 15일 종료까지 불과 2주의 시간만 주었습니다. 이것이 Colossus 1 용량 이전과 운영적으로 연결된 것인지—구형 모델 퇴역을 통해 서빙 용량을 확보하는—아니면 독립적인 제품 로드맵 결정인지는 확인되지 않았습니다. 인과 관계 방향과 무관하게 타이밍의 일치는 주목할 만하며, xAI 자체의 용량 포지션이 발표일 전후로 실질적으로 변화했음을 시사합니다.

Anthropic 입장에서의 구조적 우려는, 반환 조항이 실제로 행사되지 않더라도 핵심 프로덕션 의존성에 비표준적인 거버넌스 변수를 삽입한다는 점입니다. 표준 SLA 리스크는 정량화 가능합니다: 가동 시간 SLA, 보상 일정, 장애 대응 일정. 반환 조항은 정의상 정량화 불가능한 리스크를 도입합니다—머스크가 Anthropic의 AI가 정의되지 않은 피해 기준을 넘었는지 판단하는 것에 의해 발동되며, 공개된 판정 메커니즘이 없습니다. 이는 기존의 벤더 리스크 관리 프레임워크의 범위를 벗어난 리스크 범주입니다.

멤피스 시설의 환경 책임

Colossus 1에는 Anthropic의 의존도에 무시할 수 없는 리스크 요인이 되는 환경 규정 준수 이력이 문서화되어 있습니다. 멤피스 시설 전력 공급에 사용된 가스 터빈은 처음에 청정대기법(Clean Air Act) 허가 또는 필수 오염 제어 장치 없이 가동되었으며, 표준 규제 심사를 피하기 위해 "임시 발전기"로 분류되었습니다—이 명칭은 환경 분석가와 지역 주민 단체들이 이의를 제기한 바 있습니다. "임시 발전기" 분류는 알려진 규제 차익 거래 방식으로, 고배출 장비가 표준 신규 오염원 검토(New Source Review) 절차 없이 운영될 수 있게 해줍니다. 이 절차를 밟았다면 오염 제어 설비 설치와 수개월에 걸친 허가 일정이 필요했을 것입니다.

독립적인 분석에 따르면 시설 운영이 멤피스 인근 지역의 대기질 악화와 입원 환자 증가와 연관이 있는 것으로 나타났습니다. 2026년 5월 현재 EPA의 공식 집행 조치는 공개적으로 발표된 바 없습니다. 그러나 속도 우선 건설, 사후 허가 취득, 표준 심사를 우회하는 분류 선택 등 기본적인 규정 준수 태세는, 언론의 주목을 받는 고지명도·고수익 상업 계약과 연관될 때 규제 당국의 면밀한 검토를 받는 유형의 리스크입니다.

클로드를 프로덕션 의존성으로 평가하는 개발자, 그리고 ESG 공시 요건이나 기업 환경 약속에 구속되는 기업 구매자에게 이것은 즉각적인 기술적 리스크보다는 평판 및 규제 리스크 요인입니다. 리스크는 세 가지 시나리오에서 복합적으로 작용합니다: EPA 집행으로 시설 운영이 중단되는 경우; Anthropic의 인프라 선택에 대한 지속적인 공개 비판이 고객에게 브랜드 리스크를 초래하는 경우; 또는 기업 구매자 자체의 환경 약속이 허가받지 않은 가스 터빈 운영과 연관된 서비스 사용에 마찰을 일으키는 경우.

Anthropic의 입장은 구조적으로 제한되어 있습니다—Colossus 1을 건설하지도 않았고 초기 허가 태세에 책임이 없었습니다. 그러나 주요 유료 고객이 되어 월 12.5억 달러의 공개 계약을 체결함으로써, Anthropic은 계약 기간 동안 해당 책임에 대한 평판상 인접성을 수용한 셈입니다. 기업 구매 팀은 벤더 리스크 평가를 완료할 때 이를 문서화해야 합니다. 특히 조직이 Scope 3 배출 보고 대상이거나 공급망 인프라까지 확장되는 공개적인 환경 약속을 보유하고 있다면 더욱 그렇습니다.

궤도 컴퓨팅: 발표된 내용과 아직 공개되지 않은 것들

Anthropic–xAI 발표에는 미래 지향적 발언이 포함되었습니다. Anthropic은 SpaceX와 협력해 "수 기가와트 규모의 궤도 AI 컴퓨팅 용량"을 개발하는 데 관심이 있다고 밝혔습니다. 그러나 이 발언과 함께 일정, 기술 사양, 궤도 고도 체계, 열 관리 방식, 발사체 요구 사항, 연결 아키텍처 등은 일절 공개되지 않았습니다. 이는 로드맵 약속이 아닌 방향성 신호로 받아들여야 하며, 5~10년 미만의 아키텍처 결정에 반영해서는 안 됩니다.

궤도 컴퓨팅의 기술적 과제는 지상 코로케이션과 본질적으로 다르지만, Anthropic이나 SpaceX는 이에 대해 공개적으로 다룬 바가 없습니다. 저궤도에서의 전력 생산은 태양광 패널 면적과 지구 그림자 대비 궤도 위치에 의해 제한되며, 기가와트급 컴퓨팅을 제공하는 위성 클러스터를 구현하려면 대형 태양광 어레이나 핵 전원이 필요한데, 상업용 AI 추론을 위한 근시일 내 배치 경로는 어느 쪽도 명확하지 않습니다. 열 관리는 진공 환경에서 훨씬 복잡해집니다. 공기 냉각은 불가능하고, 액체 냉각 시스템은 유지보수가 불가능한 환경에서 치명적인 장애 지점이 됩니다. 게다가 한번 발사된 하드웨어는 업그레이드할 수 없어, 궤도에 진입한 GPU 세대는 자산의 운영 수명 동안 고정됩니다.

SpaceX의 Starlink LEO 콘스텔레이션은 향후 궤도 컴퓨팅 레이어를 위한 가장 현실적인 연결 백본을 제공합니다. 현재 Starlink v2는 유리한 조건에서 지상국까지 20ms 미만의 지연 시간을 지원합니다. 그러나 Starlink는 통신 네트워크일 뿐, 전력이나 컴퓨팅 네트워크가 아닙니다. 궤도 추론의 업링크·다운링크 레이어로 활용하려면 궤도 세그먼트와 지상 세그먼트 양쪽에 별도의 인프라 투자가 필요한데, 이는 아직 공개적으로 범위가 정해진 바 없습니다.

Anthropic API에 수년간 인프라 의존성을 계획하는 개발자라면, 실질적으로 운영 중인 인프라는 Colossus 1(최소 2026년 중반까지), Amazon 협약(2026년 말~2027년까지 확장), Google/Broadcom 딜(2027년부터)입니다. 궤도 컴퓨팅 발언은 Anthropic의 장기 인프라 야망과 SpaceX와의 관계를 이해하는 데 맥락적으로 유의미하지만, 현재 또는 단기 개발 작업의 계획 입력값으로는 볼 수 없습니다.

Anthropic 컴퓨팅 스택 전체: Colossus 1의 위치

Anthropic-xAI Colossus-1: 220K GPUs, $1.25B/Month, and Rate Limits

Colossus 1 임대는 Anthropic 컴퓨팅 전략에서 특정하고 시간이 한정된 위치를 차지합니다. 클라우드 제공업체 파트너십을 통해 장기적·전용 용량이 가동되기까지 2026년의 수요 급증을 메우는 브리지 역할입니다. 전체 스택에서 이것이 차지하는 위치를 이해하면, 전략적 가치와 전체 협약 포트폴리오 대비 리스크 프로파일을 명확히 파악할 수 있습니다.

Anthropic 컴퓨팅 스택 — 2026년 5월 기준 발표된 협약
파트너 발표 규모 / 가치 예상 가동 시점 스택 내 역할 주요 리스크 요인
xAI (Colossus 1) 월 $12.5억; GPU 약 22만 개; 300MW+ 2026년 5월 가동 브리지: 2026년 단기 공백 90일 해지; 회수 조항; 단일 시설; 비표준 거버넌스
Amazon AWS 최대 5GW; 2026년 말 약 1GW ~1GW 2026년 12월; 전체 미정 2026~2027년+ 주요 규모 레이어 확장 일정; 용량 경쟁
Google / Broadcom 5GW 2027년부터 2027년+ 규모 레이어 2027년까지 지연; Google이 Claude와 직접 경쟁
Microsoft / NVIDIA (Azure) $300억 약정 다년 장기 장기 이중화 긴 리드타임; Azure 벤더 의존
Fluidstack $500억 구축 다년 장기 장기 용량 다각화 최대 발표 규모; 대규모 실행 리스크
SpaceX (궤도 — 관심 표명) 수 GW (잠정) 일정 미공개 방향성 신호에 불과 기술 실현 가능성; 최소 5~10년 이상 필요

Sources: Anthropic, Latent Space

이 표는 의존성 집중 리스크를 명확히 드러냅니다. Colossus 1은 단일 시설·단일 운영사 자산으로, 비표준적인 해지 조건을 가지며, 클라우드 제공업체 SLA에서 일반적으로 기대하는 리스크 프로파일과는 거리가 있습니다. 두 번째 데이터센터도, Colossus 협약 내 지리적 이중화도, 하이퍼스케일 클라우드 제공업체가 제공하는 수준의 가동 시간 보증·장애 대응 시간·보상 체계를 갖춘 SLA도 없습니다. Amazon 용량이 확장되고 Google/Broadcom 용량이 가동되기까지 향후 12~18개월간, Anthropic의 최대 용량 자원은 동시에 가장 기존 방식으로 리스크가 분산되지 않은 자원이기도 합니다.

클라우드 제공업체, 코로케이션 운영사, 직접 경쟁사로부터의 컴퓨팅 임대까지 총 다섯 곳의 인프라 파트너를 아우르는 전체 스택의 폭은, Anthropic이 어떤 단일 협약도 지속 가능한 장기 해법으로 보지 않고 있음을 시사합니다. 이러한 다각화는 다년간 Claude 기반으로 서비스를 구축하는 개발자에게 긍정적 신호입니다. 단일 파트너 장애가 대규모 용량 사고로 이어질 리스크를 크게 줄여주기 때문입니다. 그러나 2026년이 끝나기 전까지 단기적으로는 Colossus 1이 실질적인 제약 요인입니다. Claude가 크리티컬 패스에 있다면, 정확한 의존성 모델링의 전제 조건은 해당 계약 조건·거버넌스 조건·일정을 정확히 이해하는 것입니다.

자주 묻는 질문

Anthropic이 xAI의 Colossus 2 클러스터에 접근할 수 있나요?

아닙니다. xAI는 자사의 Grok 모델 훈련 및 추론을 위해 Colossus 2를 자체적으로 운영합니다. Anthropic의 임대 계약은 Colossus 1에 한정됩니다 — 약 15만 개의 NVIDIA H100, 5만 개의 H200, 그리고 3만 개의 GB200 Blackwell 가속기로 구성되어 있으며, 총 22만 개 이상의 GPU와 300MW 이상의 전력 용량을 갖추고 있습니다. Colossus 2의 사양은 아직 공개되지 않았으며, xAI는 해당 용량을 제3자에게 임대할 의사를 밝힌 바 없습니다. 이 구분은 초기 보도 대부분에서 빠져 있지만, Anthropic이 실제로 통제하는 자원과 xAI가 Grok 개발을 위해 내부적으로 운용하는 자원을 정확히 가늠하는 데 중요합니다.

2026년 5월 Claude Code 사용량 제한은 왜 늘었나요?

Colossus 1 계약으로 즉각적인 GPU 용량이 추가 확보되었고, Anthropic은 2026년 5월 6~7일 발표 후 며칠 만에 Colossus 하드웨어에 Claude 추론을 배포했습니다. 이를 통해 Pro, Max, Team, Enterprise 플랜 전반에 걸쳐 Claude Code의 5시간 사용량 한도가 두 배로 늘었고, Pro·Max 계정의 피크 시간대 스로틀링이 제거되었으며, Claude Opus 모델의 API 사용량 한도도 대폭 상향됐습니다. 근본 원인은 Claude Code의 빠른 확산으로 에이전트형 추론 수요가 급증하면서 기존에 프로비저닝된 용량을 초과한 데 따른 급격한 GPU 부족이었습니다.

계약 종료 전에 Elon Musk가 컴퓨트를 회수할 수 있나요?

Musk가 공개적으로 밝힌 조건에 따르면 가능합니다. 그는 Anthropic의 AI가 "인류에 해를 끼치는 행위"를 할 경우 Colossus 1 컴퓨트를 회수할 권리를 보유하고 있습니다. 또한 양 당사자 모두 원인과 무관하게 90일 전 통보를 통해 계약을 해지할 수 있습니다. 회수 조건에 적용되는 공식 판정 절차, 피해 임계값 정의, 또는 별도의 통보 기간은 공개된 바 없습니다. 이 조건이 서명된 계약서에 공개된 형태 그대로 존재하는지, 아니면 실제 계약서에는 더 제한된 표현으로 기재되어 있는지도 불명확합니다 — 어느 당사자도 계약서 전문을 공개하지 않았습니다.

Memphis 시설의 환경 문제는 무엇인가요?

Colossus 1 Memphis 시설의 가스 터빈은 초기에 대기청정법(Clean Air Act) 허가나 필수 오염 방지 장치 없이 운영되었습니다. 해당 시설은 이 터빈을 "임시 발전기"로 분류해 표준 규제 심사를 회피했는데, 이 분류는 환경 분석가들로부터 이의를 받았습니다. 독립적인 분석에 따르면 시설 운영이 Memphis 인근 지역의 대기 질 악화 및 병원 입원율 증가와 연관된 것으로 나타났습니다. 2026년 5월 현재 미국 EPA의 공식 집행 조치는 공개적으로 발표된 바 없습니다. 유료 고객인 Anthropic 입장에서 이는 미해결 상태의 규제 및 평판 리스크입니다. ESG 보고 의무나 Scope 3 배출량 요건이 있는 기업 구매자는 공급업체 리스크 평가서에 이를 명시해 두어야 합니다.

Colossus 계약과 Anthropic의 Amazon·Google·Microsoft 협약은 어떻게 연결되나요?

Colossus 1 계약은 다른 협약들이 동일한 일정 안에 충족할 수 없는 단기 공백을 메웁니다. Amazon의 용량(약 1GW)은 2026년 말부터 가동을 시작하고, Google/Broadcom의 5GW 계약은 2027년에 도래하며, $300억 규모의 Azure 및 $500억 규모의 Fluidstack 투자는 운영 용량 기준으로 더욱 먼 시점에 해당합니다. Colossus 1은 지금 당장 운영 중입니다 — Claude Code 도입에 따른 급격한 수요 증가로 생긴 2026년 공백을 메우는 가교입니다. 클라우드 공급업체 스택은 기존 SLA 체계를 갖춘 장기적·지리적으로 분산된 맞춤형 인프라를 의미합니다. Colossus 1은 다변화 전략의 한 수단일 뿐, 그것을 대체하는 것이 아닙니다.

앞으로 주목할 점

Anthropic–xAI 컴퓨트 계약은 LLM 인프라 시장의 현재 상태에 대한 신호로 읽는 것이 가장 정확합니다 — 앞으로의 방향이 아닌. Anthropic 규모의 기업이 Amazon, Google, Microsoft, Fluidstack에 수십억 달러를 투자했음에도 단기 수요 급증을 감당하기 위해 직접 경쟁사로부터 컴퓨트를 임대해야 했다는 사실은, 실제 GPU 가용성이 대형 AI 인프라 계약 발표 사이클에 얼마나 뒤처져 있는지를 잘 보여줍니다. 서명된 계약과 실제 운영 용량은 다른 범주이며, 그 격차는 현재 프런티어 규모에서 수 분기에서 수 년으로 측정됩니다.

개발자와 기술 팀에게 실질적인 단기 의미는 분명합니다. Claude API 가용성과 사용량 제한이 2026년 1분기보다 구조적으로 개선되었으며, 용량은 가동 중이고 한도 상향도 적용 중입니다. 90일 해지 조항과 회수 조건은 추적하고 기록해 둘 필요가 있는 실질적인 리스크 요소입니다 — 특히 폴백 모델이 사전에 통합되지 않은 채 엄격한 가동 시간 요건을 가진 프로덕션 시스템의 공급업체 평가에서. Amazon과 Google/Broadcom의 용량이 2026~2027년에 걸쳐 순차적으로 가동되면 Anthropic의 Colossus 의존도는 점진적으로 낮아질 것입니다. 해당 용량이 운영에 투입될 때 추가적인 사용량 제한 증가나 새로운 지역 가용성 발표가 있는지 주목하세요.

궤도 컴퓨트 발언은 5년 미만의 어떤 계획 전제로도 삼기보다는 주변적 참고 사항 정도로 다루어야 합니다. Memphis 환경 컴플라이언스 이력은 시설 운영에 영향을 미칠 수 있는 집행 조치 동향을 지속적으로 모니터링할 가치가 있습니다. 그리고 경쟁 구도 — Anthropic이 Amazon, Google, Microsoft와 독자적인 용량을 구축하면서 동시에 경쟁사에게 월 $12.5억 이상을 지불하는 구조 — 는 어느 당사자도 계약이 2029년 5월에 만료되거나 90일 해지 조항이 행사되기 전까지 공개적으로 해소할 명확한 유인이 없는 구조적 긴장으로 남아 있습니다.

마지막 업데이트: 2026-05-29. 2026년 5월 29일까지 이용 가능한 보도 및 분석을 바탕으로 작성되었습니다. 계약 조건은 어느 당사자도 독립적으로 공개하지 않았으며, 재무 수치는 TechCrunchLatent Space 보도에서 인용했습니다. 역량 계획 결정을 내리기 전에 Anthropic 대시보드에서 현재 API 사용량 제한을 반드시 확인하세요.

최신 소식 받기

AI 도구, 에이전트, 그리고 이들을 잇는 프로토콜에 대한 현장 기록.

Creeta 둘러보기