Anthropic은 2026년 5월 28~29일 7.5시간 이내에 Python SDK를 연속 세 버전 — v0.105.0부터 v0.105.2까지 — 릴리스했습니다 . Claude Opus 4.8 출시에 맞춘 일정이었습니다. 개발자가 체감하는 변경 사항은 첫 번째 버전에만 담겨 있습니다: Opus 4.8 타입 지원, 대화 중간 시스템 블록, 더 세분화된 출력 사용량 보고, Files API의 커스텀 파일 크기 오버라이드. 이후 두 패치는 PyPI 배포 관련 CI 문제를 수정했습니다. 무엇이 바뀌었는지, 그리고 코드베이스에서 어떤 조치가 필요한지 살펴보겠습니다.
릴리스 3개, 7.5시간: v0.105 시퀀스 한눈에
v0.105.0이 핵심입니다. 5월 28일 UTC 16:52에 커밋 43b5b1f로 배포되었으며 , 개발자 대상 변경 사항 4가지가 담겨 있습니다. 이후 릴리스는 모두 인프라 수정이었습니다.
output_tokens_details, 커스텀 파일 크기 오버라이드 — 는 모두 v0.105.0에 포함되어 있습니다. 이후 두 패치는 SDK 표면 변경 없이 PyPI Trusted Publishing만 수정했습니다.
| 릴리스 | 시간 (UTC) | 변경 사항 |
|---|---|---|
| v0.105.0 | 5월 28일, 16:52 | Opus 4.8 모델 리터럴, 대화 중간 시스템 블록, output_tokens_details, 커스텀 파일 크기 상한 오버라이드 |
| v0.105.1 | 5월 29일, 00:07 | GitHub Actions OIDC를 통한 PyPI Trusted Publishing — SDK API 변경 없음 |
| v0.105.2 | 5월 29일, 00:20 | Trusted Publishing 마이그레이션을 위한 패키징 수정 — SDK API 변경 없음 |
v0.105.1과 v0.105.2의 간격은 13분입니다 . v0.105.2의 변경 로그가 비어 있다는 점에서, Trusted Publishing 업로드가 정상적으로 완료되기 위해 pyproject.toml 또는 워크플로 YAML을 수정한 것임을 확인할 수 있습니다. 두 버전 간 SDK 동작 차이는 없습니다. 0.105.2로 고정하세요.
대화 중간 시스템 블록 작동 방식
Messages API는 이제 최상위 system 파라미터뿐 아니라 messages 배열 내부에서도 system 역할 항목을 허용합니다. 덕분에 세션 상태를 초기화하거나 메시지 기록을 재전송하지 않고도 대화 중 어느 시점에서나 지침을 갱신할 수 있습니다.
"시스템 항목이 이제 mid-task 지침 업데이트를 위해 messages 배열 내에서 허용됩니다." — Anthropic 플랫폼 문서 (source: platform.claude.com)
이 변경은 장기 실행 에이전트 작업에서 가장 중요한 SDK 개선입니다. Claude Code의 Dynamic Workflows 기능(리서치 프리뷰)은 단일 세션 내 수백 개의 병렬 서브에이전트를 지원합니다 . 실행 도중 요구 사항이 바뀌거나 — 새로운 제약 조건, 목표 재우선순위 — 세션 상태를 해제하지 않고 시스템 지침을 갱신할 수 있습니다.
마이그레이션 파손 없음. 최상위 system 파라미터는 기존과 동일하게 작동합니다. messages 배열 형식은 순수하게 추가적인 기능입니다.
SDK 속 claude-opus-4-8: 타입 스텁과 IDE 자동 완성
커밋 f18b014는 claude-opus-4-8를 SDK 타입 스텁 및 내부 라우팅에 유효한 모델 리터럴로 등록합니다 . SDK v0.104.1 이하에서는 문자열을 타입 미지정 원시 리터럴로 전달해 해당 모델을 여전히 호출할 수 있으며 — REST API는 이를 수락합니다 — 다만 IDE 자동 완성과 타입 검증은 동작하지 않습니다.
모델 문자열: claude-opus-4-8. 날짜 접미사 불필요. Claude API, Bedrock, Vertex 라우팅 모두 동일합니다.
두 모델이 확정된 종료일과 함께 공식 지원 중단 예정입니다 :
claude-sonnet-4-20250514— 2026년 6월 15일 종료claude-opus-4-20250514— 2026년 6월 15일 종료
해당 모델을 사용 중이라면 지금 바로 마이그레이션하세요. 3주는 프로덕션 서비스에 매우 짧은 기간입니다.
더 세분화된 출력 사용량 보고
v0.105.0은 usage.output_tokens_details를 추가하여 SDK의 3계층 토큰 보고 구조를 완성합니다 :
- 입력 레이어:
input_tokens_details— 캐시 히트/미스 분류 (기존) - 추론 레이어:
thinking_token_count베타 — v0.104.0에서 도입 - 출력 레이어:
output_tokens_details— v0.105.0에서 신규 추가
output_tokens_details의 하위 필드 스키마는 아직 변경 로그에 문서화되지 않았습니다. 지금 비용 대시보드 파서에 이 필드를 추가하고, 스키마가 안정화될 때까지 원시 객체를 로그로 남기세요. 이 필드는 순수하게 추가적이므로 기존 응답 파서는 영향을 받지 않습니다.
문서 업로드 시 커스텀 파일 크기 제한
PR #1825를 통해 개발자는 Files API로 업로드할 때 호출별로 파일 크기 오버라이드를 전달할 수 있습니다 . 이전에는 대용량 페이로드 — 법률 문서, 연구 코퍼스, 대규모 코드베이스 — 를 처리하려면 SDK 내부 크기 상수를 몽키 패치해야 했습니다. 오버라이드는 호출별로만 적용되며, SDK 수준의 기본값은 변경되지 않습니다.
현재 파이프라인에서 파일 크기 상수를 몽키 패치하고 있다면, 0.105.2로 업그레이드한 후 패치를 제거하고 공식 파라미터를 사용하세요. 기존 방식은 향후 SDK 내부와 충돌할 수 있습니다.
Opus 4.8: effort 파라미터, 적응형 사고, 플랫폼 지원 범위
Claude Opus 4.8 (claude-opus-4-8)은 2026년 5월 28일 Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry 등 네 개 플랫폼에 출시되었습니다. Foundry의 컨텍스트 상한은 200k 토큰이며, 나머지 플랫폼은 1M 토큰과 최대 128k 출력을 지원합니다 .
Claude Opus 4.8은 SWE-Bench Pro에서 69.2%를 기록하며 GPT-5.5와 Gemini 3.1 Pro를 앞질렀습니다 . — Anthropic 벤치마크 (source: Decrypt, May 2026)
| 모드 | 속도 | 입력 | 출력 | 컨텍스트 |
|---|---|---|---|---|
| 스탠다드 | 기준 | $5 / 1M 토큰 | $25 / 1M 토큰 | 1M 토큰 (Foundry는 200k) |
| 패스트 | 약 2.5× | 이전 Opus 패스트 비용의 약 ⅓ | 이전 Opus 패스트 비용의 약 ⅓ | 동일 |
effort 파라미터는 모든 환경에서 기본값이 high입니다. 이는 숨겨진 비용 함정입니다. 이전 Opus 모델을 타겟으로 작성된 코드는 명시적인 오버라이드 없이 자동으로 최대 effort로 실행됩니다. 비용과 지연 시간을 줄이려면 effort='low' 또는 effort='medium'을 명시적으로 설정하세요.
Opus 4.8에는 적응형 사고(adaptive thinking)가 적용되며, 확장 사고(extended thinking)는 지원하지 않습니다. Opus 4.5와 4.6은 별도의 thinking 블록을 사용했지만, Opus 4.8은 해당 구성을 지원하지 않습니다. 코드에서 thinking config 객체를 전달하고 있다면, 새 모델에 배포하기 전에 동작을 충분히 검증하세요.
PyPI Trusted Publishing: 저장된 시크릿 제거
v0.105.1은 장기 유효 PyPI API 토큰 업로드 방식을 GitHub Actions OIDC 기반 Trusted Publishing으로 대체했습니다 . 릴리스 파이프라인에서 저장된 시크릿을 제거한 것은 단순한 프로세스 변경이 아니라 공급망 보안을 실질적으로 강화한 조치입니다.
v0.105.2는 13분 후 빈 변경 이력과 함께 출시되었습니다 . 이는 PyPI 업로드 성공을 위해 필요했던 패키징 메타데이터 수정으로 볼 수 있습니다. 0.105.1과 0.105.2 사이에 SDK API 상의 차이는 없으며, 안정 버전으로 0.105.2를 고정해 사용하세요.
자주 묻는 질문
claude-opus-4-8을 호출하려면 반드시 v0.105로 업그레이드해야 하나요?
꼭 그렇지는 않습니다. SDK v0.104.1 이하에서도 "claude-opus-4-8"을 타입 없는 문자열 리터럴로 전달하면 REST API가 이를 수락합니다. 다만 IDE 타입 자동 완성과 유효성 검사를 활용할 수 없습니다. Opus 4.8을 대상으로 하는 프로덕션 코드라면 0.105.2로 업그레이드하는 것을 권장합니다. 두 단계 업그레이드 비용은 미미하지만, 타입 안전성에서 얻는 이점은 그렇지 않습니다.
Opus 4.8에서 effort 파라미터의 기본값은 무엇이며, 어떻게 변경하나요?
Claude API, Claude Code, Amazon Bedrock, Google Vertex AI 등 모든 환경에서 기본값은 high입니다. API 호출 시 effort='low' 또는 effort='medium'을 명시적으로 전달하면 추론 깊이를 줄이는 대신 지연 시간과 비용을 낮출 수 있습니다. 이전 Opus 가격과 지연 기준으로 비용 모델을 구성한 경우, effort 값을 명시하지 않고 Opus 4.8에 배포하기 전에 전제 조건을 다시 검토하세요.
대화 중간의 시스템 블록은 최상위 system 파라미터와 어떻게 다른가요?
최상위 system 파라미터는 대화 시작 시 한 번 설정되어 전체 세션에 일괄 적용됩니다. 대화 중간의 시스템 블록은 messages 배열 내 임의 위치에 system 역할 항목을 삽입할 수 있어, 대화 상태를 초기화하거나 메시지 이력을 재생하지 않고도 지침을 업데이트할 수 있습니다. 두 방식 모두 유효합니다. messages 배열 방식은 순수하게 추가적(additive)이므로, 마이그레이션 작업이나 기존 동작 변경은 필요하지 않습니다.
Anthropic이 하룻밤에 SDK를 세 번 릴리스한 이유는 무엇인가요?
v0.105.0이 네 가지 개발자 대상 변경 사항을 모두 담은 실질적인 릴리스였습니다. v0.105.1은 GitHub Actions OIDC를 통한 PyPI Trusted Publishing으로 배포 파이프라인을 전환했습니다. v0.105.2는 해당 전환 과정에서 즉시 드러난 워크플로 또는 패키징 문제를 수정한 것으로, 빈 변경 이력과 v0.105.1로부터 13분이라는 짧은 간격이 그 증거입니다. 마지막 두 릴리스는 SDK API 변경을 포함하지 않으며, 배포 자동화 인프라에 대한 수정 조치였습니다.
Opus 4.8 스탠다드 모드와 패스트 모드의 비용 차이는 어느 정도인가요?
스탠다드 모드는 입력 $5/M 토큰, 출력 $25/M 토큰입니다 . 패스트 모드는 약 2.5배 빠른 속도로 동작하며, 이전 Opus 패스트 모드 비용의 약 3분의 1 수준입니다. 패스트 모드의 토큰당 요금은 변경될 수 있으므로, 비용 예산을 확정하기 전에 Anthropic 요금 페이지에서 최신 수치를 확인하세요.
앞으로 주목할 것들
이번 릴리스 사이클에서 아직 열린 질문이 두 가지 있습니다. output_tokens_details 하위 필드 스키마는 문서화되지 않은 상태입니다. 프로덕션 파서에서 특정 하위 필드에 의존하기 전에 SDK CHANGELOG의 후속 항목을 확인하세요. v0.105.2의 결함 설명도 아직 공개되지 않았습니다. Anthropic의 릴리스 툴링을 미러링하거나 감사하는 경우, 커밋 이력에서 워크플로 YAML diff가 공개되는 시점을 확인하세요.
Anthropic은 향후 몇 주 안에 "Mythos급 모델"을 출시할 예정이라고 언급했지만 , 공개 사양은 아직 없습니다. 이번 출시를 둘러싼 SDK의 빠른 패치 주기를 감안하면, 해당 모델이 출시될 때도 촉박한 릴리스 일정이 반복될 가능성이 높습니다. 고정된 의존성 버전과 명확한 업그레이드 체크리스트를 미리 준비해두면 그 시점의 마찰을 줄일 수 있습니다.
최종 업데이트: 2026-05-29. SDK 릴리스 노트 및 2026년 5월 29일 기준 CHANGELOG를 바탕으로 작성되었습니다.



