규정 준수에 민감한 평가에서는 조용히 재시도하는 대신 잘림 현상을 사람에게 에스컬레이션하는 방식으로 표면화해야 합니다 — 동일한 상한에 계속 부딪히는 루프는 완료된 분석과 동등하지 않습니다.
output_tokens_details는 청구되는 output_tokens 수치와 어떤 관계가 있나요?
output_tokens는 포괄적이고 청구 기준이 되는 최종 합계이며, output_tokens_details의 어떤 내용에 의해서도 변경되지 않습니다. output_tokens_details 필드는 가시성을 위한 읽기 전용 분해 정보로, 동일한 합계를 두 가지 구성 요소로 나눕니다 — 내부 확장 사고에 소비된 토큰과 응답 화면에 나타나는 토큰입니다. 두 구성 요소를 합치면 output_tokens와 같아지며, 이는 그 안에서의 가산이지 추가 합산이 아닙니다. 청구 계산에서 어떤 구성 요소도 빼지 마십시오. output_tokens가 비용 회계 및 속도 제한 추적을 위한 유일한 공식 수치입니다. 이 분해 정보는 해당 토큰이 어디에 사용되었는지 알려주는 것이지, 청구되는 수량을 조정하는 것이 아닙니다.
v0.105.0은 기존 멀티턴 대화 코드와 하위 호환되나요?
네. v0.105.0의 모든 추가 사항은 선택적이며 부가적입니다. BetaMessageParam.role이 "system"을 포함하도록 확장된 것은 하위 호환됩니다 — "user"와 "assistant"는 여전히 완전히 유효하며, 기존 메시지 배열을 수정할 필요가 없습니다. 어드바이저 블록의 새로운 stop_reason 필드는 Optional[str]로 타입이 지정되어 있어, 이를 확인하지 않는 코드도 변경 없이 계속 작동합니다. 사용량 응답의 새로운 output_tokens_details 필드 역시 선택적이며 부가적입니다. 이번 릴리스에서 기존 매개변수는 이름이 변경되거나 제거되지 않았습니다. 패치 릴리스 v0.105.1과 v0.105.2는 2026년 5월 29일에 출시되었으며 — v0.105.1은 CI/CD 출처 증명을 위해 PyPI 릴리스를 신뢰할 수 있는 퍼블리싱으로 전환했고, v0.105.2는 작성 시점에 공개된 상세 변경 로그가 없었습니다.
대화 중 제약 블록을 사용하려면 반드시 Claude Opus 4.8이 필요한가요?
아닙니다. BetaMidConversationSystemBlockParam은 Beta Messages API 표면의 일부이며 특정 모델 버전에 제한되지 않습니다. 이는 모델 문자열이 아닌 API 호출의 베타 플래그(예: betas=["mid-conversation-system-blocks-2026-05-20"])로 제어됩니다. Claude Opus 4.8은 이번 릴리스의 별도 추가 사항으로, BetaManagedAgentsModel에 타입 상수로 추가되었으며 대화 중 블록 기능과는 독립적입니다. 베타 플래그를 지원하는 다른 모델 버전에서도 대화 중 제약 블록을 사용할 수 있으며, 대화 중 블록 없이도 Opus 4.8을 사용할 수 있습니다. 두 기능은 같은 릴리스를 공유하지만 서로 의존성이 없습니다.
v0.105.0이 에이전틱 파이프라인에 의미하는 것
이번 업데이트에서 가장 중요한 변화는 대화 중 시스템 블록입니다 — 기술적 복잡성 때문이 아니라, 프롬프트 캐싱이 도입된 이래 멀티턴 에이전틱 아키텍처에 존재해 온 구조적 비효율성을 해결하기 때문입니다. 캐시를 무효화하지 않고 대화의 어느 지점에서나 시스템 레벨 제약을 주입할 수 있는 기능은 장기 실행 에이전트에서 동적 명령 관리의 경제성을 바꿉니다. 규정 준수에 민감하거나 멀티테넌트 에이전틱 시스템을 구축하는 팀은 이제 아키텍처 우회 방법이나 사전 제약 열거 없이 세션별 제약 적용을 위한 더 깔끔한 경로를 갖게 됩니다.
Opus 4.8 업그레이드는 대부분의 팀에게 더 즉각적이고 손쉬운 이점입니다. BetaManagedAgentsModel의 모델 문자열을 업데이트하면 에이전틱 코딩 벤치마크에서 약 5퍼센트 포인트를 향상시키고 추가 비용은 없습니다. output_tokens_details 필드는 확장 사고를 사용하는 기존 청구 또는 가시성 파이프라인에 추가할 가치가 있으며 — 계측 비용 없이 분해된 비용 가시성을 제공합니다. 어드바이저 stop_reason 필드는 어드바이저 도구 패턴을 사용하는 프로덕션 파이프라인에 이미 존재하는 무성 실패 모드를 해결합니다. 몇 줄의 코드만 추가하면 안전에 민감한 평가 흐름에서 위험을 의미 있게 줄일 수 있습니다.
업로드 크기 상한과 샌드박스 이름 변경은 범위가 더 좁습니다. 업로드 상한은 특히 문서 처리 파이프라인에 관련이 있으며, 샌드박스 이름 변경은 CMA 런북을 보유한 팀의 레이블 정리 사항입니다. Anthropic은 사이버보안 승인 대기 중에 더 높은 역량 상한을 갖는 Mythos급 모델이 수 주 내에 출시될 것으로 별도 발표했습니다 . 대화 중 블록 타입이 해당 릴리스와 함께 베타에서 안정 API 경로로 마이그레이션될지는 아직 확인되지 않았지만, 이것이 확립하는 패턴은 향후 모델 세대 전반에 걸쳐 런타임 제약 주입의 표준 메커니즘이 될 가능성이 높습니다.
최종 업데이트: 2026-05-30. 2026년 5월 28~29일 출시된 Anthropic Python SDK v0.105.0~v0.105.2를 기반으로 합니다. 패치 릴리스 v0.105.2는 작성 시점에 공개된 상세 변경 로그가 없었습니다. 벤치마크 수치는 2026년 5월 Anthropic 내부 평가를 반영합니다.



