OpenAI + Dell: 엔터프라이즈용 Codex 온프레미스 아키텍처

OpenAI는 Dell을 하이퍼스케일러 외 최초의 Codex 배포 파트너로 지명했다. 아키텍처의 실제 작동 방식과 타깃 고객을 살펴본다.

Creeta

2026년 5월 29일

OpenAI–Dell 파트너십이 실제로 가져오는 것

2026년 5월 18일 라스베이거스 Dell Technologies World에서 발표된 OpenAI–Dell 협약은 Codex에 대한 최초의 명시적 비Azure·비하이퍼스케일러 배포 경로입니다 . 기존의 모든 OpenAI 엔터프라이즈 채널(Stargate, Foundry, Deployment Co)은 클라우드 인프라에서 운영되었습니다. 이번 협약은 Dell의 배포 프레임워크를 통해 Codex, ChatGPT Enterprise, OpenAI API 제품을 고객 소유 데이터센터에서 운용할 수 있도록 명시적으로 설계되었습니다. 이 범위가 중요한 이유는 의도적인 전환을 반영하기 때문입니다. OpenAI는 이제 법적·계약적·정책적 이유로 데이터를 온프레미스에 유지해야 하는 조직을 위한 채널을 구축하고 있습니다.

빠른 답변: OpenAI와 Dell은 2026년 5월 18일, Dell의 AI 데이터 플랫폼을 통해 고객 소유 PowerEdge 하드웨어에서 구동되는 Codex의 첫 번째 비Azure 엔터프라이즈 경로를 발표했습니다. 에이전트 세션 전반에 걸쳐 데이터는 온프레미스에 유지됩니다. 정식 출시 일정이나 가격은 공개되지 않았으며, 이는 출하 제품이 아닌 파트너십 의향입니다.

기존 OpenAI 엔터프라이즈 배포는 모두 Microsoft의 Azure 인프라(Foundry, 프라이빗 엔드포인트, Deployment Co)나 OpenAI 자체 클라우드(Stargate)를 통해 이루어졌습니다. Dell 경로는 구조적으로 다릅니다. 개발자 IDE에서 발생한 요청이 온프레미스 엔드포인트를 통해 Dell에서 호스팅하는 Codex 인스턴스로 라우팅됩니다. 소스 코드, 내부 스키마, 운영 데이터는 하이퍼스케일러 네트워크를 일절 경유하지 않습니다. 이는 마케팅 표현이 아닌 실질적인 차이입니다.

파트너십 범위는 세 가지 제품군을 아우릅니다: Codex(에이전틱 워크스페이스), ChatGPT Enterprise, 그리고 OpenAI API. Dell의 기여는 AI Factory 하드웨어 스택과 AI 데이터 플랫폼으로, 특히 Starburst 연합 쿼리 통합과 추론 컴퓨팅을 제공하는 PowerEdge 서버 라인업입니다. 명시된 목표는 하이브리드 및 온프레미스 지원으로, 조직이 정책이 허용하는 경우 OpenAI 클라우드 서비스와의 선택적 연결을 유지하면서 워크로드를 로컬에서 실행할 수 있음을 의미합니다 .

"OpenAI Codex를 탑재한 Dell AI Factory는 기업이 엔터프라이즈 데이터가 이미 위치한 곳, 즉 자사 구내에 AI를 배포할 수 있게 하여, 고객에게 AI 에이전트를 대규모로 배포할 수 있는 실용적이고 안전한 경로를 제공합니다," — Dell Technologies 인프라솔루션그룹 SVP 겸 CTO Ihab Tarazi (source: ChannelLife AU, 2026-05)

이번 발표는 성능 향상이나 비용 절감이 아닌 데이터 지역성을 핵심 가치로 내세웁니다. 클라우드 이그레스 제약으로 인해 Codex급 에이전트 툴링에서 원천적으로 배제되었던 조직들에게, 이는 공식적인 첫 번째 아키텍처 경로를 의미합니다.

Codex의 현재 기능: 에이전트가 지금 할 수 있는 것들

OpenAI + Dell: Codex On-Premises Architecture for Enterprise

Codex는 코딩 도구로 출시되었지만, 2026년 4월 16일 기준으로 범용 에이전틱 워크스페이스로 운영됩니다. '거의 모든 것을 위한 Codex' 업데이트는 코드 자동완성을 훨씬 뛰어넘는 기능을 추가했습니다: macOS 컴퓨터 사용(네이티브 애플리케이션 화면 읽기, Excel·Outlook·Salesforce 같은 앱에서 클릭 및 키 입력 실행), 주석 및 웹 스크래핑이 가능한 인앱 브라우저, 통합 gpt-image-1.5 이미지 생성, 세션 간 지속 메모리, 병렬 에이전트 인스턴스를 실행하는 예약 자동화, 90개 이상의 플러그인 생태계 . 이 맥락은 Dell 파트너십의 범위가 왜 그렇게 설정되었는지 이해하는 데 필수적입니다. 온프레미스 접근은 단순한 코드 어시스턴트가 아니라 멀티모달 에이전트 플랫폼에 대한 접근입니다.

플러그인 생태계는 Jira, 전체 Microsoft 365 제품군, Notion, Slack, HubSpot, Salesforce, Google Workspace, GitHub, Linear, Zendesk를 지원합니다 . 컴퓨터 사용 기능과 결합하면, Codex는 Jira 티켓 읽기, 로컬 IDE에서 코드 작성, GitHub 푸시, Salesforce에 상태 기록을 하나의 조율된 세션에서 수행하는 등 개발자의 전체 툴 스택에 걸친 워크플로를 구동할 수 있습니다. 이 조합은 코드 어시스턴트와는 다른 제품 범주에 위치시킵니다.

사용 수치는 이러한 확장을 반영합니다. Codex의 주간 활성 개발자 수는 400만 명을 넘어섰으며 , ChatGPT Business 및 Enterprise 티어는 2026년 1월부터 4월 사이 6배 성장했습니다 . 이 성장 궤적은 온프레미스 공백을 더욱 중요하게 만듭니다. 잠재적 엔터프라이즈 사용자의 상당 부분, 특히 규제 산업의 조직들은 클라우드 배포 모델이 데이터 거버넌스 팀에게 수용 불가였기 때문에 이러한 기능에 접근할 수 없었습니다.

과금 방식도 변경되었습니다. Cloud Codex는 2026년 4월 2일부터 토큰 기반 가격제로 전환하여, 메시지당 가격 방식을 입력 토큰·캐시된 입력 토큰·출력 토큰에 적용되는 백만 토큰당 크레딧 모델로 대체했습니다 . 기존 ChatGPT Enterprise, Edu, Health, Gov, 그리고 ChatGPT for Teachers 플랜은 2026년 4월 23일에 이 모델로 전환되었습니다. Dell 파트너십 하에서의 온프레미스 가격은 공개되지 않았지만, 클라우드 토큰 기반 가격으로의 전환은 Dell 엔터프라이즈 구매 팀이 협상할 때 참고 기준이 될 것입니다.

Dell 경로를 검토하는 엔터프라이즈 팀의 경우: 온프레미스 빌드와 현재 클라우드 릴리스 간의 기능 동등성이 유지된다면(미확인 — 섹션 8에서 다룸), 로컬 하드웨어에서 실행되는 축소된 코드 어시스턴트가 아닌, 시스템 간 비즈니스 워크플로를 구동할 수 있는 멀티모달 에이전틱 플랫폼을 배포하게 되는 것입니다.

Dell AI Data Platform: 데이터가 온프레미스에 머무는 방식

Dell AI Data Platform은 이 파트너십을 규제 산업 기업에 기술적으로 신뢰할 수 있게 만드는 핵심 구성요소입니다. Codex가 클라우드 외부 전송 없이 내부 코드베이스, 문서, 운영 지식에 접근할 수 있는 통합 온프레미스 데이터 레이어를 제공합니다 . 아키텍처 설계 의도는 Codex의 검색 및 컨텍스트 구축 작업이 에이전트 세션 전체에 걸쳐 고객 인프라 경계 내부에 물리적으로 존재하는 데이터 소스를 대상으로 실행된다는 것입니다.

AI Data Platform의 핵심 기술 구성요소는 Starburst 통합입니다. Starburst는 Trino 기반의 페더레이션 쿼리 엔진으로, 데이터를 중앙화하거나 복제하지 않고도 관계형 데이터베이스, 데이터 레이크, 오브젝트 스토어 등 이기종 데이터 소스에 걸쳐 SQL을 실행할 수 있습니다. Dell–OpenAI 구성에서 이는 Codex가 독자적 스키마, 인시던트 이력, 내부 문서 인덱스, 운영 데이터베이스를 대상으로 컨텍스트 보강 쿼리를 현장에서 실행할 수 있음을 의미합니다 . 쿼리는 온프레미스에서 실행되며, 결과 세트 또는 관련 컨텍스트 조각만 Codex 추론 레이어로 전달됩니다. 추론 레이어 역시 온프레미스에서 실행됩니다.

GDPR, HIPAA 또는 국가 데이터 거주 요건 프레임워크를 따르는 조직에게 이 설계는 Codex가 실질적인 엔터프라이즈 활용이 가능해진 이후 존재해 온 공백을 메워줍니다. 이전에는 의미 있는 조직 컨텍스트와 함께 Codex를 사용하려면 클라우드 데이터 전송을 수용하거나(많은 규제 기관에서 정책 위반에 해당), 모델에 정제된 컨텍스트 제거 입력만 제공해야 했으며 — 이는 유용성을 크게 떨어뜨렸습니다. 온프레미스 데이터 플랫폼은 이러한 두 가지 타협을 모두 불필요하게 만듭니다.

이 스택을 평가하는 아키텍트에게 Starburst의 역할은 특히 주목할 만합니다. 페더레이션 쿼리는 데이터 웨어하우스 마이그레이션이나 새로운 ETL 파이프라인을 필요로 하지 않습니다. 기존 데이터베이스, 파일 스토어, 스키마 레지스트리는 Starburst 카탈로그를 통해 연결됩니다. 온프레미스 데이터 인프라가 분산된 조직 — 대형 기업 및 정부 기관에서 흔한 경우 — 은 이 구성을 배포하기 전에 데이터를 통합할 필요가 없습니다 . 에이전트는 중앙화 전제 없이 필요한 것을 현장에서 직접 검색합니다.

더 넓은 관점에서의 가치는 컨텍스트 완전성입니다. Codex 에이전트는 당면 과제에 관련된 특정 코드베이스, 스키마 문서, 과거 인시던트 데이터를 쿼리할 수 있을 때 더 효과적으로 작동합니다. Dell AI Data Platform을 통해 Codex는 에이전트 실행 루프 동안 온프레미스 스토어에서 직접 이 컨텍스트를 검색합니다 — 개발자와 비즈니스 사용자는 각 세션마다 입력을 수동으로 정리할 필요가 없습니다.

Dell AI Factory: 하드웨어 사양과 배포 규모

Dell AI Factory는 고객 소유 인프라에 AI 워크로드를 배포하기 위한 Dell의 엔드투엔드 프레임워크입니다. OpenAI 파트너십에서 이는 추론 컴퓨팅 레이어를 제공합니다. Codex 모델 추론이 실행되는 물리적 서버로, 쿼리하는 데이터 소스와 함께 배치됩니다. 주요 하드웨어 플랫폼은 PowerEdge 서버 라인업입니다 — 구체적으로 XE9680, XE9680L, XE9812 — NVIDIA HGX H100 및 H200 GPU와 대안 가속기를 지원합니다 .

서버 모델	GPU 지원	폼 팩터	AI Factory 내 주요 역할
PowerEdge XE9680	NVIDIA HGX H100 (8× SXM5)	8U 랙마운트	LLM 추론 및 학습 노드
PowerEdge XE9680L	NVIDIA HGX H100 / H200 (8×)	8U (저프로파일)	고밀도 추론; 공간 제약 데이터센터
PowerEdge XE9812	NVIDIA HGX H200 + 대안 가속기	12U 섀시	벡터 인덱싱, 고처리량 토큰 생성

Dell이 제시하는 XE9812의 성능 벤치마크에는 Blackwell 세대 대안 대비 벡터 인덱싱 12배 향상, 첫 토큰 생성 시간 19배 단축, 토큰당 비용 10배 절감이 포함됩니다 . 이 수치는 독립적으로 검증되지 않았으며 벤더 포지셔닝 수치로 취급해야 합니다. 그러나 이는 Dell이 지연 시간과 처리량이 주요 관심사인 Codex 추론 워크로드의 선호 플랫폼으로 XE9812를 포지셔닝하고 있음을 나타냅니다.

기존 설치 기반은 중요한 배포 요인입니다. 2026년 3월 기준, Dell AI Factory는 4,000개 이상의 엔터프라이즈 고객을 보유했습니다 . OpenAI 입장에서 이는 이미 호환 가능한 하드웨어를 운영 중인 대규모 조직 풀을 의미합니다 — 파트너십은 고객이 새로운 하드웨어 구매 사이클을 거치지 않고도 Codex 접근을 확장할 수 있습니다. 이는 온프레미스 도달 범위를 처음부터 구축하는 것에 비해 영업 마찰을 크게 줄여줍니다.

기존 Dell 인프라의 적합 여부를 평가하는 조직에게 결정 요인은 GPU 구성(H100 또는 H200 HGX 모듈이 주요 대상), 게이트웨이 구성요소를 위한 가용 랙 공간, 컴퓨팅과 데이터 티어 간 네트워크 토폴로지입니다. Dell AI Factory의 대안 가속기 지원은 어느 정도 유연성을 제공하지만, 파트너십 문서에서는 Codex 추론 워크로드에 확인된 대안이 어떤 것인지 명시하지 않습니다. 아키텍트는 배포 일정을 계획하기 전에 하드웨어 호환성 범위 확인을 위해 Dell에 직접 문의해야 합니다.

게이트웨이 아키텍처: 온프레미스 요청이 Codex로 라우팅되는 흐름

온프레미스 Codex의 배포 모델은 게이트웨이 프록시 패턴을 따릅니다. 개발자 IDE와 클라이언트 애플리케이션은 온프레미스 엔드포인트와 통신하고, 해당 엔드포인트는 AI Factory 하드웨어에서 실행되는 Dell 호스팅 Codex 인스턴스로 요청을 프록시합니다. 개발자 입장에서는 클라우드 Codex와 기능적으로 동일한 환경 — 동일한 API 인터페이스, 동일한 에이전트 상호작용 모델 — 을 제공하되, 추론 경로 전체가 고객 데이터센터 내부에 머무르는 구조입니다 .

배포 경로	인프라 소유	데이터 경계	추론 지연 목표	컴퓨팅 하드웨어
OpenAI 클라우드 (표준)	OpenAI	OpenAI 클라우드 인프라	미공개	OpenAI 관리
Azure 프라이빗 엔드포인트	Microsoft (관리형)	Azure VPC (Microsoft 리전)	미공개	Azure 관리
Dell AI Factory (온프레미스)	고객 소유	고객 데이터센터	<100ms end-to-end	PowerEdge XE9680 / XE9812

Dell 경로의 추론 지연 목표는 엔드투엔드 100밀리초 미만 으로, IDE 클라이언트에서 온프레미스 Codex 엔드포인트까지의 전체 왕복을 포함합니다. 이 목표가 실제 운영 규모에서 유지될지는 모델 크기, GPU 구성, 그리고 데이터센터 내 컴퓨팅과 데이터 레이어의 배치 밀도에 달려 있습니다. Dell은 클라우드 배포 대비 비교 지연 수치를 공개하지 않았으며, 독립적인 운영 배포의 벤치마크가 나오기 전까지 성능 주장은 미검증 상태로 간주해야 합니다.

codex-enterprise-v1이라는 모델 변형이 온프레미스 배포 관련 기술 문서에서 언급됩니다 . OpenAI는 온프레미스 빌드에 대한 공식 버전명을 발표하지 않았으며, codex-enterprise-v1과 현재 클라우드 Codex 릴리스의 기능 동등성을 비교하는 공식 발표도 존재하지 않습니다. 이 레이블은 중요한 데이터 포인트입니다. 온프레미스 빌드가 클라우드 제품의 동일한 미러가 아닌 별도 변형일 수 있음을 시사하기 때문입니다. 특정 기능을 평가 중인 기업 구매자는 OpenAI가 명시적인 문서를 공개하기 전까지 기능 동등성을 미결 사안으로 취급해야 합니다.

Azure 프라이빗 엔드포인트와의 아키텍처적 차이는 정확하게 짚을 필요가 있습니다. Azure 프라이빗 엔드포인트는 VPC 터널링을 통해 네트워크 트래픽을 격리해 공용 인터넷 경유를 차단합니다. 그러나 컴퓨팅은 여전히 Microsoft 관리 Azure 인프라, 즉 Microsoft가 통제하는 리전에서 실행됩니다. Dell 경로에서는 PowerEdge 서버가 고객의 데이터센터에 물리적으로 위치합니다 — 고객이 하드웨어를 소유하고, 물리적 접근을 통제하며, 관리형 클라우드 서비스로는 구조적으로 불가능한 네트워크 정책(잠재적인 에어갭 구성 포함)을 구현할 수 있습니다. OpenAI가 이 경로에서 완전한 에어갭, 즉 인터넷 없는 운영을 지원하는지는 아직 확인되지 않았습니다 .

이 배포 경로가 실제로 겨냥하는 대상

Dell 온프레미스 경로의 주요 대상은 클라우드 AI 배포가 단순한 선호의 문제가 아니라 정책적으로 불가능한 조직입니다. 기밀 경계 하에 운영되는 방산 업체, 데이터 역외 이전에 관한 사법 관할 규정을 가진 중앙은행 및 국부펀드, HIPAA 또는 국가 의료 데이터 프레임워크를 적용받는 의료보험사, 그리고 하이퍼스케일러 인프라로의 운영 데이터 전송을 금지하는 정부 기관 — 이러한 조직들이 그간 공식적인 Codex급 에이전트 역량에 접근할 방법이 없었던 곳입니다 . 이번 발표는 바로 이들을 직접 겨냥하고 있습니다.

두 번째 범주는 기존 Dell AI Factory 인프라를 상당 규모로 보유한 기업입니다. 이들에게 이번 파트너십은 이미 도입하고 비용을 지불한 하드웨어의 가치를 확장합니다. 새로운 데이터센터 프로젝트가 아닌, 기존 AI Factory 환경에 Codex를 추가하는 통합 작업으로 처리할 수 있습니다. 2026년 3월 기준 Dell의 AI Factory 기업 고객 4,000곳 이상 은 고객 측의 신규 자본 지출 없이 OpenAI가 접근할 수 있는 배포 채널이 됩니다.

세 번째 세그먼트는 법적으로 클라우드 AI가 금지된 것은 아니지만 현실적인 제약에 직면한 조직입니다. 클라우드 추론의 왕복 지연이 개발자 경험을 저하시킬 만큼 대규모 코드베이스를 보유한 경우, 또는 AI 벤더의 데이터 처리를 아직 허용하지 않는 데이터 거버넌스 정책을 갖고 있으나 온프레미스 배포는 별도의 거버넌스 트랙을 통해 승인받을 수 있는 경우가 해당됩니다.

이 경로가 해결하지 못하는 것도 있습니다. 비용 최적화된 Codex 배포를 원하는 조직(가격 미발표, 온프레미스 하드웨어 초기 투자 비용도 적지 않음), 도입 전 FedRAMP·IL-5·HIPAA 인증을 요구하는 조직(공개된 컴플라이언스 인증 없음), 그리고 자체 하드웨어에서 파인튜닝이나 모델 커스터마이징이 필요한 조직(공식 문서 어디에도 언급 없음) 등이 이에 해당합니다. 이는 이번 발표가 다루지 않는 별개의 사용 사례입니다 .

엔터프라이즈 엔지니어링 팀에 달라지는 것들

엔지니어링 팀 입장에서 가장 즉각적인 변화는 데이터 로컬리티 제약의 해소입니다. 클라우드 Codex에서 조직 컨텍스트를 제공하는 현실적인 선택지는 정제된 코드 스니펫을 업로드하거나, 전체 코드와 스키마 컨텍스트가 OpenAI 인프라를 경유하는 것을 감수하는 것뿐이었습니다. IP 보호 정책이나 데이터 거버넌스 프레임워크를 적용 받는 팀에게는 어느 쪽도 수용 가능한 옵션이 아니었습니다. Dell 경로는 이 제약을 정책 의존적 문제가 아닌 구조적 문제로 만듭니다. 추론 자체가 사내에서 이루어지므로 데이터가 건물 밖으로 나가지 않습니다 .

코딩을 넘어선 활용 범위 확장은 중요한 맥락입니다. 2026년 4월 Codex의 기능 수준을 감안하면, 온프레미스 배포는 규제 산업에서 기존에는 불가능했던 워크플로를 가능하게 합니다. 사내에 보관된 CRM 데이터 기반 리드 자격 심사, 내부 티켓 시스템을 읽고 업데이트하는 인시던트 대응 워크플로, 독점 데이터 저장소에서 정보를 가져오는 보고서 초안 작성, 사내 도구 전반의 크로스 시스템 워크플로 조율 등이 그 예입니다. 이는 가상의 미래 적용 사례가 아니라, 클라우드 Codex에서 이미 문서화된 활용 사례들이 기존에는 접근할 수 없었던 조직에도 아키텍처적으로 확장된 것입니다 .

Dell AI Factory 파이프라인과의 통합은 세 번째 벡터를 열어줍니다. 다른 워크로드를 이미 실행 중인 AI 추론 인프라와 Codex를 같은 위치에 배치하는 것입니다. 커스텀 모델 파인튜닝, 데이터 준비 파이프라인, 내부 ML 서빙을 위해 AI Factory를 배포한 엔지니어링 팀은 Codex가 해당 파이프라인과 직접 인터페이스하도록 구성할 수 있으며, Codex 주도 워크플로의 일환으로 AI Factory를 데이터 준비 및 테스트 실행에 활용할 수 있습니다. 파트너십 문서는 이를 확정된 출시 기능이 아닌 탐색 영역으로 기술하고 있지만, 아키텍처 방향성은 명시되어 있습니다 .

DevOps 및 플랫폼 팀의 운영 모델도 달라집니다. 온프레미스 Codex 배포를 관리한다는 것은 게이트웨이 인프라, 업그레이드 주기, 하드웨어 상태 모니터링, 내부 접근 제어 시스템과의 통합까지 책임져야 함을 의미합니다. 이는 클라우드 배포에서는 추상화되어 있던 책임들입니다. 이 경로를 검토하는 팀은 하드웨어 및 라이선싱 비용과 함께 플랫폼 엔지니어링 오버헤드를 별도로 예산에 반영해야 합니다. 클라우드 Codex의 단순 대체제가 아니라, 새로운 운영 영역이 추가되는 것입니다.

아직 미확인된 것들: 공백과 열린 질문들

이번 발표는 파트너십 의도를 확인하고 아키텍처를 설명했지만, 제품을 출시한 것은 아닙니다. 2026년 5월 현재 여러 중요한 세부 사항이 미해결 상태이며, 엔터프라이즈 구매 담당자는 내부 사업 타당성 검토 시 이러한 공백을 명확히 짚어야 합니다 .

가격 정책: 공개된 가격 모델이 없습니다. Dell이 AI Factory 계약에 Codex 라이선싱을 번들로 포함하는지, OpenAI가 별도 청구하는지, 모델이 CapEx 기반(하드웨어 + 영구 라이선스)인지, OpEx 기반(시트 또는 토큰 단위 구독)인지, 혼합형인지 불분명합니다. 클라우드 Codex는 2026년 4월 토큰 백만 개당 과금 방식으로 전환되어 참고 기준이 되지만, 온프레미스 가격 책정은 통상 다른 비용 구조를 따릅니다. 규제 산업 구매자는 가격을 협상 항목으로 간주하고, 구체적인 볼륨 예측치를 가지고 Dell 엔터프라이즈 영업팀과 협의해야 합니다.

기능 동등성: 기술 문서의 codex-enterprise-v1 레이블은 온프레미스 빌드가 별도 변형일 수 있음을 시사합니다. 90개 이상의 플러그인 에코시스템, macOS 컴퓨터 사용, gpt-image-1.5 통합, 병렬 예약 에이전트가 온프레미스 엔드포인트에서 지원되는지에 대한 공식 입장은 없습니다 . 이는 온프레미스 활용 사례를 검토하는 엔지니어링 팀에게 가장 중요한 미해결 질문입니다. 배포의 가치는 실제로 어떤 기능이 제공되는지에 크게 달려 있습니다.

GA 일정 및 컴플라이언스 인증: 2026년 5월 현재 일반 출시일이나 베타 프로그램이 공개된 바 없습니다 . 온프레미스 구성에 대한 FedRAMP, HIPAA, IL-5 및 이에 준하는 인증은 공식 문서에서 언급된 바 없습니다. 컴플라이언스 승인이 조달의 전제 조건인 조직은 아직 해당 프로세스를 시작할 수 없습니다.

모델 커스터마이징 및 에어갭 운영: 모델 가중치, 파인튜닝 접근, 완전 오프라인(인터넷 연결 없음) 운영에 대해 공식 문서 어디에도 언급이 없습니다. 국방 및 정보기관 활용 사례에서는 에어갭 지원이 필수 요건인 경우가 많습니다. 현재 발표는 지원 여부를 확인도, 부정도 하지 않습니다. 이는 계획 중이지만 아직 발표되지 않은 것이거나, 초기 배포 모델의 범위 밖인 것을 의미합니다. 어느 쪽이든, 이 기능이 필요한 구매자는 제공 가능 여부를 전제해서는 안 됩니다.

자주 묻는 질문

OpenAI–Dell Codex 온프레미스 배포는 지금 이용할 수 있나요?

아닙니다. OpenAI와 Dell은 2026년 5월 18일 Dell Technologies World에서 이 파트너십을 발표했지만, 이는 출시 제품이 아닌 방향성과 아키텍처 구상의 선언입니다. 공개 GA 일정, 베타 프로그램, 얼리 액세스 신청 방법은 현재까지 발표되지 않았습니다. 배포 일정에 관심 있는 기업은 Dell 엔터프라이즈 영업팀에 직접 문의하시기 바랍니다. 발표 시점 기준으로 공개 채널을 통해 확인할 수 있는 세부 정보는 없습니다.

Azure 프라이빗 엔드포인트를 통한 OpenAI 사용과 무엇이 다른가요?

Azure 프라이빗 엔드포인트는 API 트래픽을 VPC 격리 경로로 라우팅해 공개 인터넷을 거치지 않도록 합니다. 그러나 실제 컴퓨팅은 여전히 Microsoft가 관리하는 Azure 인프라, 즉 Microsoft가 통제하는 리전에서 실행되며 물리적 하드웨어는 고객의 통제 밖에 있습니다. Dell AI Factory 경로는 고객 소유의 PowerEdge 하드웨어(XE9680, XE9680L, 또는 XE9812)에서 Codex 추론을 실행하며, 이 서버는 고객의 데이터센터에 물리적으로 위치합니다. 하드웨어를 고객이 소유·통제하고, 데이터는 고객 관리 인프라 밖으로 나가지 않으며, 에어갭 구성을 포함한 네트워크 정책을 물리 계층에서 강제할 수 있습니다. 이는 단순한 네트워크 계층 격리의 차이가 아닌 구조적 차이입니다.

Codex가 온프레미스에서 내부 데이터베이스를 조회할 때 데이터가 외부로 나가지 않나요?

발표된 파트너십 아키텍처에 따르면, 그렇습니다. Dell AI Data Platform에는 페더레이션 SQL 쿼리를 위한 Starburst 통합이 포함되어 있습니다. Starburst는 관계형 데이터베이스, 데이터 레이크, 파일 스토어 등 이기종 온프레미스 데이터 소스에 걸쳐 쿼리를 실행하며, 데이터를 클라우드 환경에 집중하거나 복제할 필요가 없습니다. 온프레미스 Codex 구성에서는 컨텍스트 검색이 이 소스들에 대해 현장에서 실행되고, 그 결과가 역시 온프레미스에서 실행되는 Codex 추론 레이어로 전달됩니다. 설계 의도는 쿼리 데이터의 클라우드 이탈 없이 완전한 데이터 로컬리티를 실현하는 것입니다. 구체적인 보장 사항은 배포 구성 및 Dell과의 계약 조건에 따라 달라집니다.

이 온프레미스 경로를 이용하려면 반드시 Dell 하드웨어가 필요한가요?

현재 문서 기준으로는 그렇습니다. 이 통합은 Dell AI Factory에 종속되어 있으며, NVIDIA HGX GPU 모듈이 탑재된 PowerEdge XE9680, XE9680L, XE9812 서버에 배포됩니다. 2026년 5월 기준으로 HPE, Lenovo, Supermicro 등 서드파티 온프레미스 하드웨어 지원은 발표된 바 없습니다. Dell 외 데이터센터 인프라를 운영 중인 기업은 Dell 하드웨어를 도입하거나, 향후 추가 하드웨어 지원 발표를 기다려야 합니다. 이 하드웨어 종속성은 기존 서버 인프라 교체 주기 중인 기업에게 중요한 고려 사항입니다.

온프레미스 Codex 추론의 목표 지연 시간은 얼마인가요?

Dell은 개발자 IDE에서 온프레미스 Codex 엔드포인트까지의 왕복 전체를 포함해 온프레미스 Codex 추론의 엔드투엔드 지연 시간을 100밀리초 미만으로 목표하고 있습니다. 실제 처리량과 지연 시간은 로드된 모델 크기, GPU 구성(H100 대 H200, 카드 수), 데이터센터 내 컴퓨팅과 데이터 계층의 공배치 수준에 따라 달라집니다. Dell은 클라우드 Codex 대비 비교 지연 시간 벤치마크를 공개하지 않았으므로, 일반적인 개발자 워크로드 기준으로 온프레미스 추론이 더 빠른지, 느린지, 동등한지는 독립적인 측정으로 검증되지 않은 상태입니다.

앞으로 주목해야 할 것들

Dell–OpenAI 발표는 아키텍처 청사진을 제시하고, OpenAI가 채널 유통을 통해 규제 환경의 엔터프라이즈 고객에게 도달하려는 의도를 시사합니다. 아직 빠진 것은 구체적인 실행 명세입니다. GA 일정, codex-enterprise-v1의 기능 목록, 가격 모델, 컴플라이언스 인증 로드맵이 그것입니다. 기술 창업자와 엔터프라이즈 플랫폼 팀의 관찰 목록은 명확합니다. 이 네 가지 중 하나라도 공개되는 순간, 흥미로운 아키텍처에서 실행 가능한 도입 검토 단계로 전환됩니다.

더 넓은 시사점도 정확히 읽을 필요가 있습니다. OpenAI가 Azure나 하이퍼스케일러를 우회해 Dell을 통한 엔터프라이즈 채널을 구축하는 것은 유통 전략에 대한 베팅입니다. 클라우드 유통 모델로는 도달하기 어려웠던 Dell AI Factory 고객 기반이 대규모로 존재합니다. 온프레미스 제품이 출시되고 기능이 검증된다면, Codex가 범용 플랫폼으로 성숙한 이후에도 사실상 차단되어 있던 엔터프라이즈 AI 에이전트 도구를 해당 세그먼트에 확장하는 계기가 됩니다. 발표 이후 실행이 뒤따를지 여부는 앞으로 2~3분기가 답할 것입니다.

현재 데이터 거버넌스 정책으로 Codex 사용이 막혀 있는 팀에게 지금 당장의 실질적인 조치는 Dell 엔터프라이즈 영업팀에 관심 의사를 등록하는 것입니다. 배포를 계획하는 단계가 아니더라도, 조건이 확정되기 전에 베타 접근 기회를 확보하고 가격 및 기능 논의에 참여할 수 있는 위치를 선점하기 위해서입니다. 조기 참여는 GA 이후 도입보다 배포 구성과 가격 구조에 더 많은 영향력을 행사할 수 있는 경우가 많습니다.

최종 업데이트: 2026-05-28. 이 글은 2026년 5월 18일 Dell Technologies World 발표 및 2026년 5월 28일까지 공개된 제품 문서를 기반으로 작성되었습니다. 파트너십 세부 사항, 가격, 기능 동등성, GA 일정은 아직 발표되지 않았으며, Dell과 OpenAI가 추가 사양을 공개하는 대로 업데이트될 예정입니다.