클라우드 DW가 클러스터 수 늘리기에 급급할 때, WarehousePG는 어떻게 단 하나로 해결할까?
작성자: Dave Stone, Jack Christie (2025년 12월 16일)
1. “데이터를 조회할수록 예산이 바닥납니다” : 교보문고의 고민
“50TB 규모의 클라우드 데이터 웨어하우스(CDW)를 운영하면서, 감당할 수 없을 정도로 치솟는 비용 문제 때문에 밤잠을 설쳤습니다.”
대한민국 최대 서점 체인, 교보문고 IT 지원팀의 정흥식 팀장님이 털어놓은 실제 고민입니다.
클라우드 DW의 ‘종량제(Consumption-based)’ 과금 모델은 초기 도입 시기나 단순 데이터 엔지니어링 작업에는 합리적으로 보입니다. 하지만 수백 명의 현업 부서원이 동시에 대시보드를 새로고침하고, 실시간으로 보고서를 뽑아보는 ‘고동시성(High-concurrency) BI 워크로드’ 환경이 되면 이야기가 달라집니다. 쿼리를 날리는 족족 돈이 나가는 구조라 비용 예측이 아예 불가능해지기 때문입니다.
교보문고는 늘어나는 50TB의 데이터를 관리하기 위해 고군분투했습니다. 하지만 대시보드 하나를 업데이트할 때마다 비용이 발생했고, 분석팀은 정작 중요한 데이터 분석보다 ‘어떻게 하면 비용을 줄일까’를 고민하는 데 더 많은 시간을 써야 했습니다.
2. 동시 접속의 함정: BI 워크로드는 왜 다를까?
클라우드 DW는 원래 대규모 일괄 처리(Batch ETL)나 머신러닝 모델 학습처럼, 가끔 크게 리소스를 쓰고 다시 줄이는 작업에 최적화되어 있습니다. 하지만 요즘의 BI 환경은 전혀 다릅니다.
- 상시 접속: 현업 담당자, 데이터 사이언티스트, 재무 분석가, 그리고 이제는 AI 에이전트까지 하루 종일 쉼 없이 쿼리를 실행합니다.
최근 벤치마크 결과에 따르면, 수십억 건의 데이터를 대상으로 수백 명의 사용자가 동시에 접속했을 때 플랫폼별로 극명한 차이가 나타났습니다.
| 비교 항목 | 일반적인 클라우드 DW (CDW) | WarehousePG 기반 아키텍처 |
| 인프라 확장 | 동일 작업에 5개 클러스터 가동 | 단 2개 클러스터로 처리 완료 |
| 응답 대기 | 리소스 할당 문제로 30초 이상 지연 | 지연 거의 없음 (즉각 응답) |
| 쿼리 성공률 | 접속 폭주 시 약 4% 실패 발생 | 안정적인 처리 유지 |
| 비용 효율 | 자동 확장(Auto-scaling)으로 73% 비쌈 | 고정 비용으로 예측 가능 |
3. AI 에이전트 시대, 왜 ‘동시성’이 돈이 되는가?
최근 화두인 ‘에이전틱 분석(Agentic Analytics)’을 생각해보십시오. 자율형 AI 에이전트는 인간보다 훨씬 빠르고 집요하게 DB를 조회합니다. 에이전트 하나가 단 몇 초 만에 수백 개의 쿼리를 날리고, 결과를 평가한 뒤 다시 추가 쿼리를 실행합니다.
이런 상황에서 기존 클라우드 DW 방식을 고수한다면, 성능이 나오기도 전에 청구서 금액이 폭발하는 광경을 보게 될 것입니다.
4. 핵심은 아키텍처: ‘유연함’이라는 이름의 과금 굴레
기존 클라우드 DW는 수요가 몰리면 클러스터를 새로 띄워 대응합니다. 그리고 그만큼의 비용을 청구하죠.
하지만 BI 워크로드는 생각보다 예측 가능합니다. 업무 시간에 몇 명의 분석가가 접속할지 대략 정해져 있습니다. 그런데도 ‘가변형 인프라’를 쓰다 보니, 사용자가 조금만 늘어도 클러스터가 추가로 붙고 비용은 천정부지로 솟구치는 것입니다. 인프라가 탄력적(Elastic)이라는 말은 곧 비용도 탄력적으로(비싸게) 변한다는 뜻입니다.
5. Postgres 기반의 대안: 성능은 그대로, 비용은 고정
Postgres 기반 데이터 웨어하우스는 접근 방식부터 다릅니다. 검증된 MPP(대규모 병렬 처리) 아키텍처를 사용하여, 클러스터를 덕지덕지 추가하지 않고도 단일 시스템 내에서 대량의 동시 접속을 처리합니다.

MPP 아키텍처란? 데이터를 여러 세그먼트(Segment)에 분산 저장하고, 이를 동시에 병렬로 처리하는 방식입니다. 예를 들어 1,600만 건의 데이터를 16개의 세그먼트가 각 100만 건씩 나눠서 처리하므로 속도가 압도적입니다.
독립적인 테스트 결과, WarehousePG 아키텍처는 기존 CDW 대비 약 62%의 비용 절감 효과를 보였으며, 동시성 처리 효율은 63% 더 높았습니다.
6. 실전 사례: MNTN과 Euronext FX
- MNTN: 페타바이트급 광고 데이터를 다루는 이 기업은 성능은 물론, 장애 시 즉각 대응해줄 수 있는 ‘EDB Postgres AI’의 엔터프라이즈 지원 체계에 만족하고 있습니다.
- Euronext FX: 특정 벤더에 종속되지 않기 위해 Greenplum에서 WarehousePG로 전환했습니다. 데이터 이전 없이 단 몇 시간 만에 ‘바이너리 교체’ 방식으로 도입을 완료했습니다.
7. 결론: “예측 가능한 것이 강한 것입니다”
이미 안정적인 BI 워크로드를 운영 중인 기업에게는 ‘언제 튈지 모르는 탄력성’보다 **’안정적인 예측 가능성’**이 훨씬 중요합니다.
- 종량제 플랫폼: 사용량에 따라 비용이 널뛰기하며, 자동 확장이라는 명목 하에 불필요한 비용이 나갑니다.
- 용량제 플랫폼(WarehousePG): 필요한 성능만큼 코어(Core)를 확보하면, 쿼리를 1만 번을 날리든 10만 번을 날리든 비용이 똑같습니다.
교보문고는 현명한 ‘하이브리드 전략’을 택했습니다. 데이터는 기존 클라우드(VPC)에 그대로 두어 보안과 계약을 준수하되, 비용이 많이 발생하는 분석 쿼리만 WarehousePG로 처리하도록 설계한 것입니다.
결과는 명확했습니다.
- 비용 확정: 사용량 기반 요금제에서 탈피, 코어 기반 과금으로 비용 예측 가능
- 성능 우수: 대시보드 도구(Tableau)와의 직접 연결로 속도 향상
- 운영 효율: 적은 인력으로도 전체 시스템을 안정적으로 관리
여러 개의 클러스터를 띄워가며 비용을 낭비하고 계십니까? 이제 단 하나의 클러스터로도 충분한 성능과 고정된 비용을 보장하는 EDB Postgres AI for WarehousePG를 검토해야 할 때입니다.

