EDB Lab

HOME
블로그
EDB Lab
에이전틱 분석(Agentic Analytics)을 위한 대규모 확장성과 예측 가능한 성능 달성

2026-03-23 / Last updated : 2026-03-23 Grace EDB Lab

에이전틱 분석(Agentic Analytics)을 위한 대규모 확장성과 예측 가능한 성능 달성

작성자: Dunith Danushka 작성일: 2026년 3월 16일

EDB Postgres® AI 소개: NVIDIA RAPIDS 가속기를 통한 Apache Spark 기반 GPU 성능 최적화

에이전틱 워크포스 시대의 분석 환경

EDB의 ‘소버린(Sovereignty)의 중요성‘ 연구에 따르면, 엔터프라이즈 기업 중 단 13%만이 생성형 AI 파일럿 단계를 넘어 실제 운영 규모의 에이전틱 배포를 성공적으로 완료했습니다. 이는 자율형 업무(Autonomous work)를 확장하는 것이 얼마나 어려운 과제인지를 여실히 보여줍니다.

이러한 에이전틱 워크포스(Agentic Workforce) 시대에 기업이 직면한 핵심 과제는 바로 데이터베이스 관리의 한계입니다. 자율 AI 에이전트는 인간 기반의 워크로드보다 훨씬 더 가변적이고 예측 불가능한 대규모 쿼리 패턴을 지속적으로 생성합니다. 이로 인해 인프라 팀은 OLTP(트랜잭션 처리)와 OLAP(분석 처리) 수요를 동시에 충족해야 한다는 엄청난 압박을 받게 됩니다.

결국 비용이 많이 드는 ETL(추출, 변환, 로드) 프로세스가 증가하며 다음과 같은 치명적인 ‘안티 패턴’이 발생합니다:

지연 시간 및 오버헤드: 시스템 간 데이터 이동으로 인해 인사이트 도출이 늦어집니다.
복잡성: 이기종 데이터 시스템 관리로 인해 기술 부채가 증가합니다.
진척 중단: 이러한 비효율성은 AI 에이전트가 요구하는 실시간 대화형 의사결정을 가로막습니다.

EDB Postgres AI(EDB PG AI)는 운영 지능과 분석 지능을 하나의 확장 가능한 플랫폼으로 통합하여 이러한 장벽을 허뭅니다. 이를 통해 엔터프라이즈 개발자는 스택을 단순화하고, 사용자가 사람이든 앱이든 AI 에이전트이든 관계없이 데이터를 거의 실시간(Near Real-time)으로 활용할 수 있습니다.

NVIDIA GPU 가속을 통한 인사이트 도출 가속화

NVIDIA RAPIDS 가속기를 Apache Spark와 통합함으로써, PG AI는 CPU 중심 프로세싱의 한계를 넘어 다음과 같은 가치를 제공합니다.

실시간에 가까운 의사결정: 기존 Postgres에서는 불가능했던 속도로 운영 데이터를 처리합니다.
높은 GPU ROI: 단순히 모델 서빙에만 GPU를 사용하는 것이 아니라, 데이터 및 분석 레이어에서도 GPU 투자를 활용할 수 있습니다.
원활한 확장성: 에이전틱 워크로드를 저해하던 제약 사항을 제거합니다.

이 가이드는 EDB Postgres AI – 분석 가속기(Analytics Accelerator, 이하 PGAA)가 NVIDIA RAPIDS를 통해 Apache Spark와 어떻게 통합되는지 설명합니다. 이 통합을 통해 EDB Postgres는 코드 변경 없이 대규모 데이터 세트에서 최대 100배 더 빠르고 예측 가능한 분석 성능을 제공합니다. 이는 엔터프라이즈가 에이전틱 분석을 확장하는 데 필요한 소버린 AI(Sovereign AI)의 기반이 됩니다.

이 가이드는 누구를 위한 것인가요?

OLTP와 OLAP 쿼리 패턴이 혼재된 환경에서 성능 병목 현상을 해결하고자 하는 데이터 엔지니어 및 개발자

데이터 레이어에 대한 완전한 제어권을 유지하면서 분석 및 AI 인프라를 비용 효율적으로 확장하려는 데이터 리더

PGAA와 NVIDIA Spark RAPIDS의 연동 원리

“기업은 GPU 가속을 원하면서도 동시에 예측 가능성과 제어권을 필요로 합니다. Iceberg를 지원하는 NVIDIA RAPIDS 가속기를 통해 무거운 분석 작업을 GPU로 오프로드하고, EDB PG AI는 워크로드 격리, 거버넌스 및 일관된 운영 모델을 제공합니다. 이것이 바로 단순한 데모와 실제 지속 가능한 운영 시스템의 차이입니다.” — Quais Taraki, EDB CTO

GPU 가속은 데이터 집약적인 작업을 CPU에서 GPU로 오프로드(Offload)하는 기술입니다. CPU가 복잡한 순차적 로직에 최적화되어 있다면, GPU는 대규모 병렬 처리를 위해 설계된 수천 개의 작은 전문 코어로 구성됩니다.

일반적인 Apache Spark와 같은 분산 처리 프레임워크는 CPU 코어에 의존하지만, 데이터 규모가 커지면 CPU가 병목 지점이 됩니다. Spark의 GPU 가속을 활용하면 조인(Join)이나 집계(Aggregation)와 같은 고부하 SQL 작업을 GPU에 위임하여 CPU 전용 환경 대비 최대 7배 빠른 처리 속도를 얻을 수 있습니다.

EDB PGAA(PostgreSQL Analytics Accelerator)는 EDB가 개발한 독점 확장 모듈입니다. Delta, Apache Iceberg, Apache Parquet와 같은 데이터 레이크 포맷의 쿼리를 외부 분석 엔진(Apache Spark 등)으로 오프로드합니다.

이 아키텍처는 ‘저장과 계산의 분리(Separation of Storage and Compute)’를 실현합니다. PostgreSQL은 인터페이스와 메타데이터 레이어를 관리하고, GPU 가속 Spark 클러스터는 연산 집약적인 작업을 실행합니다.

(그림 01: Postgres, PGAA 및 Spark 구성 요소 간의 논리적 아키텍처)

Spark Connect 서비스는 Postgres와 Spark 클러스터 사이의 인터페이스 역할을 하며, 설정 방법은 다음과 같이 간단합니다.

SQL

SET pgaa.executor_engine = 'spark_connect';
SET pgaa.spark_connect_url = 'sc://<spark-connect-host>:15002';
SELECT pgaa.spark_sql('SELECT version()');

성능 측정: TPC-DS 벤치마크 분석

EDB는 PostgreSQL과 PGAA의 분석 처리 능력을 비교하기 위해 표준 TPC-DS 벤치마크 테스트를 수행했습니다.

테스트 환경:

순수 PG18 (Tuned): 인덱스 최적화를 거친 PostgreSQL 18 힙 테이블.
PG18 + EDB PGAA + Spark (CPU): CPU만 사용하는 Spark 클러스터로 쿼리 오프로드.
PG18 + EDB PGAA + Spark RAPIDS (GPU): NVIDIA RAPIDS 플러그인을 활성화한 GPU 가속 환경.

핵심 결과:

100GB ~ 3TB 데이터 세트: PGAA와 Spark RAPIDS 조합은 순수 PostgreSQL 대비 전체 워크로드를 50~100배 더 빠르게 완료했습니다.
3TB 규모의 압도적 성능: 3TB 이상의 대규모 환경에서 GPU 가속 효과는 극대화됩니다. Spark RAPIDS는 순수 Spark보다 7~14배 빠르며, PostgreSQL에서 2시간 이상 걸리던 쿼리를 단 5분 만에 끝냈습니다.
안정성: PostgreSQL은 3TB 데이터에서 99개 쿼리 중 15개가 타임아웃(2시간 초과) 되었으나, Spark RAPIDS는 모든 쿼리를 성공적으로 처리했습니다.

특히 NVIDIA RTX Pro 6000 시스템에서는 L40S 시스템보다 1.5~4.6배 더 높은 성능 향상을 관찰했습니다.

엔터프라이즈에 GPU 가속이 필요한 이유

오늘날의 데이터베이스는 단순한 임의 쿼리 처리를 넘어, AI 에이전트 시스템에 실시간 엔터프라이즈 데이터를 공급해야 합니다. GPU 가속은 다음과 같은 비즈니스 가치를 제공합니다.

비용 효율성: 초기 투자 비용은 높을 수 있지만, 처리 속도가 월등히 빨라 운영 비용과 방대한 CPU 클러스터 유지비를 절감할 수 있습니다.
확장성: 데이터가 증가해도 쿼리 성능 저하 없이 100배 이상의 데이터 용량을 관리할 수 있습니다.
통합 워크로드: 데이터 엔지니어링과 머신러닝 워크로드가 단일 플랫폼에서 공존할 수 있어 운영 복잡성이 줄어듭니다.

EDB Postgres AI: 소버린(Sovereign) 통합 플랫폼

EDB PG AI는 분석 가속을 넘어 안전한 기업 운영을 위한 최적의 배포 옵션을 제공합니다.

NVIDIA NIM 모델 서빙: Llama 3, Nemotron 등의 모델을 온프레미스에서 최적화하여 추론합니다.
고속 RAG: NVIDIA NeMo Retriever를 통해 가속화된 검색 성능을 구현합니다.
에어갭(Air-gapped) 지원: 완전 폐쇄망 환경에서도 컨테이너와 모델을 운영할 수 있어 데이터 주권을 보장합니다.

Postgres 전문가를 위한 제언

분석 워크로드를 위해 PostgreSQL을 튜닝하는 과정은 매우 복잡하고 시간이 많이 걸립니다. 반면 EDB PGAA는 별도의 인덱스 튜닝 없이도 즉시 사용 가능합니다.

개발자들은 익숙한 SQL 환경을 그대로 유지하면서, 기존에 별도의 데이터 웨어하우스로 분리해야 했던 고부하 분석 작업을 Postgres 내부에서 처리할 수 있습니다. 이는 데이터 사일로(Silo)를 제거하고 복잡한 분석에 따르는 이른바 ‘Postgres 세금(Postgres Tax)’을 획기적으로 줄여줍니다.

GPU 가속 Postgres 분석 직접 체험하기

지금 바로 GPU 가속 환경을 테스트해 보고 싶다면, EDB가 준비한 GitHub 저장소를 방문해 보세요. Docker Compose를 통해 NVIDIA 환경에 최적화된 Spark 클러스터와 EDB Postgres를 즉시 배포할 수 있습니다.

메일: salesinquiry@enterprisedb.com

02-501-5113

문의 하기

Visited 29 times, 1 visit(s) today

카테고리: EDB Lab

Tags: AI 에이전트 Apache Spark EDB NVIDIA GPU 가속 PostgreSQL RAPIDS TPC-DS 데이터 분석 성능 최적화

Technical Blog

2026-03-18