Hacker News 2026.06.30 50

QuestDB는 WINDOW JOIN을 어떻게 병렬·벡터화로 다시 만들었을까

시계열 데이터에서 'JOIN'이 까다로운 이유

주식 호가, 센서 측정값, 서버 메트릭처럼 시간 순서가 생명인 데이터를 다뤄본 분이라면 '시계열 데이터베이스'를 들어보셨을 거예요. 그중 하나가 QuestDB인데요, 이번에 자기네 WINDOW JOIN 연산을 병렬화하고 벡터화해서 확 빠르게 만든 과정을 공개했어요. 말이 좀 어렵죠? 하나씩 풀어볼게요.

먼저 시계열에서의 JOIN이 왜 특별한지부터요. 일반 관계형 DB에서 JOIN은 "두 테이블에서 키 값이 정확히 같은 행끼리 붙여라"예요. 그런데 시계열에서는 시각이 1초도 어긋나지 않고 딱 맞는 경우가 거의 없어요. 예를 들어 "이 거래 시점에 가장 가까운 직전 호가를 붙여줘" 같은 요청이 훨씬 흔하거든요. 이런 '시간 기준으로 가장 가까운 짝 찾기'를 ASOF JOIN이나 WINDOW JOIN으로 처리해요. WINDOW JOIN은 "이 시점을 기준으로 앞뒤 일정 시간 창(window) 안에 들어오는 반대편 행들을 묶어줘"라는 식이죠.

느렸던 이유와 두 가지 처방

기존 방식이 느렸던 건, 한 행을 처리할 때마다 반대편 테이블에서 시간 창에 맞는 행들을 하나하나 찾아 들어가는 작업을 단일 스레드로, 그것도 한 건씩 처리했기 때문이에요. 데이터가 수억 건이 되면 이게 병목이 됩니다. QuestDB가 꺼낸 처방은 두 가지예요. 바로 '병렬화(parallel)'와 '벡터화(vectorized)'죠.

병렬화는 이해하기 쉬워요. 일을 여러 CPU 코어에 나눠 동시에 시키는 거예요. 시계열 데이터를 시간 구간별로 쪼개서, 여러 코어가 각자 맡은 구간을 동시에 JOIN하게 만든 거죠. 식당으로 치면 주방장 한 명이 주문을 다 처리하던 걸, 여러 명이 테이블을 나눠 맡는 셈이에요. 다만 시간 창이 구간 경계를 넘나드는 경우를 정확히 처리해야 해서, 단순히 쪼개기만 하면 안 되고 경계 부분을 세심하게 다뤄야 하는 게 어려운 지점이에요.

벡터화가 진짜 핵심이에요

벡터화는 조금 더 설명이 필요해요. 보통 우리가 짜는 코드는 데이터를 한 번에 하나씩 처리해요. "1번 값 더하고, 2번 값 더하고, 3번 값 더하고…" 이런 식이죠. 그런데 현대 CPU에는 SIMD(Single Instruction, Multiple Data)라는 기능이 있어요. 한 번의 명령으로 여러 개의 값을 동시에 처리하는 특수 기능이에요. 컨베이어 벨트에 물건을 하나씩 올리던 걸, 8개를 한 줄로 올려서 한 번에 처리하는 거라고 보면 돼요.

WINDOW JOIN에서 "이 행의 시각이 시간 창 안에 들어오는가"를 판단하는 비교 연산을, 한 건씩이 아니라 여러 건을 한꺼번에 비교하도록 바꾼 게 벡터화의 핵심이에요. 시각 값들을 메모리에 차곡차곡 연속으로 깔아두고(이걸 컬럼 기반 저장이라고 하는데 QuestDB가 잘하는 부분이에요), SIMD 명령으로 한 번에 쭉 비교해버리는 거죠. 데이터가 메모리에 연속으로 붙어 있으면 CPU 캐시도 잘 활용돼서 추가로 빨라지고요. 이 두 가지를 합치니 처리량이 기존 대비 몇 배로 뛰었다고 해요.

업계 맥락에서 보면

이런 '병렬 + 벡터화' 조합은 사실 요즘 고성능 분석 엔진들의 공통된 방향이에요. ClickHouse, DuckDB 같은 컬럼형 분석 DB들도 SIMD 벡터화를 적극 활용해서 빠른 속도를 내거든요. 한 행씩 처리하는 전통적인 '튜플 단위 실행' 대신, 데이터를 묶음(배치)으로 처리하는 '벡터화 실행 모델'이 표준처럼 자리 잡고 있어요. QuestDB의 이번 작업도 시계열이라는 특수 영역에서 그 흐름을 따라간, 그리고 시간 창이라는 까다로운 조건을 그 모델에 녹여낸 사례로 볼 수 있어요.

한국 개발자에게 주는 시사점

금융 데이터, IoT 센서, 모니터링 메트릭을 다루는 팀이라면 시계열 DB는 점점 피하기 어려운 선택지예요. 이런 ASOF/WINDOW JOIN 성능은 "수억 건 데이터에서 실시간 대시보드를 띄울 수 있느냐"를 좌우하는 실전 변수거든요. 당장 QuestDB를 도입하지 않더라도, '컬럼 저장 + SIMD 벡터화'가 왜 빠른지를 이해해두면 DB 선택과 쿼리 튜닝에서 큰 무기가 돼요.

그리고 더 넓게 보면, 이건 "내 코드도 데이터를 한 건씩 말고 묶음으로 처리할 수 없을까"라는 사고방식을 길러줘요. 데이터 지향적으로 메모리 레이아웃을 설계하는 감각은 DB뿐 아니라 일반 백엔드 성능 최적화에도 그대로 통합니다.