‘GFlux’ 프레임워크 공개… 엔비디아 쿠다 통합 메모리 없이 세계 최고 성능 달성
KAIST(총장 이광형) 전산학부 김민수 교수 연구팀이 세계 최고 수준의 GPU 기반 그래프 연산 프레임워크 ‘GFlux(지플럭스)’를 개발했다. 기존 25대의 고속 네트워크 컴퓨터로 2,000초 이상 걸리던 대규모 연산을, 단 1대의 GPU 장착 컴퓨터로 1,184초 만에 처리하는 데 성공하며, 그래프 컴퓨팅 기술의 새로운 지평을 열었다.
이번 연구 성과는 IEEE 국제데이터공학학술대회(ICDE 2025)에서 발표되었으며, 지식 그래프, 생성형 AI, 그래프 기반 검색 등 복잡한 데이터 연산을 고속으로 처리할 수 있는 핵심 기술로 주목받고 있다.
지플럭스(GFlux)는 기존 GPU 메모리 제한으로 인해 실현하기 어려웠던 1조 개의 간선(edge) 규모 그래프를 효율적으로 처리할 수 있도록 설계되었다. GPU 친화적 그래프 포맷(HGF), 단위 연산 모델(GTask), 동적 스케줄링 기법, 메모리 통합 관리 기술을 핵심으로 하며, 엔비디아 CUDA의 통합 메모리(Unified Memory)에 전혀 의존하지 않는다.
특히 GPU에서 잘 사용되지 않던 3바이트 주소 체계를 세계 최초로 도입해 메모리 사용량을 약 25% 줄였으며, 기존 포맷보다 그래프 데이터 저장 크기를 절반 수준(9TB → 4.6TB)으로 줄이는 데도 성공했다.
성능 검증은 대표적인 고난도 그래프 연산인 ‘삼각형 개수 세기’를 통해 이루어졌다. 이는 데이터 분석과 AI에서 널리 활용되는 연산으로, 약 700억 개 간선을 가진 초대형 그래프를 대상으로 기존 최고 성능 시스템(25대 병렬 서버)이 2,000초가량 걸렸던 연산을, 지플럭스는 단일 GPU 시스템에서 1,184초 만에 성공시켰다.
이는 현재까지 단일 컴퓨터에서 성공한 최대 규모의 그래프 연산 사례로, 그래프 기반 대용량 질의 처리에 있어 새로운 기준을 제시했다.
GFlux의 핵심 기술 구조
지플럭스는 다음과 같은 네 가지 핵심 기술로 구성되어 있다. HGF (Hierarchical Graph Format): 고밀도, 고속 병렬 처리를 위한 GPU 친화형 그래프 저장 포맷. 2단계 파티셔닝과 3바이트 주소 체계(Flip24) 적용, GTask: 다중 홉(multi-hop) 질의를 처리할 수 있도록 연산을 수많은 단위 작업으로 분해해 병렬화,스케줄링 기법: 비동기 병렬 처리를 위해 질의 패턴에 따라 유효 작업을 미리 분석하고 최적화된 작업 분배 수행,동적 버퍼 관리: GPU·호스트 메모리 간의 실시간 데이터 이동 최적화를 위한 Hbuf/Gbuf 버퍼 체계 도입이다. 이러한 기술 결합을 통해, GFlux는 기존 GPU 기반 질의 처리 기술 대비 수백 배 빠른 성능을 제공하며, 대규모 그래프 질의도 메모리 부족 없이 안정적으로 처리할 수 있다.

김민수 교수는 “그래프 기반의 RAG(검색증강생성), GNN(그래프 뉴럴 네트워크), 지식 그래프 등은 LLM을 비롯한 차세대 인공지능 기술과 깊은 관련이 있다”며 “GFlux는 이러한 복잡한 그래프 질의를 고속·안정적으로 처리할 수 있는 혁신적 기반 기술로 평가받고 있다”고 밝혔다.
이 기술은 구글, 메타, 네이버, 카카오와 같은 대기업의 검색·추천·이상탐지 서비스뿐 아니라, 스타트업, 공공기관, 연구기관에도 폭넓게 활용 가능하다.
특히 GPU 1대만으로 수조 개의 데이터 관계를 처리할 수 있다는 점에서, 대규모 연산이 필요한 기업이나 기관에 높은 비용 효율성과 실용성을 제공한다.
#KAIST #GFlux #그래프연산혁신 #GPU컴퓨팅 #HGF포맷 #GTask #김민수교수 #엔비디아CUDA #초대형그래프 #AI그래프기술 #ICDE2025 #그래프기반AI #RAG #GNN #지식그래프