GPU기반 빅데이터, AI 분석 플랫폼

빅데이터 분석에 새로운 가치를 부여하는 GPU 데이터베이스

  • Unione I&C

    데이터베이스, 첨단분석,
    빅데이터, AI 전문가 그룹

  • IBM Power®
    System AC922

    최신 HPC, 분석 및 인공지능을
    위한 최고의 성능 제공

  • SQream DB

    Big Data 처리에 최적화된
    GPU기반 분석 플랫폼 제공

  • IBM All Flash &
    Spectrum Storage

    All Flash Storage 및 고성능
    병렬파일처리시스템 제공

유니원아이앤씨㈜는 2003년 창사이래 끊임없는 연구활동과 업무혁신을 통하여 차별화된 서비스를 제공하여 고객가치 극대화를 위해 노력해 왔으며, 4차 산업혁명 시대를 맞아 AI 경제로의 전환을 돕기 위해 IBM 및 SQream DB 파트너로서 국내 주요 금융, 제조 공공 고객에게 AI와 첨단 실시간 분석 솔루션을 제공하고 있습니다.

GPU 기반 빅데이터 분석 플랫폼, "SQream DB on IBM Power® System AC922"

GPU를 사용하는 새로운 DW 아키텍처로, 데이터 처리 성능을 수십~수백 배 개선합니다.
폭발적으로 늘어나는 데이터를 처리하기 위해, 성능 개선의 정점에 이른 GPU를 가속화기로 도입하여 분석하는 새로운 구조의 데이터 처리 플랫폼을유니원아이앤씨가 제안합니다.

SQream DB는 대용량 데이터 처리를 위해 설계되었습니다. IBM Power System은 NVLink를 지원하는 유일한 아키텍처로 가속 컴퓨팅의 잠재력을 열어줍니다.

Power AC922는 NVLink를 통해 x86 기반 아키텍처의 PCIe 3.0보다 약 9.5배 빠른 최대 300GB/s 속도로 데이터를 전송할 수 있어 기존 I/O 병목현상을 줄여줍니다.

  • Power AC922는 IBM의 최신 POWER9™ 프로세서를 탑재하여 AI 시대를 위해 설계된 최상의 플랫폼으로 CPU와 GPU 간의 NVLink를 활성화하는 유일한 아키텍처를 기반으로 한 가속 컴퓨팅의 새로운 가능성을 제공.

  • SQream DB는 빅데이터 분석을 위한 모든 기능을 갖춘 엔터프라이즈급 데이터웨어하우스이며, 인메모리DB나 Hadoop의 SQL 변환 계층이 아니라 메모리보다 크고 지속적으로 증가하는 데이터의 처리를 위해 설계됨.

  • Big Data 처리에 최적화된 GPU기반 분석 플랫폼 제공IBM Spectrum Scale은 고성능 파일 스토리지 또는 비용에 최적화된 대규모 컨텐츠 저장소로 배치할 수 있는 유연한 소프트웨어 정의 스토리지 이며, 병목현상 없이 성능 및 용량을 확장 가능하도록 처음부터 설계됨.

AI 프로젝트 시작과 함께 비즈니스 성과를 바로 확인할 수 있는 지름길

  • CONSULTING

    유니원아이앤씨㈜ 컨설팅 서비스

    산업별, 솔루션별 전문 컨설턴트가 고객의 AI 요구 사항을 분석해 솔루션 라인업 제안

  • AI READY INFRA

    IBM All Flash Storage & Spectrum Storage

    IBM All Flash Storage는 모든 워크로드에 맞춤형 솔루션을 제공하는 업계 최고 Flash Storage 이며, Spectrum Scale(GPFS)은 대규모 데이터를 더 쉽게, 효율적이고 지능적으로 관리할 수 있는 소프트웨어 정의 스토리지

  • AI TRAINING

    IBM Power® System AC922

    Power AC922의 시스템을 활용한 머신 러닝, 딥러닝 트레이닝 방법론 제안

  • AI SOFTWARE

    AI 전용 소프트웨어

    NVIDIA CUDA, cuDNN, cuBLAS, TensorRT 등 딥러닝에 최적화된 프레임워크, 라이브러리, 개발 환경 그리고 도커 기반 컨테이너 환경까지 사전에 설치 및 최적화하여 제공

  • BIG DATA

    빅 데이터 처리/분석

    스마트한 AI를 위한 빅 데이터 분석 및 관리 방안 제시, SQream DB를 이용한 페타바이트 급의 Raw Data 분석과 Insight 도출 제안

  • AI INFERENCE

    AI 추론

    딥러닝 트레이닝과 추론 작업의 효율 강화를 위한 프로페셔널 서비스 제공, SQream DB를 활용해 실시간 데이터 스트림과 빅 데이터를 트레이닝과 추론에 반영

  • SCALE OUT

    확장

    AI 컴퓨팅 수요 증가로 인한 자원 부족 시 GPFS를 통한 스케일 아웃 확장 또는 GPU 클라우드 활용을 제안

Lead-and-Go,
쉽고 빠른 GPU 기반 SQream DB

SQream DB는 빅데이터 분석을 위한 모든 기능을 갖춘 엔터프라이즈급 데이터웨어 하우스이며, 인메모리DB나 Hadoop의 SQL 변환 계층이 아니라 메모리보다 크고 지속적으로 증가하는 데이터의 처리를 위해 설계됨

Big-data 분석에 효과적인
Columnar 방식

OLAP을 위한 효율적인 Columnar 데이터베이스 방식으로 각 계정 당, 일별 집계 연산 등 빅데이터 분석에 최적화되어 있습니다. Columnar 데이터베이스는 유사한 데이터를 모아서 저장하므로, 데이터 압축률이 더 높습니다.

GPU 리소스를 효율적으로 사용할 수
있도록 Chunk 단위 데이터 Store 및 Read

SQream DB 테이블들은 다차원으로 데이터를 파티셔닝하여 확장성을 늘릴 수 있도록 설계되어 있습니다. Data Chunking은 Ingest 하는 동안 자동으로 수행되는데, 모든 컬럼의 집합은 Data Chunk 단위로 스토리지에 저장되며 자동으로 수직/수평 파티셔닝을 수행하여, Columnar에 대한 선택적 접근 및 chunk 단위 스토리지 사용을 통해 제약적인 GPU 메모리 환경에서도 Transaction이 효율적으로 수행되도록 합니다.

유연한 Ad-hoc 쿼리를 위한
스마트 메타 데이터

데이터 로드 중 자동으로 생성되는 Smart Metadata는 기존 데이터베이스에서 수동으로 설정하던 Indexing을 대체합니다. 사용자는 별도의 Index와 기본 키를 설정할 필요가 없으며, Chuck 별로 생성된 Smart Metadata는 SQream DB에서 광범위하게 사용되는데, 각 쿼리 처리와 관련된 데이터 Chunk를 정확히 찾아내어 처리 및 I/O 시간을 줄여 성능을 개선합니다.

고속의 데이터 Ingest 및 처리를
지원하는 GPU 기반 압축/해제

SQream은 데이터 로드 중, GPU를 사용하여 자동으로 데이터를 압축합니다. GPU를 사용하므로, 굉장히 빠르게 모든 데이터를 압축 및 해제할 수 있습니다. 이를 통해 초고속으로 데이터를 수집하고 처리가 가능합니다. 데이터 타입에 따라 자동으로 최적의 압축 방식을 적용하며, 약 1:4-1:7 의 압축률이 적용됩니다.
(대략 100GB raw data 로드 시, 20GB 로 압축)

  • DICT - Dictionary compression
  • Patched Frame-of-Reference (p4d)
  • RLE - Run Length Encoding
  • Snappy - CPU-based text compression
  • "간편하고 빠른 데이터 로드"

    100TB의 데이터를 20TB로,
    GPU를 이용한 데이터 로드와 압축

    • GPU 당 약 3-6TB/hour 의 속도로 빠르게 데이터를 로드할 수 있으며, Multi-GPU Ingestion을 지원합니다. 데이터 로드 후, 별도의 처리 작업 없이 바로 Querying 이 가능합니다.
    • 각 데이터 타입에 최적화된 방식으로 자동 압축합니다.
  • "강력한 Querying 성능"

    SQL 컴파일러 및 최적화 도구 :
    기존 SQL 변경없이 그대로 수행

    • SQream DB는 기존에 사용하던 ANSI-92 기반의 SQL 쿼리를 자동으로 병렬 처리가 가능한 관계형 대수 연산용 쿼리로 자동 변환해줍니다.
    • GPU Core는 최적화된 쿼리를 사용하여 대량의 병렬 연산을 효율적으로 수행할 수 있습니다.
    • 주로 Filter, Join 등의 복잡한 작업들이 가산 및 곱셈과 같은 수학적 개념으로 대치되어, GPU 연산 시 뛰어난 효과를 볼 수 있습니다.
  • "무제한의 확장성, Scale-out 아키텍처"

    100TB의 데이터를 20TB로,
    GPU를 이용한 데이터 로드와 압축

    • SQream DB는 Storage, Compute 노드, GPU 각 컴포넌트를 독립적으로 확장하실 수 있습니다.
    • 예를 들어 데이터가 증가할 경우, 스토리지의 용량만 추가로 확보하여 확장할 수 있습니다.

SQream DB를 더 빠르게!
최적의 플랫폼 IBM Power® System AC922와 함께!

IBM Power Systems Accelerated Compute(Power AC922) Server는 Massive I/O처리를 위해 설계되었으며,
고속의 NVLink전용 인터커넥트 및 최신 PCIe Gen4 I/O버스를 지원하는 유일한 플랫폼입니다.

가속화 컴퓨팅을 위한 Massive I/O 지원 :
4배 빠른 쿼리 성능, 2배 빠른 데이터 로드

  • 최신 Tesla V100 GPU

  • 대용량 메모리
    Scale-up, Scale-out 확장성

  • CPU-GPU 전용
    인터커넥트 기술

  • 데이터 중심의
    오픈 시스템 아키텍처