BDP

Bigidean Data Platform

Hadoop 3.3.x 기반 풀패키지 빅데이터 플랫폼

최신 Hadoop 3.3.x 에코시스템을 통합하고 쉽게 구축할 수 있도록 패키징된 빅데이터 플랫폼입니다. Docker 컨테이너 기반 하이브리드 아키텍처로 도입 비용을 최소화하면서 빅데이터 서비스를 빠르게 적용합니다.

홈으로
개요

합리적인 비용으로
빅데이터를 바로 시작하세요

기존 빅데이터 온프레미스 환경의 과도한 비용 이슈를 줄이기 위해 Container 서비스를 적용한 하이브리드 빅데이터 아키텍처를 통해 도입 비용을 최소화하였습니다. 오픈소스 에코 구성요소들의 커플링을 최소화하여 주요 에코 소프트웨어 버전업을 빠르게 지원합니다.

01

수집

  • 다양한 원천 데이터를 수집 및 가공하여 빅데이터에 적재할 수 있도록 플로우 개발 제공
  • BIS(Bigidean Ingestion Solution) 연동 시 수집 개발 생산성 3~5배 향상
02

데이터웨어하우스

  • 기본 HIVE 데이터웨어하우스 제공
  • 고성능 분석을 위한 Trino SQL Engine 연동
03

워크플로우

  • DolphinScheduler 지원 (직관적이고 생산성 높은 플로우 개발)
04

분석

  • Hue, Zeppelin, Superset, JupyterLab 활용 분석 환경 지원
  • NoSQL(HBase & Phoenix) 및 Trino 엔진 통합으로 SQL 기반 고성능 분석 가능
05

연동

  • 외부 시스템(Web, BI Tool 등)과의 데이터 연동 기술 및 가이드 제공
특징

BDP를 선택하는 이유

🐘

최신 Hadoop 에코 통합

Hadoop 3.3.x 기반 에코 시스템 통합 제공. 검증된 오픈소스 스택으로 안정적인 빅데이터 환경을 구성합니다.

🐳

Docker 하이브리드 아키텍처

컨테이너 서비스 기반 하이브리드 빅데이터 아키텍처로 도입 비용 최소화. 높은 데이터 처리 및 분석 성능을 유지합니다.

⚙️

Ansible One-stop 설치

Ansible Playbooks 기반의 One-stop 클러스터 설치. Command 기반 클러스터 제어 및 관리로 운영 편의성을 높입니다.

🛡️

접근 제어 및 보안

Apache Ranger 기반으로 Hadoop HDFS, Hive Database & Table의 접근 제어 기능 제공. 데이터 보안을 체계적으로 관리합니다.

📈

리소스 모니터링

Namenode·HDFS·YARN 상태 모니터링, 서버별 시스템 리소스 상태 실시간 확인. 전체 서비스 상태 대시보드 제공.

🔤

분산 형태소 분석

빅데이터 기반 분산 형태소 분석 기능 제공. Hive UDF 기반 한글 형태소 분석으로 고성능 처리 및 사용자 사전 적용 가능.

주요기능

강력한 빅데이터 기능 일체

1

쿼리 & 워크플로우 에디터

  • 빅데이터 분석을 위한 ANSI-SQL 지원
  • Hue Assistant 기반 쿼리 지원
  • Apache DolphinScheduler 기반 워크플로우 편집기
2

다양한 데이터 분석 엔진

  • NoSQL(HBase) 및 Trino Engine 제공
  • SQL 기반 고성능 분산 쿼리 처리
  • 이기종 데이터 소스 통합 분석
3

형태소 분석 UDF

  • Hive UDF 기반 한글 형태소 분석
  • 분산 처리 기반 고성능 형태소 분석
  • HDFS 기반 사용자 사전 선택 분석
4

분석 툴 연동

  • 빅데이터 분석 노트북 (Zeppelin)
  • 오픈소스 BI 툴 (SuperSet)
  • JupyterLab 환경 지원
5

통합 서비스 관리

  • 전체 서비스 상태 대시보드
  • 서비스별 제어 기능 (Start/Stop)
  • 오픈소스 컴포넌트 UI 빠른 연결
6

Command Line 관리

  • 전체 서비스 기동 및 중지
  • 서비스별 상태 체크
  • 클러스터 제어 자동화
7

시스템 모니터링 기능

  • Hadoop 상태 모니터링
  • 서버 별 시스템 리소스 상태
  • BDP 서비스 상태 모니터링
8

접근제어 기능

  • Apache Ranger 기반의 통합 접근 제어 제공
  • Hadoop HDFS 및 Hive Database, Table 단위 권한 관리 지원
  • 사용자/그룹 기반 세분화된 정책 설정 및 감사(Audit) 기능 제공
9

운영 효율 & 확장성

  • 분산 클러스터 환경에서 단계적 업그레이드 지원
  • 효율적인 패치 적용으로 운영 부담 최소화
  • 확장 가능한 구조로 노드 증설 및 기능 확장 용이

BDP 도입이 궁금하신가요?

전담 엔지니어가 귀사 환경에 맞는 빅데이터 아키텍처 설계를 도와드립니다.

회사 소개 보기 →