DRILL (1) 썸네일형 리스트형 오픈소스 플랫폼 - Kudu 출처 원문 https://d2.naver.com/helloworld/9099561 [저장 측면 - Kudu] 1. 데이터가 칼럼 기반으로 저장돼 있어 특정 칼럼만 읽을 때는 디스크에서 읽는 양을 획기적으로 줄여 성능을 높일 수 있다. 다른 칼럼 기반 스토리지인 Parquet와 다르게 테이블을 생성할 때 각 칼럼마다 압축 방식과 인코딩 방식을 사용자가 지정할 수 있다. 2. 일반 DBMS처럼 primary key를 제공해 랜덤 액세스 속도가 매우 빠르다. Kudu의 primary key는 내부적으로 B+ 트리로 저장돼 있어 대규모 데이터에서도 primary key를 사용해 매우 빠르게 데이터에 접근할 수 있다. 수백억 건의 레코드에서도 primary key로 접근하는 데는 수 밀리초밖에 걸리지 않는다. 3.. 이전 1 다음