TG360 Technologies

  • 홈
  • 태그
  • 방명록

Parquet의 파일 구조 1

Parquet 파일 구조와 관련 설정 값 이해하기

Parquet는 아파치 하둡 에코 시스템에서 사용하는 칼럼 기반의 데이터 저장 형식입니다. 여러 인코딩과 압축을 지원함으로써 다양한 프로젝트에서 인기리에 사용 중입니다. Parquet을 효과적으로 사용하는 데에는 많은 요소들을 살펴봐야 하지만, 이 번 글에서는 파일 구조와 관련된 설정값을 같이 보면서 Parquet을 보다 심층적으로 이해하는 시간을 가져보도록 하겠습니다. Parquet의 파일 구조 Parquet은 Header, Blocks, Footer. 이 세 형식을 가집니다. Header와 Footer는 Meta 정보이며, 각 1개씩만 존재합니다. Blocks는 List 형식이며 여기에 실제 N 개의 데이터가 저장됩니다. 이를 정리해 보면 아래와 같습니다. Header(Metadata) : Parqu..

Tech 2022.05.23
1
더보기

여러정보가 있는 TG360 Technologies 기술 블로그입니다.

  • 분류 전체보기 (18)
    • Tech (16)
    • Infra (1)

Tag

CDP, 벤치마킹정리, hive query error, 디자인방향성, 시퀀스다이어그램, sourcetree, crm, 형상관리, Easing Functions, 안드로이드 애니메이션 효과, ApplicationRunner, DMP, springdoc, Trino, 쿠키수집동의서비스, IOS 애니메이션 효과, Buitbucket, SQL On Hadoop, hive 쿼리 오류, git,

최근글과 인기글

  • 최근글
  • 인기글

공지사항

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :
TG360 Facebook Youtube

Copyright © TG360 Corp. All rights reserved.

티스토리툴바