hadoop 3.0에서는 replication factor로 인해 디스크 공간 낭비를 줄이고자 erasure encoding 지원

아래와 같이 3가지 type에 데이터를 분류하여

 

1. hot data: 하루에 20번 이상 접근이 되고 7일 이내 데이터로 모든 replicator 데이터 유지

 

2. warm data : 1주일에 여러번 접근이 되는 데이터로 1 replicator는 disk에 나머지는 archive tier에 유지

 

3. cold data : 1달에 몇번 접근이 되고 1달 이상된 데이터로 cold layer 또는 삭제 대상이 됨

 

 

ECManager, ECClient, ECWorker 프로세스 사용

 

'NoSQL > Hadoop' 카테고리의 다른 글

hdfs admin 명령어  (0) 2019.06.27
hdfs app 프로그램  (0) 2019.06.27
HDFS DataNode내 Disk 데이터 밸런싱  (0) 2019.06.27
HDFS DataNode 데이터 밸런싱  (0) 2019.06.27
sentry 보안  (0) 2019.06.21

+ Recent posts