1. filesystem mount option
- ext4 or xfs
- mount option : noatime ( logging disable )
2. hdfs block size
- block 사이즈에 따라 metadata 사이즈가 증가하며, mapper 개수도 결정됨으로 적정사이즈 설정
( 128MB ~ 1GB, dfs.blocksize)
3. Short circuit read
- 성능을 최적화를 위해 data와 같이 배치된 client는 datanode 없이 데이터를 읽을수 있게 설정
dfs.client.read.shortcircuit=true
dfs.domain.socket.path=/var/lib/Hadoop-hdfs/dn_socket
4. Stale Datanode
- datanode가 통신이 안될경우 client에서 해당 datanode 연결을 제외
dfs.namenode.avoid.read.stale.datanode=true
dfs.namenode.avoid.write.stale.datanode=true
'NoSQL > Hadoop' 카테고리의 다른 글
map/reduce job runtion optimization (0) | 2019.07.17 |
---|---|
map/reduce optimization (0) | 2019.07.17 |
hadoop os tunning (0) | 2019.07.16 |
hadoop map/reduce job 실행 (0) | 2019.07.11 |
yarn admin (0) | 2019.07.09 |