1. filesystem mount option

   - ext4 or xfs 

   - mount option : noatime ( logging disable )

 

2. hdfs block size

   - block 사이즈에 따라 metadata 사이즈가 증가하며, mapper 개수도 결정됨으로 적정사이즈 설정

     ( 128MB ~ 1GB, dfs.blocksize) 

 

3. Short circuit read

   - 성능을 최적화를 위해 data와 같이 배치된 client는 datanode 없이 데이터를 읽을수 있게 설정

     dfs.client.read.shortcircuit=true

     dfs.domain.socket.path=/var/lib/Hadoop-hdfs/dn_socket

 

4. Stale Datanode

   - datanode가 통신이 안될경우 client에서 해당 datanode 연결을 제외

     dfs.namenode.avoid.read.stale.datanode=true

     dfs.namenode.avoid.write.stale.datanode=true

'NoSQL > Hadoop' 카테고리의 다른 글

map/reduce job runtion optimization  (0) 2019.07.17
map/reduce optimization  (0) 2019.07.17
hadoop os tunning  (0) 2019.07.16
hadoop map/reduce job 실행  (0) 2019.07.11
yarn admin  (0) 2019.07.09

+ Recent posts