a : data-local

b : rack-local

c : off-rack




key 1개 일때 reduce 생성하여 결과 출력




key가 여러개일때 key별 reduce를 생성하여 결과 출력



* data shuffling 방지 하기 위해 fun 종류에 따라 combiner function을 사용

  => max는 각각 map에 대해 max를 구하면 되지만 mean의 경우에는 해당 key에 대한 평균값을

      사용해야 함으로 combiner function을 사용할수 없음




reduce job이 없을경우





'NoSQL > Hadoop' 카테고리의 다른 글

yarn 구조  (0) 2017.03.08
hadoop read & write  (0) 2017.03.06
hadoop streaming  (0) 2017.03.06
hadoop distcp  (0) 2017.03.02
Hadoop streaming  (0) 2016.07.01

+ Recent posts