hive.stats.autogather



analyze table test1 compute statistics;


analyze table test1 compute statistics for columns;



hive.cbo.enable=true

hive.compute.query.using.stats = true

hive.stats.fetch.column.stats=true

hive.stats.fetch.partition.stats = true



파티션 전체에 대해서 통계 정보 수집

analyze table test1 partition(pt_dt) compute statistics;


통계 수집 정보 확인

describe formatted test1 partition(pt_dt='20170110');



top k statistics 정보 수집


set hive.stats.topk.collect=true

set hive.stats.topk.num=4

set hive.stats.topk.minpercent=0

set hive.stats.topk.poolsize=100





'NoSQL > Hive' 카테고리의 다른 글

impala가 지원하지 않는 기능  (0) 2017.02.25
hive index  (0) 2017.02.19
hive load data  (0) 2017.02.19
hive orc file format  (0) 2017.02.18
hive table merge  (1) 2017.02.18

+ Recent posts