hive.stats.autogather
analyze table test1 compute statistics;
analyze table test1 compute statistics for columns;
hive.cbo.enable=true
hive.compute.query.using.stats = true
hive.stats.fetch.column.stats=true
hive.stats.fetch.partition.stats = true
파티션 전체에 대해서 통계 정보 수집
analyze table test1 partition(pt_dt) compute statistics;
통계 수집 정보 확인
describe formatted test1 partition(pt_dt='20170110');
top k statistics 정보 수집
set hive.stats.topk.collect=true
set hive.stats.topk.num=4
set hive.stats.topk.minpercent=0
set hive.stats.topk.poolsize=100
'NoSQL > Hive' 카테고리의 다른 글
impala가 지원하지 않는 기능 (0) | 2017.02.25 |
---|---|
hive index (0) | 2017.02.19 |
hive load data (0) | 2017.02.19 |
hive orc file format (0) | 2017.02.18 |
hive table merge (1) | 2017.02.18 |