하둡에 gzipped file, sequence files and avro datafile들을 command line 상에서 읽기를 원할때
아래와 같이 command를 수행하면 됨
hadoop fs -text /tmp/test/test.avro | more
hadoop fs -text /tmp/test/test.seq | more
sequence file sort 테스트
hadoop jar \
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar \
sort -r 1 \
-inFormat org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat \
-outFormat org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat \
-outKey org.apache.hadoop.io.IntWritable \
-outValue org.apache.hadoop.io.Text \
test.seq sorted
'NoSQL > Hadoop' 카테고리의 다른 글
HDFS DataNode 데이터 밸런싱 (0) | 2019.06.27 |
---|---|
sentry 보안 (0) | 2019.06.21 |
hadoop serialization and deserialization (0) | 2017.03.10 |
hadoop compression and decompression (0) | 2017.03.10 |
yarn 구조 (0) | 2017.03.08 |