하둡에 gzipped file, sequence files and avro datafile들을 command line 상에서 읽기를 원할때

아래와 같이 command를 수행하면 됨



hadoop fs  -text  /tmp/test/test.avro  | more

hadoop fs  -text  /tmp/test/test.seq  | more



sequence file sort 테스트 


hadoop jar \

$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar \

sort -r 1 \

-inFormat org.apache.hadoop.mapreduce.lib.input.SequenceFileInputFormat \

-outFormat org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat \

-outKey org.apache.hadoop.io.IntWritable \

-outValue org.apache.hadoop.io.Text \

test.seq sorted










'NoSQL > Hadoop' 카테고리의 다른 글

HDFS DataNode 데이터 밸런싱  (0) 2019.06.27
sentry 보안  (0) 2019.06.21
hadoop serialization and deserialization  (0) 2017.03.10
hadoop compression and decompression  (0) 2017.03.10
yarn 구조  (0) 2017.03.08

+ Recent posts