[原创] 如何用Apache Pig输出压缩格式的SequenceFile

查看更多Apache Pig的教程请点击这里

SequenceFile是Hadoop API提供的一种二进制文件,它将数据以<key,value>的形式序列化到文件中。

如果你要用Apache Pig读取这种类型的数据,可以用 PiggyBank 中的SequenceFileLoader——我没有用过,但肯定是没问题的。