2010 年 11 月 – 编码无悔 / Intent & Focused

[原创] 运行C++ hadoop程序时如何设置job参数

2020 年 05 月 03 日2010 年 11 月 25 日作者 learnhard

以pipe方式运行C++ hadoop程序时，如果想要动态设置job的参数（例如设置job name），不像用Java那么方便（可能是我没有找到对应的函数），因为在头文件 Pipes.hh 中，虽然有 JobConf 这样一个类，却没有提供相应的set方法，而只有get方法。

2020 年 05 月 03 日2010 年 11 月 20 日作者 learnhard

假设你有上百G的数据，你要统计出这些数据中，含有某些你感兴趣的内容的数据的有多少条，你会怎么做？在硬件条件允许的情况下，用hadoop并行计算是一个不错的选择。

为了使本文得以清晰地说明，我们不妨假设如下的情况：

2020 年 05 月 03 日2010 年 11 月 10 日作者 learnhard

下面是一些未归类的命令及操作方法，专门记在此文中，以便将来查询。由于文章较长，请用Ctrl+F查询关键字来定位到你需要的内容。