Hadoop入门教程:基于Java API实现作业提交
最新学讯:近期OCP认证正在报名中,因考试人员较多请尽快报名获取最近考试时间,报名费用请联系在线老师,甲骨文官方认证,报名从速!
我要咨询Hadoop入门教程:基于Java API实现作业提交,在2.4.1中讲到Java接口的词频统计程序在编译时需要打包为wordcount.jar包文件,现在使用Hadoop的提交命令就可以将在本地编译并打包好的程序提交到Hadoop集群运行,提交的脚本命令如下:
#!/bin/bash
#提交运行脚本
HADOOP_VERSION=1.0.4
jar_path = /usr/nuoline/wordcount/wordcount.jar #用户程序所在目录
HADOOP_HOME=/home/nuoline/hadoop-$HADOOP_VERSION
input=/usr/nuoline/wordcount/input #HDFS中的输入路径
output=/usr/nuoline/wordcount/output #是HDFS中的输出路径
$HADOOP_HOME/bin/hadoop jar $jar_path MyWordCount $input $output
在提交的脚本中至少需要指定HADOOP_HOME环境变量,同时还需要指定编译打包好的jar文件目录,执行命令后先根据HADOOP_HOME得到conf目录的配置文件,再确定提交集群的属性参数。