hadoop WordCount例子詳解。

馬克-to-win @ 馬克java社區(qū):下載hadoop-2.7.4-src.tar.gz,拷貝hadoop-2.7.4-src.tar.gz中hadoop- mapreduce-project\hadoop-mapreduce-examples\src\main\java\org\apache\hadoop \examples下的WordCount.java文件中的內(nèi)容到新創(chuàng)建的WordCount空類中。此處附上:
馬克- to-win:馬克 java社區(qū):防盜版實(shí)名手機(jī)尾號: 73203。



package com;
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;




public class WordCount {
/* 馬克-to-win @ 馬克java社區(qū):下面的話是我講靜態(tài)內(nèi)部類時(shí)的話:馬克-to-win:這里的內(nèi)部類的static,意思是它可以不用實(shí)例化外部類,就自己單獨(dú)被實(shí)例化,單獨(dú)存在(有點(diǎn)像生活中的辦公室和辦公桌(獨(dú)立于辦公室,辦公桌也可以存在)),靜態(tài)方法不就不用實(shí)例化類,直接用嗎?就實(shí)例化而言,靜態(tài)內(nèi)部類和外層類之間完全沒有任何關(guān)系,相互獨(dú)立。誰愛怎么樣,就怎么樣!誰想實(shí)例化誰就實(shí)例化,不管對方的感受。當(dāng)然要想讓它們有關(guān)系,也可以,見下面例子中的tc.core=nc;*/
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();