Hadoop
重要聲明:馬克-to-win @ 馬克java社區(qū):防盜版實(shí)名手機(jī)尾號(hào):73203。 既然我們的名字叫最最最入門,這個(gè)講義的特點(diǎn)就在于成本最低的, 讓你最快速的,最容易的入門。大數(shù)據(jù)的最大的難點(diǎn)在于入門入不了,從而最終放棄。俗話說師傅領(lǐng)進(jìn)門,修行在個(gè)人。只要入了門了,后面的事都好辦。當(dāng)然,既 然側(cè)重點(diǎn)在于如何入門,內(nèi)容選的就不是很多。那些已經(jīng)入門的,或者想學(xué)到精通級(jí)別的同學(xué),請(qǐng)千萬(wàn)不要選我這套講義,選課前,務(wù)必注意本章的學(xué)習(xí)目標(biāo)和內(nèi) 容。想學(xué)更多,注意后邊的課程。
什么是Hadoop?什么是HDFS?
什么是Hadoop?什么是HDFS?馬克-to-win @ 馬克java社區(qū):Hadoop是Apache基金會(huì)開發(fā)的一個(gè)分布式系統(tǒng)基礎(chǔ)架構(gòu)。比如前面我們接觸的Spring就是一個(gè)開發(fā)應(yīng)用框架。Hadoop 實(shí)現(xiàn)了一個(gè)分布式文件系統(tǒng)( Distributed File System),加上Hadoop,即HDFS。Hadoop最核心的設(shè)計(jì)就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),而 MapReduce則為海量的數(shù)據(jù)提供了計(jì)算。從以下的包名就可以看出。 import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper;
馬克- to-win:馬克 java社區(qū):防盜版實(shí)名手機(jī)尾號(hào): 73203。