Hadoop

重要聲明:馬克-to-win @ 馬克java社區(qū):防盜版實名手機尾號:73203。 既然我們的名字叫最最最入門,這個講義的特點就在于成本最低的, 讓你最快速的,最容易的入門。大數(shù)據(jù)的最大的難點在于入門入不了,從而最終放棄。俗話說師傅領進門,修行在個人。只要入了門了,后面的事都好辦。當然,既 然側(cè)重點在于如何入門,內(nèi)容選的就不是很多。那些已經(jīng)入門的,或者想學到精通級別的同學,請千萬不要選我這套講義,選課前,務必注意本章的學習目標和內(nèi) 容。想學更多,注意后邊的課程。




什么是Hadoop?什么是HDFS?

什么是Hadoop?什么是HDFS?馬克-to-win @ 馬克java社區(qū):Hadoop是Apache基金會開發(fā)的一個分布式系統(tǒng)基礎架構(gòu)。比如前面我們接觸的Spring就是一個開發(fā)應用框架。Hadoop 實現(xiàn)了一個分布式文件系統(tǒng)( Distributed File System),加上Hadoop,即HDFS。Hadoop最核心的設計就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲,而 MapReduce則為海量的數(shù)據(jù)提供了計算。從以下的包名就可以看出。 import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper;
馬克- to-win:馬克 java社區(qū):防盜版實名手機尾號: 73203。