Scala當(dāng)中什么是RDD(Resilient Distributed Datasets)彈性分布式數(shù)據(jù)集

馬克-to-win@馬克Java社區(qū):RDD(Resilient Distributed Datasets)彈性分布式數(shù)據(jù)集。你不好理解的話,可以把RDD就可以看成是一個(gè)簡(jiǎn)單的"動(dòng)態(tài)數(shù)組"(比如ArrayList),對(duì)其操作,也只需要 調(diào)用它的方法而已,和java中的ArrayList一樣。但它與一般動(dòng)態(tài)數(shù)組的區(qū)別在于:RDD是分布的。彈性是指的是數(shù)據(jù)自動(dòng)在內(nèi)存和磁盤切換, task如果失敗會(huì)進(jìn)行特定次數(shù)的重試。如果在某個(gè)節(jié)點(diǎn)發(fā)生錯(cuò)誤,RDD會(huì)自動(dòng)在不同的節(jié)點(diǎn)中重試。馬克- to-win:馬克 java社區(qū):防盜版實(shí)名手機(jī)尾號(hào): 73203。