Scala當(dāng)中什么是RDD(Resilient Distributed Datasets)彈性分布式數(shù)據(jù)集

馬克-to-win@馬克Java社區(qū):RDD(Resilient Distributed Datasets)彈性分布式數(shù)據(jù)集。你不好理解的話,可以把RDD就可以看成是一個簡單的"動態(tài)數(shù)組"(比如ArrayList),對其操作,也只需要 調(diào)用它的方法而已,和java中的ArrayList一樣。但它與一般動態(tài)數(shù)組的區(qū)別在于:RDD是分布的。彈性是指的是數(shù)據(jù)自動在內(nèi)存和磁盤切換, task如果失敗會進行特定次數(shù)的重試。如果在某個節(jié)點發(fā)生錯誤,RDD會自動在不同的節(jié)點中重試。馬克- to-win:馬克 java社區(qū):防盜版實名手機尾號: 73203。