彈性分散式數據集

彈性分散式數據集(Resilient Distributed Dataset,RDD)是 Spark 中的核心概念。

基本介紹

  • 中文名:彈性分散式數據集
  • 外文名:Resilient Distributed Dataset
  • 縮寫:RDD
􏵌􏱯􏰯􏱎􏲑􏰭􏰮􏰽彈性分散式數據集(Resilient Distributed Dataset,RDD)是 Spark 中的核心概念。
lines = sc.textFile("README.md")
通過 textFile 方法創建的 lines,就是一個 RDD
RDD 支持 2 種操作:Transformation 和 Action。

相關詞條

熱門詞條

聯絡我們