3 下列关于 Spark 组件的说法中,错误的是:(单选题)

A、窄依赖指的是每一个parent RDDPartition最多被子RDD的一个Partition使用,宽依赖指的是多个子RDDPartition会依赖同一个parent RDDPartition

BSpark中的数据本地性有三种:(PROCESS_LOCALNODE_LOCALANY),通常读取数据 PROCESS_LOCAL > NODE_LOCAL > ANY

CSpark 划分 DAG 中的 stage的标准是:宽依赖

DSpark中的Join算子,一定是执行宽依赖计算

请先 登录 后评论

1 个回答

wallaceked

D,Spark的Join算子执行可能产生shuffle,是宽依赖,也可能不会shuffle,是窄依赖。

请先 登录 后评论