知道创宇大数据面试题

知道创宇
知道创宇大数据面试题文章插图
(1)为啥用rdd不用DF或者是DS
【知道创宇大数据面试题】(2)sparkstreaming窗口函数处理数据时 , 如果我处理近一个小时的数据 , 但是出现上一个小时数据如何处理
(3)sparkstreaming处理数据时 , 出现kafka消费数据延迟 , 出现上一个小时数据 , 如何处理
(4)scala和java相比开发spark的优点
(5)你对隐式函数的了解 , 能看懂隐式函数吗?
(6)如何实现topn
(7)如何实时更新topn
(8)你们需求谁提的 , 目的是啥