Spark报java.util.NoSuchElementException: head of empty list错误的解决方法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/bluishglc/article/details/81208008

如果在Spark Structured Streaming上使用了Arbitrary Stateful Operations, 也就是使用了mapGroupsWithStateflatMapGroupsWithState方法,而其中GroupState[S]的S又偏偏是一个自定义的类型,那么你就会遇到这个错误!产生这个错误的原因是Spark找不到相应的Encoder,Encoder的作用是负责JVM类类型和Spark SQL内部表示之间的相互转换。通常大部分的基础类型都通过SparkSession的implicit import声明了,而自定义的类型需要特别指定对应的Encoder,而这也并不困难,通过kryo我们可以方便地创建出encoder来解决这个错误。例如:假定我们的自定义State叫MyState,我们可以这样做:

import sparkSession.implicits._
implicit val stateEncoder = org.apache.spark.sql.Encoders.kryo[MyState]
sparkSession
  .xxx
  .groupByKey(...)
  .mapGroupsWithState(GroupStateTimeout.NoTimeout()){
    case (key: String, events: Iterator[Event], state: GroupState[MyState]) => ...
  }
  .xxx

本文原文链接: http://blog.csdn.net/bluishglc/article/details/81208008 转载请注明出处。

猜你喜欢

转载自blog.csdn.net/bluishglc/article/details/81208008
今日推荐