spark sql 注意事项(不定期记录)

注意1:num = dateframe.filter("字段=某值").count()

              num2 = dateframe.filter("字段!=某值").count()

             理想情况下应该num+num2=总的记录数,但却不是,不要忘记若存在null值

            num3 = dateframe.filter("字段 is null").count(),这样才能使num+num2+num3=总记录数


猜你喜欢

转载自blog.csdn.net/hanfeixue11/article/details/53613194
今日推荐