统计每个用户每小时的最大登录次数 - 代码天地

统计每个用户每小时的最大登录次数

其他 2021-03-01 22:53:48 阅读次数: 0

数据文件

a,2020-07-11 10:51:12
a,2020-07-11 11:05:00
a,2020-07-11 11:15:20
a,2020-07-11 11:25:05
a,2020-07-11 11:45:00
a,2020-07-11 11:55:36
a,2020-07-11 11:59:56
a,2020-07-11 12:35:12
a,2020-07-11 12:58:59
b,2020-07-11 14:05:00
b,2020-07-11 14:51:12
b,2020-07-11 15:15:20
b,2020-07-11 15:25:05
b,2020-07-11 16:45:00
b,2020-07-11 16:55:36
b,2020-07-11 16:59:56
b,2020-07-11 17:35:12
b,2020-07-11 17:58:59

spark代码实现

package com.atguigu.homework

import java.text.SimpleDateFormat

import org.apache.spark.rdd.RDD
import org.apache.spark.{
    
    SparkConf, SparkContext}

/**
  * @ClassName: LogInTime
  * @Description:
  * @Author: kele
  * @Date: 2021/1/28 15:37
  **/
object LogInTime {
    
    

  def main(args: Array[String]): Unit = {
    
    

    val sc = new SparkContext(new SparkConf().setMaster("local[4]").setAppName("test"))

    //1、读取数据，
    val rdd = sc.textFile("E:\\小时登录次数.txt")

    // 2、  对数据进行切分，格式转换，方便后期使用
    val rdd2 = rdd.map(x=>{
    
    
      val id = x.split(",").head
      val datetime = x.split(",").last
      val sdf = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss")
      val time = sdf.parse(datetime).getTime

      //返回值是用户id，时间的Long类型，
      (id,time)
    })
    //3、将同一用户分组，并且对时间进行排序,
    val rdd3:RDD[(String,List[Long])] = rdd2.groupByKey().map(x=>{
    
    

      val sorted = x._2.toList.sorted

      (x._1,sorted)
    })
    //4、判断一个用户一小时内的登录次数
    val rdd4=rdd3.map(x=>{
    
    
      //x是(a,list())
      //y是将要对比的时间，
      var num = x._2.map(y=>{
    
    
        // 使用过滤函数
        // z是一个个元素，将要与y对比  判断z大于y且z要小于y+3600000，或者z=y的留下
        x._2.filter(z=>{
    
    
          z>=y && z<y+3600000
        }).count(x=>x==x)
         //使用size会警告，不会影响程序正常运行
      }).sorted.take(1)
      (x._1,num)
    })
    println(rdd4.collect().toList)
  }
}

猜你喜欢

转载自blog.csdn.net/qq_38705144/article/details/113351582

统计每个用户每小时的最大登录次数

用户统计次数

统计所有用户对每个学科的各个模块的访问次数，再取Top3

awk 按小时统计接口调用次数

统计每个字符出现的次数

统计每个数组元素出现的次数

【Java】统计每个字母出现的次数

统计数据库中每月、每天、每小时的数据

Hive案例：根据日志统计某网站每天每小时的PV和UV流量

统计用户打开APP次数

跟我一起学Spark之——用户在线时长和登录次数统计

MySQL按时间统计每个小时记录数

最大出现次数统计的关键算法

MapReduce统计每个用户的使用总流量

Python统计日志中每个IP出现次数

统计字符串每个字符出现的次数

采用Map容器统计每个单词出现的次数

Linux命令学习--统计log中每个IP的访问次数

统计每个元音字母在字符串中出现的次数。

[串] 统计每个单词出现的次数，降序输出

统计字符串中的每个字母出现次数

统计每个元素重复次数及重复元素

统计输入中每个数出现的次数

Map应用实例（统计每个button的点击次数）

python利用dict统计每个文本的出现次数

网上挣钱每小时80元8989

pandas提取每小时数据的方法

REDIS用户登录信息统计

Java项目中，如何限制每个用户访问接口的次数

考勤管理系统：查询每个用户应该打卡的次数

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)