python每5分钟从kafka中提取数据 - 代码天地

python每5分钟从kafka中提取数据

其他 2018-05-25 08:59:55 阅读次数: 0

import sys
sys.path.append("..")
from datetime import datetime
from utils.kafka2file import KafkaDownloader
import  os
"""
实现取kafka数据，文件按照取数据的间隔命名
如每5分钟从kafka取数据写入文件中，文件名为当前时间加5
"""

TOPIC = "rtz_queue"
HOSTS = "ip:9092,ip:9092"
GROUP = "2001"

def get_end_time(hour,minute,time_step):
    if (minute+time_step)%60<60:
        if (minute+time_step)%60<10:
            return str(hour+int((minute+time_step)/60))+":"+"0"+str((minute+time_step)%60)
        else:
            return str(hour+int((minute+time_step)/60))+":"+str((minute+time_step)%60)
    else:
        pass

def kafkawritefile(time_step,time_num):
    start = datetime.now()
    downloader = KafkaDownloader(HOSTS, TOPIC, GROUP)
    i = 1
    while(i<=time_num):
        end_time = get_end_time(start.hour, start.minute,i*time_step)
        end_time_file = end_time.replace(':', '_')
        outfile_path = "/data/tmp/" + end_time_file + ".csv"

        if os.path.exists(outfile_path):
            os.remove(outfile_path)
        writefile = open(outfile_path, 'a+', encoding='utf-8')
       
        for msg in downloader.message():
            curr_time = datetime.now()
            curr_time = str(curr_time)
            split_curr_time = curr_time.split(' ')
            curr_time_str = split_curr_time[1][0:5]
        
            if curr_time_str >= str(end_time):        
                break
        i += 1

if __name__=='__main__':
    time_step = 15
    time_num = 1
    kafkawritefile(time_step,time_num)

猜你喜欢

转载自blog.csdn.net/sxf_123456/article/details/80297959

python每5分钟从kafka中提取数据

python实现某天每5分钟提取一条数据

AIX UNIX crontab 每几分钟执行，5分钟，10分钟，15分钟

SQL SERVER 查询每5分钟平均值的数据

job案例每30分钟自动写入数据

Postgresql时间处理技巧，每半天，每周，每月和每5分钟统计

Python面试应急5分钟！

5分钟带你体验一把 Kafka

每10秒执行定时任务/每5分钟执行一次-crontab

用Python从视频中提取每一帧的图片

查询数据库统计每3分钟的在线人数

每五分钟抓取网站上的A股数据-----练习

三分钟实现Python批量下载ERA5数据

Python | 5分钟搞定 Python3 元组

python平台5分钟快速搭建

5分钟学会 Python 装饰器

每天5分钟轻松学python!

5分钟掌握python控制流语句

5分钟学会Python爬取整个网站

5分钟教会你python的random模块

5分钟搭建大数据学习环境

Mysql实现查询5分钟之前的数据

Ctp接口 Tick数据转换成3秒钟，5秒钟，15秒钟，1分钟，3分钟，5分钟，n分钟周期的K线数据

python 从kafka提取数据

【数据结构与算法Python实践系列】5分钟学会经典排序算法-归并排序

【数据结构与算法Python实践系列】5分钟学会经典排序算法-希尔排序

【数据结构与算法Python实践系列】5分钟学会经典排序算法-堆排序

【数据结构与算法Python实践系列】5分钟学会经典排序算法-快速排序

cron和crontab命令详解 crontab 每分钟、每小时、每天、每周、每月、每年定时执行 crontab每5分钟执行一次

5分钟 BeetlSQL 快速入门

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)