日志文件是如何传到数据库的 - 代码天地

日志文件是如何传到数据库的

其他 2019-04-11 11:31:02 阅读次数: 0

    def dbfunc(records):
        db = pymysql.connect("localhost","root","root","spark")
        cursor = db.cursor()
 
        def doinsert(p):
            sql = "insert into wordcount(word,count) values ('%s', '%s')" % (str(p[0]), str(p[1]))
            try:
                cursor.execute(sql)                
                db.commit()
            except:                    
                db.rollback()
 
        for item in records:
            doinsert(item)
 
    def func(rdd):
        repartitionedRDD = rdd.repartition(3)
        repartitionedRDD.foreachPartition(dbfunc)
 
    running_counts.foreachRDD(func)

running_counts ：看作日志文件

函数之间的依次调用：对每一个元素，用func 进行处理，func处理过程中，对每一个RDD再调用dbfunc进行处理，将其保存到mysql数据库

也就是说，这里定义了一个内部函数dbfunc，它的功能是，接收records，然后把records保存到MySQL中。到这里，你可能会有疑问？为什么不是把stateDstream中的每个RDD直接拿去保存到MySQL中，还要调用rdd.repartition(3)对这些RDD重新设置分区数为3呢？这是因为，每次保存RDD到MySQL中，都需要启动数据库连接，如果RDD分区数量太大，那么就会带来多次数据库连接开销，为了减少开销，就有必要把RDD的分区数量控制在较小的范围内，所以，这里就把RDD的分区数量重新设置为3。然后，对于每个RDD分区，就调用repartitionedRDD.foreachPartition(dbfunc)，把每个分区的数据通过dbfunc保存到MySQL中，这时，传递给dbfunc的输入参数就是Iterator[(String,Int)]类型的records。

猜你喜欢

转载自blog.csdn.net/qq_34333481/article/details/86642720

日志文件是如何传到数据库的

智能POS如何获取日志&数据库文件

Javaweb文件上传到sqlServer数据库

java实现文件上传到数据库

混合表单文件上传到数据库（基于TOMCAT）

如何查看数据库日志

oracle数据库日志文件

收缩数据库的日志文件

收缩数据库日志文件

SQLServer2005数据库日志文件损坏的情况下如何恢复数据库

Execl数据上传到数据库

sqlserver2008r2数据库如何使数据不写入日志以及收缩日志文件

客观面试题--50.如何处理数据库日志文件？

morgan日志如何加入数据库和文件中？(node+express+morgan)

数据库数据文件日志文件

Asp图片上传到数据库

h2数据库如何不生成*.trace.db日志文件，更改h2数据库的日志级别

数据库日志

怎么把本地数据库文件上传到云服务器ecs呢?

如何查看MySQL数据库的死锁日志

误删WAL日志后如何启动数据库

如何为你的数据库事务日志减肥？

达梦数据库JDBC如何开启log日志？

如何查看mysql数据库操作记录日志？

postgresql数据库|wal日志的开启以及如何管理

sqlserver数据库修改日志文件大小限制

压缩数据库日志文件(存储过程)

MSSQL数据库日志文件太大的处理方法

导入日志文件到mysql数据库表

mysql数据库用户管理及日志文件

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)