day4_高效处理文件 - 代码天地

day4_高效处理文件

其他 2018-09-05 23:18:31 阅读次数: 0

read()将文件内容从磁盘中全部读出，放到内存，再给cpu处理，性能低，如果文件量大，很容易内存溢出或卡死。

高效方式：

方式一：一般不用的，代码行多

f = open('users.txt','r',encoding='utf-8')  #打开文件
#第一种方式：
while True:  #写个死循环，知道空字符串停止循环，也就是没有内容了（文件中空行也是有东西的，不代表是空字符串）
    line = f.readline()   #line每次循环，都被替换，这个方法性能高
    if line!='':
        print('line',line)
    else:
        print('文件内容都读完了，结束了')
        break

方式二：

# 第二种方式：
for line in f:   #把文件里的每一行都读到
    print(line)

练习题：

#1、要从日志里面找到1分钟之内访问超过200次的
#2、每分钟都运行一次

# 1、读取文件内容，获取到ip地址
# 2、把每个ip地址存起来 {}
# 3、判断ip访问的次数是否超过200次
# 4、加入黑名单 print

import time
point = 0  #初始的位置，不能定义到循环里面
while True:
    f = open('access.log', encoding='utf-8')
    ip_dict = {}  # 这个不要放在外面，不然字典内容特别大
    f.seek(point)
    for line in f:           #循环取文件里面每行数据
        ip = line.split()[0]  #按照空格分割，取第一个元素就ip
        if ip in ip_dict:     #判断这个ip是否存在，如果存在，则value值+1
            ip_dict[ip] += 1  #如果存在的话，次数加+1
        else:
            ip_dict[ip] = 1   #如果第一次遇见的ip,则value值就是1
    point = f.tell()         #记录文件指针位置
    f.close()
    for ip,ipcount in ip_dict.items():#循环这个字典，判断次数大于200的
        if ipcount > 200:
            print('%s 加入黑名单'%ip)
    time.sleep(60)#定时运行 60秒之后再读

猜你喜欢

转载自www.cnblogs.com/once-again/p/9573936.html

day4_高效处理文件

day4_修改文件

Day4_函数/文件使用的练习

day4_字符串挖取

python基础day4_列表list

day4_函数简单介绍

Day4_线性模型python实现

python学习_day4_模块

day4_二级指针的内存模型

day4_局部变量和全局变量

Python高效编程实战---4、文件IO高效处理技巧

python自动化_day4_装饰器复习和装饰器进阶

Day8 文件处理

day12--文件处理

day11_文件处理

day4—python——json处理

day17文件处理

python学习day-7 文件处理

day17_内置函数_文件处理

python day03_ 文件处理

Python Revisited Day 07 (文件处理）

Linux_day2_文件处理命令

Python Day13 文件处理，函数

Python Day12 文件处理

day9文件处理

spirngboot day4-文件上传

Day4-文件，json字典文件互转，函数

强化阶段 Day 4 算法笔记 3.4 日期处理

HDFS无法高效存储大量小文件，如何处理好小文件？

第六章：文件系统-linecache:高效读取文本文件-处理空行

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)