面对大数据量时,python提高效率的方法。

进行大型文件的读取时如果非要遍历数据(一般是非结构化的时候才会去遍历,不然直接dataframe了),用下面这种:(如果rb改为r,慢n倍。)

with open(filename,"rb") as f:
    for fLine in f:
        pass

尽量选择集合、字典数据类型,千万不要选择列表(一般遍历的时候都不选),列表的查询速度会超级慢,同样的,在已经使用集合或字典的情况下,千万不要再转化成列表进行操作。
(1).对字典的优化操作:

if value in dict.values():
    values_count += 1
#用下面这种,别用上面这种。
if keys,values in dict:
    values_count += 1

(2). 多使用iteritems()少使用items(),iteritems()返回迭代器;字典的items函数返回的是键值对的元组的列表,而iteritems使用的是键值对的generator。

猜你喜欢

转载自blog.csdn.net/qq_42658739/article/details/107518504