панды читать большие файлы с помощью chunkSize

импорт панды как П.Д.
импорта NumPy как нп

импорт chardet

Файл кодирования # обнаружения
с Open (r'D: \ test.txt '' RB ') AS FO:
  кодирование chardet.detect = (fo.readline ()) [' кодировка «]
Печать (кодирование)

# Рекомендуется, если обнаруженный датчик используется для ASCII UTF-8 кодированных

читатель = pd.read_csv (r'D: \ test.txt», итератор = True, кодирование = закодировать)

петля = True
chunkSize = 10000 #每次读取的行数
время цикла:
  попробуйте:
    чанка = reader.get_chunk (chunkSize ) # тип (фрагмент) является pd.DataFrame

    # Обратите внимание , что имя файла из колонки
    # сделать что - то 
  за исключение StopIteration:
    Loop = False
    (. «Остановленная итерацию») Печать

рекомендация

отwww.cnblogs.com/linchee/p/11093367.html