# - * - кодирование: UTF-8 - * - # Spyder (Python 3.7)
1. Статистика символов (можно использовать после jieba причастия)
из коллекции импорта счетчика из оператора импорта itemgetter # Txt_list можно записать в качестве параметра функции вводится txt_list = [ « возрасты » , « человек » , « человек » , « длинный » , « длинный » , « длинный » , « га » , « персонал » , « возрасты » , ' возрасты ' ] с = Счетчик () для й в txt_list: если Len (х)> = 1 : если х == ' \ г \ п ' или х == ' \ п ' или х == ' ' : продолжает еще : С [Х] + = 1. Печать ( ' общие статистические частотные слова: \ н- ' ) для (K, V) в c.most_common (4.): # Печать верхней четыре печати ( ' % S% S% S% D ' % ( ' ' * (. 3), K ' * ' *. 3 , В)) # По количеству печатных частот слова нисходящего D = отсортированном (. C.Items (), itemgetter Key = (1), Reverse = True) для SS, TT в D: out_words = сс + ' \ т ' + ул (тт) печать (out_words)
2. Многократное покрытие, циркулирующего письменные документы
# Запись в файл, несколько записей, после передней крышки один раз, но out_words сама накладывается # а именно: первое написанное: вечная \ t3 \ п, а второе написано: вечная \ T3 \ п Long \ t3 \ п, а охват данных; # третий раз: возраст \ T3 \ п Long \ T3 \ п номер \ t2 \ п, продолжает переписывать предыдущие данные out_words = '' для SS, тт в г: out_words = out_words + SS + ' \ т ' ул (тт) + + ' \ N ' с открытым (г " \ sss.txt. " , " ш " , кодирование = ' UTF-8 ' ) , как F: f.write (out_words + ' \ п ' )
Например, результаты двух циклов:
3. Одноразовый запись в файл, а не перезаписывать середины неоднократно писалось, но если вы повторно запустить код, он будет охватывать все, прежде чем разовый переписывают все новое содержание
out_words = «» для сс, тт в г: out_words = out_words + SS + ' \ т ' ул (тт) + + ' \ N ' с открытым (г " \ ttt.txt. " , " ш " , кодирование = ' UTF-8 ' ) , как F: f.write (out_words + ' \ п ' )