Cuente el número de ocurrencias de Dasheng en Journey to the West

Puntos de conocimiento que deben dominarse de antemano:
Primero, la forma en que se abre el archivo (con abierto)
Segundo, el método readlines () del archivo (devuelve una lista de cadenas)
Tercero, el método re.split () de expresión regular para dividir cadenas en una lista
4. La palabra clave in para determinar si una cadena está en otra cadena
5. El uso flexible de bucles for y declaraciones if

import re
with open('./xiyouji.txt','r',encoding = 'utf-8') as f:
	paragraphs = f.readlines()	
'''p通过readlines函数获得了一个列表,西游记全文中的每一段话都是列表中的一个元素
   注意这里段落的分割是根据回车键丫就是'\n'作为标志的
'''	

```python
target = '大圣'
counter= 0
word_num = 0
for paragraph in paragraphs:
	sentences = re.split('。|!|,|:|“|”|?| |;',paragraph)
	#通过正则表达式,用多个分隔符号,分割paragraph中的字符串为字符串列表
	for sentence in sentences:
		sentence = sentence.strip()
		if target in sentence:
			counter += 1
			print(sentence)
print(f'{target}一共出现了{counter}次')

Resultado: Se
Inserte la descripción de la imagen aquí
puede ver que la palabra Da Sheng apareció 1270 veces en el Viaje al Oeste.

Por supuesto, también podemos usar el participio jieba para obtener todo de una vez:

import jieba
with open('./xiyouji.txt','r',encoding='utf-8') as f:
	xyj_text = f.read()
word_list = list(jieba.cut(xyj_text))
target = '大圣'
count = 0
for word in word_list:
	if target in word:
		count += 1
print(f'{target}出现的次数是:{count}')

El resultado de la operación es:
Inserte la descripción de la imagen aquí

Publicado 273 artículos originales · elogiado 40 · 30,000+ vistas

Supongo que te gusta

Origin blog.csdn.net/weixin_41855010/article/details/105241320
Recomendado
Clasificación