Quando estava rastreando hoje, depois de rastrear 20 programas, fiquei inexplicavelmente preso.Pensei que estava bloqueado pelo servidor. Também adicionei um pool de agente de usuário e o agente de usuário obtido aleatoriamente para formar cabeçalhos.Não esperava que houvesse um problema com a última nomenclatura de arquivo. Um caractere ilegal aparece na string usada para nomeação. Encontre informações na Internet e construa uma função para remover caracteres ilegais na string por meio de expressões regulares:
import re
def validateTitle(title):
rstr = r"[\/\\\:\*\?\"\<\>\|]" # '/ \ : * ? " < > |'
new_title = re.sub(rstr, "_", title) # 替换为下划线
return new_title
Resolvido o problema com sucesso!
referência:
https://www.polarxiong.com/archives/Python-%E6%9B%BF%E6%8D%A2%E6%88%96%E5%8E%BB%E9%99%A4%E4%B8%8D % E8% 83% BD% E7% 94% A8% E4% BA% 8E% E6% 96% 87% E4% BB% B6% E5% 90% 8D% E7% 9A% 84% E5% AD% 97% E7 % AC% A6.html
—————————————————
Declaração de direitos autorais: este artigo é o artigo original do blogueiro CSDN "Burette_Lee", que segue o contrato de direitos autorais CC 4.0 BY-SA. Anexe o link da fonte original e esta declaração para reimpressão.
Link original: https://blog.csdn.net/qq_29303759/article/details/81944733