[Reimpressão] Substitua ou remova Python caracteres que não podem ser usados em nomes de arquivo

Quando estava rastreando hoje, depois de rastrear 20 programas, fiquei inexplicavelmente preso.Pensei que estava bloqueado pelo servidor. Também adicionei um pool de agente de usuário e o agente de usuário obtido aleatoriamente para formar cabeçalhos.Não esperava que houvesse um problema com a última nomenclatura de arquivo. Um caractere ilegal aparece na string usada para nomeação. Encontre informações na Internet e construa uma função para remover caracteres ilegais na string por meio de expressões regulares:

import re
 
def validateTitle(title):
    rstr = r"[\/\\\:\*\?\"\<\>\|]"  # '/ \ : * ? " < > |'
    new_title = re.sub(rstr, "_", title)  # 替换为下划线
    return new_title


Resolvido o problema com sucesso!

referência:

https://www.polarxiong.com/archives/Python-%E6%9B%BF%E6%8D%A2%E6%88%96%E5%8E%BB%E9%99%A4%E4%B8%8D % E8% 83% BD% E7% 94% A8% E4% BA% 8E% E6% 96% 87% E4% BB% B6% E5% 90% 8D% E7% 9A% 84% E5% AD% 97% E7 % AC% A6.html


—————————————————
Declaração de direitos autorais: este artigo é o artigo original do blogueiro CSDN "Burette_Lee", que segue o contrato de direitos autorais CC 4.0 BY-SA. Anexe o link da fonte original e esta declaração para reimpressão.
Link original: https://blog.csdn.net/qq_29303759/article/details/81944733

Acho que você gosta

Origin blog.csdn.net/u010472858/article/details/103459511
Recomendado
Clasificación