python régulier des caractères chinois correspondance, lu et simple d'écriture, fichier txt ouvert

environnement win10, hypothèses:

    le script py est actuellement fichier index.html dans le répertoire, maintenant,

    Pour extraire les caractères index.html sur, sauf pour le temp.txt dans le répertoire courant, et ouvrez le spectateur avec notepad.txt. code:

# codage = UTF8
import os, re

Ouvrir avec ( ' index.html ' , MODE = ' R & lt ' , encoding = ' UTF- 8. ' ) AS F: Ouvrir fichier #
    Données = atteint, f.read () pour lire le fichier #
    S = le re.findall ( ' [\ u4e00- \ u9fa5] ' , données) correspond à tous les caractères #
    kw = ( "" .join (s))
    Ouvrir avec ( ' temp.txt ' , MODE = ' W ' , encoding = ' UTF- 8. ' ) AS FW: Open fichier #
        fw.write (kw) # fichiers d'écriture
        
voie = ' temp.txt ' 
win32api.ShellExecute ( 0 , ' ouvert ' , ' notepad.exe ' , sentier, '' , 1 )
        

 

Je suppose que tu aimes

Origine www.cnblogs.com/pu369/p/12641828.html
conseillé
Classement