environnement win10, hypothèses:
le script py est actuellement fichier index.html dans le répertoire, maintenant,
Pour extraire les caractères index.html sur, sauf pour le temp.txt dans le répertoire courant, et ouvrez le spectateur avec notepad.txt. code:
# codage = UTF8 import os, re Ouvrir avec ( ' index.html ' , MODE = ' R & lt ' , encoding = ' UTF- 8. ' ) AS F: Ouvrir fichier # Données = atteint, f.read () pour lire le fichier # S = le re.findall ( ' [\ u4e00- \ u9fa5] ' , données) correspond à tous les caractères # kw = ( "" .join (s)) Ouvrir avec ( ' temp.txt ' , MODE = ' W ' , encoding = ' UTF- 8. ' ) AS FW: Open fichier # fw.write (kw) # fichiers d'écriture voie = ' temp.txt ' win32api.ShellExecute ( 0 , ' ouvert ' , ' notepad.exe ' , sentier, '' , 1 )