Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren - Code World

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Enterprise 2023-09-16 21:35:35 views: null

Kommen wir ohne weitere Umschweife direkt zum Code.

import html
import re
import emoji

content = "你的富文本字符串"
htmlContent = html.unescape(content)
regex = r'\>.*?\<'
listAll = re.findall(regex, htmlContent)
listToSave = [i[1:-1] for i in listAll if i != '><' and len(i) > 2]
strContent = '\n'.join(listToSave)
# 过滤掉表情
strContent = filter_emoji(strContent)
if strContent != "":
    listRichTestInfo.append((ticketId, fieldKey, '', strContent))

Die Implementierung der Funktion filter_emoji, um die Emoticon-Zeichen durch leere zu ersetzen

# filter_emoji 函数的实现方式，为了把表情字符替换为空
def filter_emoji(desstr, restr=''):
    # 过滤表情
    try:
        co = re.compile(u'[\U00010000-\U0010ffff]')
    except re.error:
        co = re.compile(u'[\uD800-\uDBFF][\uDC00-\uDFFF]')
    return co.sub(restr, desstr)

Tatsächlich gibt es nur eine begrenzte Anzahl von Codes. Jeder ist willkommen, zu kommunizieren.

Ich denke du magst

Origin blog.csdn.net/qq_33191599/article/details/126988562

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie Python, um reinen String-Inhalt aus Rich Text zu extrahieren

Verwenden Sie pymysql, um Daten aus der Datenbank zu extrahieren

Verwenden Sie Python, um einen bestimmten Absatz aus docx zu extrahieren und ihn in einem txt-Dokument zu speichern

Verwenden Sie Python: XPath, um Katzenaugenfilme zu extrahieren

Verwenden Sie [], um Zeichen (Strings) in Python zu extrahieren

Verwenden Sie spark tf-idf, um Schlüsselwörter aus Artikeln zu extrahieren

Verwenden Sie xpath, um den gesamten Text unter der Beschriftung zu extrahieren

Verwenden Sie reguläre Ausdrücke, um Datumsangaben im Text zu extrahieren

Verwenden Sie Python, um Sätze in Word-Dokumenten zu extrahieren und zu filtern

Verwenden Sie R-Sprach-Deep-Learning, um Textzusammenfassungen zu erstellen: Extrahieren Sie das Wesentliche aus langen Texten

Extrahieren Sie Text aus Bildern

Verwenden Sie den Vue-Quill-Editor, um den Rich-Text-Editor zu implementieren

Verwenden Sie das Zipfile-Modul in Django, um den Dateinamen aus dem hochgeladenen Zip-Archiv zu extrahieren

Verwenden Sie in Python Bestandsfälle, um beschreibende statistische Analysemethoden zu erläutern (der Inhalt stammt aus meinem Buch).

Python liest PDF, um Text und Bilder zu extrahieren

Verwenden Sie opencv, um Text zu erkennen

Bringen Sie Ihnen zwei Minuten bei, um den Rich-Text-Editor Quill-Editor in Vue zu verwenden

C++, verwenden Sie ffmpeg, um die Videotranscodierung zu extrahieren und zu speichern

Verwenden Sie CAD, um Höhenpunkte zu extrahieren und in TXT zu exportieren

Verwenden Sie *, um ein Dreieck aus dem oberen und dem unteren Dreieck in Python zu drucken

Verwenden Sie Python, um historische Bilder aus der Ditto-Datenbank zu lesen

Extrahieren Sie die verschiedenen Komponenten aus der RGB-Datei, um die Wahrscheinlichkeit zu berechnen

Vier tolle Möglichkeiten, Schlüsselwörter aus einem einzelnen Text in Python zu extrahieren

Empfohlen

Rangfolge

Täglich

Mehr

2024-05-29(1)

2024-05-28(1)

2024-05-27(1)

2024-05-26(0)

2024-05-25(1)

2024-05-24(13)

2024-05-23(34)

2024-05-22(10)

2024-05-21(34)

2024-05-20(5)