ジャックThibodeau:
私はテキストをつもりだと私はCIDを(私はそれらをこすり落としたときに読めるなかった文字)の束を交換する必要がありますので。正しい文字で:私はすべての「### CID」を交換する必要があります。私は現在に実行しているという問題は、いくつかのCIDはに巻き付けていることである<s></s>
との間にスペースがない<s>(cid:131)</s>
と、次の単語が。
だから、私が使用したときに、私は置き換えるしようとすると、それは動作しません、交換してください<s>(cid:131)</s>
▪します。私はCID置き換えるしようとすると:131▪と、私が得ます<s>▪</s>
。私はを取り除くためにしようとしている<s></s>
この特定のケースのために(<s></s>
文書内の他の場所で発見されたと私はそれらを交換する必要はありません)。
何も変更しません。
csv_of_table = csv_of_table.replace('<s>(cid:131)</s>', '▪', regex=True)
唯一のCIDとの一部を変更します。131:
csv_of_table = csv_of_table.replace('cid:131', '▪', regex=True)
お父さんは以下のとおりです。
あなたは使うことができますか?数量詞グループは、0または複数回表示されることを意味します。
csv_of_table = csv_of_table.replace("(<s>\()?cid:\d+(\)<\/s>)?", "▪", regex = True)