web-dev-qa-db-ja.com

Notepad ++の正規表現でスパンクラスを削除します

ページ番号の1000以上のスパンクラスに対応する大き​​なファイルがあります。 ReGexを介してnotepad ++のテキストを含む完全な構文を削除したいと思います。例、<p>Cillacepro di to tem endelias eaquunto maximint eostrum eos dolorit et laboria estiati<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>Cillacepro di to tem endelias</p>

<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>を ""に置き換えて、2桁と3桁のパターンも検出されるようにします。私はこの正規表現文字列検索に慣れていないので、誰かが同じ文字列の置換を手伝ってくれるとありがたいです。よろしく、アマンミタル

1
Aman Mittal

Page、Pg、その他のタイプにも対応できる一般的な回答を提供してくれた@AFHに感謝します。削除したいページ番号データが含まれているのはこのスパンクラスだけである可能性が高いため、<span class="pagenum">.*?</span>の一致で十分だと思います。ご了承ください 。*?は任意の文字の最小数と一致し、一致するが同じ先頭のとペアになるようにします。 – AFH12時間前

また、正しい方向性を提供してくれた@alzajにも感謝します。どうもありがとう!私の日と労力を節約しました!よろしく、アマンミタル

1
Aman Mittal

角括弧をエスケープし、数字の省略形( "/ d")の後に繰り返し記号 "+"を使用して、ページ番号を一致させます。

<span class="pagenum"><a name="Page_\d+" id="Page_\d+">\[Pg \d+\]</a></span>

次のサンプルコードで上記の正規表現を検証できます。

placeholdertext<span class="pagenum"><a name="Page_4" id="Page_4">[Pg 4]</a></span>placeholdertext
placeholdertext
<span class="pagenum"><a name="Page_111" id="Page_111">[Pg 111]</a></span>
placeholdertext<span class="pagenum"><a name="Page_222" id="Page_222">[Pg 222]</a></span>
1
alzaj