#hashtagに一致するが#hashtagには一致しない正規表現。（セミコロン付き）

Question

私は現在の正規表現を持っています：

/(?<=[\s>]|^)#(\w*[A-Za-z_]+\w*)/g

文字列に対してテストしています：

Here's a #hashtag and here is #not_a_tag; which should be different. Also testing: Mid#hash. #123 #!@£ and <p>#hash</p>

私の目的では、この文字列で検出されるハッシュタグは2つだけです。 しない ;で終わるハッシュタグに一致するように式を変更する方法を考えています。この例では、これは#not_a_tag;です。

乾杯。

tk78 · Accepted Answer

以下についてはどうですか：

\B(\#[a-zA-Z]+\b)(?!;)

正規表現のデモ

anubhava · Answer

否定先読みreegexを使用できます。

/(?<=[\s>]|^)#(\w*[A-Za-z_]+\w*)\b(?!;)/

garyh · Answer

Anubhavaの回答に似ていますが、\w*と\d*の違いは\w文字だけなので、[A-Za-z_]の2つのインスタンスを0-9に置き換えます。

これにより、ステップ数が588から90に削減されます。

(?<=[\s>])#(\d*[A-Za-z_]+\d*)\b(?!;)

ne4istb · Answer

/(#(?:[^\x00-\x7F]|\w)+)/g

＃で始まり、次に少なくとも1つの（+）ANCIIシンボル（[^\x00-\x7F]、非ANCIIシンボルを除く範囲）またはWordシンボル（\ w）。

これは、「＃їжак」のようなANCII記号を含むケースをカバーする必要があります。

Naveed · Answer

これがベストプラクティスです。

(#+[a-zA-Z0-9(_)]{1,})

#hashtagに一致するが#hashtagには一致しない正規表現。 （セミコロン付き）