web-dev-qa-db-ja.com

リスト内の文字列値を検索して置換

私はこのリストを得ました:

words = ['how', 'much', 'is[br]', 'the', 'fish[br]', 'no', 'really']

私が望むのは、[br]<br />に似た素晴らしい値に置き換えて、新しいリストを取得することです。

words = ['how', 'much', 'is<br />', 'the', 'fish<br />', 'no', 'really']
123
Eric Herlitz
words = [w.replace('[br]', '<br />') for w in words]

これは List Comprehensions と呼ばれます。

210
sberry

リスト内包表記のほかに、mapを試すことができます

>>> map(lambda x: str.replace(x, "[br]", "<br/>"), words)
['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
30
Anthony Kong

以下を使用できます。

words = [Word.replace('[br]','<br />') for Word in words]
28
houbysoft

さまざまなアプローチのパフォーマンスについて疑問がある場合は、いくつかのタイミングがあります。

In [1]: words = [str(i) for i in range(10000)]

In [2]: %timeit replaced = [w.replace('1', '<1>') for w in words]
100 loops, best of 3: 2.98 ms per loop

In [3]: %timeit replaced = map(lambda x: str.replace(x, '1', '<1>'), words)
100 loops, best of 3: 5.09 ms per loop

In [4]: %timeit replaced = map(lambda x: x.replace('1', '<1>'), words)
100 loops, best of 3: 4.39 ms per loop

In [5]: import re

In [6]: r = re.compile('1')

In [7]: %timeit replaced = [r.sub('<1>', w) for w in words]
100 loops, best of 3: 6.15 ms per loop

このような単純なパターンを見るとわかるように、受け入れられているリストの理解は最速ですが、以下を見てください。

In [8]: %timeit replaced = [w.replace('1', '<1>').replace('324', '<324>').replace('567', '<567>') for w in words]
100 loops, best of 3: 8.25 ms per loop

In [9]: r = re.compile('(1|324|567)')

In [10]: %timeit replaced = [r.sub('<\1>', w) for w in words]
100 loops, best of 3: 7.87 ms per loop

これは、より複雑な置換では、プリコンパイルされたreg-exp(9-10のように)が(はるかに)高速になることを示しています。それは本当にあなたの問題と正規表現の最も短い部分に依存します。

14
Jörn Hees

Forループの例(リスト内包表記が好きです)。

a, b = '[br]', '<br />'
for i, v in enumerate(words):
    if a in v:
        words[i] = v.replace(a, b)
print(words)
# ['how', 'much', 'is<br/>', 'the', 'fish<br/>', 'no', 'really']
0
Waket Zheng