web-dev-qa-db-ja.com

空白をトリミングするにはどうすればよいですか。

文字列から空白(スペースとタブ)を削除するPython関数はありますか?

例:\t example string\texample string

976
Chris

両側に空白:

s = "  \t a string example\t  "
s = s.strip()

右側の空白:

s = s.rstrip()

左側の空白:

s = s.lstrip()

thedz が指摘するように、あなたはこのようなこれらの関数のどれにでも任意の文字を取り除く引数を与えることができます:

s = s.strip(' \t\n\r')

これにより、文字列の左側、右側、または両側から、\t\n、または\rの文字が削除されます。 

上記の例は、文字列の左側と右側から文字列を削除するだけです。文字列の途中からも文字を削除したい場合は、re.subを試してください。

import re
print re.sub('[\s+]', '', s)

それはプリントアウトする必要があります:

astringexample
1448
James Thompson

Pythonのtrimメソッドはstripと呼ばれます。

str.strip() #trim
str.lstrip() #ltrim
str.rstrip() #rtrim
63
gcb

先頭と末尾の空白の場合:

s = '   foo    \t   '
print s.strip() # prints "foo"

それ以外の場合は、正規表現が機能します。

import re
pat = re.compile(r'\s+')
s = '  \t  foo   \t   bar \t  '
print pat.sub('', s) # prints "foobar"
22
ars

非常に単純で基本的な関数を使うこともできます: str.replace() は空白とタブで動作します。

>>> whitespaces = "   abcd ef gh ijkl       "
>>> tabs = "        abcde       fgh        ijkl"

>>> print whitespaces.replace(" ", "")
abcdefghijkl
>>> print tabs.replace(" ", "")
abcdefghijkl

シンプルで簡単.

18
Lucas
#how to trim a multi line string or a file

s=""" line one
\tline two\t
line three """

#line1 starts with a space, #2 starts and ends with a tab, #3 ends with a space.

s1=s.splitlines()
print s1
[' line one', '\tline two\t', 'line three ']

print [i.strip() for i in s1]
['line one', 'line two', 'line three']




#more details:

#we could also have used a forloop from the begining:
for line in s.splitlines():
    line=line.strip()
    process(line)

#we could also be reading a file line by line.. e.g. my_file=open(filename), or with open(filename) as myfile:
for line in my_file:
    line=line.strip()
    process(line)

#moot point: note splitlines() removed the newline characters, we can keep them by passing True:
#although split() will then remove them anyway..
s2=s.splitlines(True)
print s2
[' line one\n', '\tline two\t\n', 'line three ']
12
robert king

誰もこれらの正規表現のソリューションを投稿していません。

マッチング:

>>> import re
>>> p=re.compile('\\s*(.*\\S)?\\s*')

>>> m=p.match('  \t blah ')
>>> m.group(1)
'blah'

>>> m=p.match('  \tbl ah  \t ')
>>> m.group(1)
'bl ah'

>>> m=p.match('  \t  ')
>>> print m.group(1)
None

検索(「スペースのみ」入力の場合は別の方法で処理する必要があります):

>>> p1=re.compile('\\S.*\\S')

>>> m=p1.search('  \tblah  \t ')
>>> m.group()
'blah'

>>> m=p1.search('  \tbl ah  \t ')
>>> m.group()
'bl ah'

>>> m=p1.search('  \t  ')
>>> m.group()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'

re.subを使用すると、内部の空白を削除する可能性があります。

4
user1149913

空白には スペース、タブ、およびCRLF が含まれます。だから私たちが使うことができるエレガントで one-liner string関数は translate です。 

' hello Apple'.translate(None, ' \n\t\r')

_または_ 完全になりたい場合

import string
' hello  Apple'.translate(None, string.whitespace)
3
MaK

(re.sub( '+'、 ''、(my_str.replace( '\ n'、 ''))))。strip()

これにより、不要なスペースと改行文字がすべて削除されます。この助けを願っています

import re
my_str = '   a     b \n c   '
formatted_str = (re.sub(' +', ' ',(my_str.replace('\n',' ')))).strip()

これは次のようになります。

'a b\n c' 'a b c' に変更されます

3
Safvan CK
    something = "\t  please_     \t remove_  all_    \n\n\n\nwhitespaces\n\t  "

    something = "".join(something.split())

出力: please_remove_all_whitespaces

2
pbn

翻訳してみてください

>>> import string
>>> print '\t\r\n  hello \r\n world \t\r\n'

  hello 
 world  
>>> tr = string.maketrans(string.whitespace, ' '*len(string.whitespace))
>>> '\t\r\n  hello \r\n world \t\r\n'.translate(tr)
'     hello    world    '
>>> '\t\r\n  hello \r\n world \t\r\n'.translate(tr).replace(' ', '')
'helloworld'
0
海洋顶端

Python 3を使用している場合:printステートメントで、sep = ""で終了します。それはすべてのスペースを分離します。 

例:

txt="potatoes"
print("I love ",txt,"",sep="")

これで印刷されます: 私はジャガイモが大好きです。

代わりに: 私はジャガイモが大好きです。

あなたの場合は、\ tに乗ろうとしているので、sep = "\ t"を実行してください。

0
morgansmnm

文字列の最初と最後だけで空白を削除したい場合、次のようなことができます:

some_string = "    Hello,    world!\n    "
new_string = some_string.strip()
# new_string is now "Hello,    world!"

これはQtのQString :: trimmed()メソッドとよく似ています。つまり、内部の空白をそのままにして、先頭と末尾の空白を削除します。

しかし、QtのQString :: simplified()メソッドのように、先頭と末尾の空白を削除するだけでなく、連続するすべての内部空白を1つの空白文字に「潰す」場合は、.split()の組み合わせを使用できますおよび" ".join、次のように:

some_string = "\t    Hello,  \n\t  world!\n    "
new_string = " ".join(some_string.split())
# new_string is now "Hello, world!"

この最後の例では、文字列の先頭と末尾から空白を削除しながら、内部空白の各シーケンスが単一のスペースに置き換えられます。

0
J-L