web-dev-qa-db-ja.com

dictするURLクエリパラメータpython

(いくつかのpythonライブラリを使用して)URLを解析し、URLのクエリパラメータ部分のキーと値を含むpython辞書を返す方法はありますか?

例えば:

url = "http://www.example.org/default.html?ct=32&op=92&item=98"

期待リターン:

{'ct':32, 'op':92, 'item':98}
73

urllib.parseライブラリー を使用します。

>>> from urllib import parse
>>> url = "http://www.example.org/default.html?ct=32&op=92&item=98"
>>> parse.urlsplit(url)
SplitResult(scheme='http', netloc='www.example.org', path='/default.html', query='ct=32&op=92&item=98', fragment='')
>>> parse.parse_qs(parse.urlsplit(url).query)
{'item': ['98'], 'op': ['92'], 'ct': ['32']}
>>> dict(parse.parse_qsl(parse.urlsplit(url).query))
{'item': '98', 'op': '92', 'ct': '32'}

urllib.parse.parse_qs()およびurllib.parse.parse_qsl()メソッドは、キーが複数回発生する可能性があり、その順序が重要であることを考慮して、クエリ文字列を解析します。

まだPython 2を使用している場合、urllib.parseurlparse と呼ばれていました。

137
Martijn Pieters

Python 3の場合、複数の値がある可能性があるため、parse_qsからの辞書の値はリストにあります。最初のものだけが必要な場合:

>>> from urllib.parse import urlsplit, parse_qs
>>>
>>> url = "http://www.example.org/default.html?ct=32&op=92&item=98"
>>> query = urlsplit(url).query
>>> params = parse_qs(query)
>>> params
{'item': ['98'], 'op': ['92'], 'ct': ['32']}
>>> dict(params)
{'item': ['98'], 'op': ['92'], 'ct': ['32']}
>>> {k: v[0] for k, v in params.items()}
{'item': '98', 'op': '92', 'ct': '32'}
25
reubano

パーサーを使用しない場合:

url = "http://www.example.org/default.html?ct=32&op=92&item=98"
url = url.split("?")[1]
dict = {x[0] : x[1] for x in [x.split("=") for x in url[1:].split("&") ]}

したがって、上記のものは削除しませんが、使用すべきものではありません。

私はいくつかの答えを読んだと思いますが、彼らは少し複雑に見えました。あなたが私のような場合、私のソリューションを使用しないでください。

これを使って:

from urllib import parse
params = dict(parse.parse_qsl(parse.urlsplit(url).query))

およびPython 2.Xの場合

from urllib import urlparse as parse

私はこれが受け入れられた答えと同じであることを知っています、ただコピーできる1つのライナーで。

7
Tomos Williams

python 2.7の場合

In [14]: url = "http://www.example.org/default.html?ct=32&op=92&item=98"

In [15]: from urlparse import urlparse, parse_qsl

In [16]: parse_url = urlparse(url)

In [17]: query_dict = dict(parse_qsl(parse_url.query))

In [18]: query_dict
Out[18]: {'ct': '32', 'item': '98', 'op': '92'}
4
Anurag Misra

私は車輪を再発明しないことに同意しますが、時々(学習中に)車輪を理解するために車輪を構築することが役立ちます。 :)それで、純粋にアカデミックな観点から、辞書を使用すると名前と値のペアが一意であると仮定するという警告でこれを提供します(クエリ文字列には複数のレコードが含まれない)。

url = 'http:/mypage.html?one=1&two=2&three=3'

page, query = url.split('?')

names_values_dict = dict(pair.split('=') for pair in query.split('&'))

names_values_list = [pair.split('=') for pair in query.split('&')]

Idle IDEでバージョン3.6.5を使用しています。

3
Clarius