web-dev-qa-db-ja.com

Python-Requests、文字列からURLパラメーターを抽出

requests と呼ばれるこの素晴らしいライブラリを使用して、python 2と3の互換性を維持し、アプリケーションリクエストの管理を簡素化します。

URLを解析し、そのパラメーターの1つを置き換える必要がある場合があります。例えば:

http://example.com?param1=a&token=TOKEN_TO_REPLACE&param2=c

そして、私はこれを取得したい:

http://example.com?param1=a&token=NEW_TOKEN&param2=c

urllibを使用すると、次の方法で実現できます。

from urllib.parse import urlparse
from urllib.parse import parse_qs
from urllib.parse import urlencode

url = 'http://example.com?param1=a&token=TOKEN_TO_REPLACE&param2=c'

o = urlparse(url)
query = parse_qs(o.query)
if query.get('token'):
    query['token'] = ['NEW_TOKEN', ]
    new_query = urlencode(query, doseq=True)
    url.split('?')[0] + '?' + new_query

>>> http://example.com?param2=c&param1=a&token=NEW_TOKEN

requestsライブラリを使用してどのように同じことを達成できますか?

16
Gab

これにはrequestsを使用できません。ライブラリbuildsパラメータのPython構造体が渡された場合、そのようなURLですが、それらを解析するツールは提供されません。それはプロジェクトの目標ではありません。

urllib.parseメソッドに固執して、パラメーターを解析します。辞書またはキーと値のタプルのリストを作成したら、それをrequestsに渡してURLを再構築します。

try:
    # Python 3
    from urllib.parse import urlparse, parse_qs
except ImportError:
    # Python 2
    from urlparse import urlparse, parse_qs

o = urlparse(url)
query = parse_qs(o.query)
# extract the URL without query parameters
url = o._replace(query=None).geturl()

if 'token' in query:
    query['token'] = 'NEW_TOKEN'

requests.get(url, params=query)

urlparse関数とparse_qs関数の両方をPython 2と3の両方で取得できます。例外が発生した場合は、インポート場所を調整するだけです。

URLが構築されたことを示すためのPython 3(インポート例外ガードなし))のデモ:

>>> from urllib.parse import urlparse, parse_qs
>>> url = "http://httpbin.org/get?token=TOKEN_TO_REPLACE&param2=c"
>>> o = urlparse(url)
>>> query = parse_qs(o.query)
>>> url = o._replace(query=None).geturl()
>>> if 'token' in query:
...     query['token'] = 'NEW_TOKEN'
... 
>>> response = requests.get(url, params=query)
>>> print(response.text)
{
  "args": {
    "param2": "c", 
    "token": "NEW_TOKEN"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Accept-Encoding": "gzip, deflate", 
    "Host": "httpbin.org", 
    "User-Agent": "python-requests/2.5.1 CPython/3.4.2 Darwin/14.1.0"
  }, 
  "Origin": "188.29.165.245", 
  "url": "http://httpbin.org/get?token=NEW_TOKEN&param2=c"
}
42
Martijn Pieters

requestsのみを使用:

query = requests.utils.urlparse(url).query
params = dict(x.split('=') for x in query.split('&'))

if 'token' in params:
    params['token'] = 'NEW_TOKEN'

requests.get(url, params=params)
7
Dorik1972