web-dev-qa-db-ja.com

PyPiがダウンロード統計を表示しないのはなぜですか?

パッケージがポピュラーであるかどうか(別のポピュラーなパッケージの「インポート」ケースの理由であるとしても)アイデアを得るのはとても便利でした。しかし、今は何らかの理由でこの情報が表示されません。

例: https://pypi.python.org/pypi/blist

なぜ彼らはこの便利な機能をオフにしましたか?

53
d-d

このmail.python.orgの記事 に見られるように、ダウンロード統計は更新されておらず、修正が困難すぎるため削除されました。

この記事の著者であるドナルド・スタッフは、次の理由を挙げています。

削除/廃止の理由は多数ありますが、そのいくつかは次のとおりです。

  • 新しいCDN を使用するのは技術的に困難です。
    • CDNはPSFに寄付されており、寄付された層はいかなる形式のログアクセスも提供していません
    • ログアクセスを持たないための回避策は、CDNのユーティリティを大幅に削減します。
  • 非常に不正確
    • ダウンロード数が不正確になるのを防ぐための多くの事柄があり、その中には次のようなものがあります。
      • pipダウンロードキャッシュ
      • 内部または非公式のミラー
      • PyPIでホストされていないパッケージ(比較のため)
      • ミラーまたは非公式のグラブスクリプトが原因でカウントが増加します(最後に、ダウンロードの25%が既知のミラーリングスクリプトからのものであると考えました)。
  • 特に有用ではない
    • プロジェクトがたくさんダウンロードされたからといって、それが良いというわけではありません
    • 同様に、プロジェクトがあまりダウンロードされていないからといって、それが悪いわけではありません
48

パッケージのダウンロードを表示するために https://pepy.tech/ をリリースしました。 BigQueryのデータを使用したため、同じ結果が得られます:-)

66
petrusqui

最近、この link を使用して、PSFの基盤に貢献したPyPIのBig Queryデータベースを照会できることがわかりました。

また、私が ブログ投稿 を書いて、あなたが見てみたい場合にこの情報を取得する方法について書いた。

23
kiran.koduru

pypinfoプログラムは、pipを介してインストール可能なBigQueryのPython3コマンドラインプログラムです。資格情報(JSONファイル)をセットアップすると、次のことができるようになります。

$ pypinfo -d 1825 blist year
Served from cache: False
Data processed: 250.31 GiB
Data billed: 250.31 GiB
Estimated cost: $1.23

| download_year | download_count |
| ------------- | -------------- |
|         2,017 |        443,067 |
|         2,016 |        391,816 |
|         2,018 |         57,689 |

データ収集に関するいくつかの情報は、 https://packaging.python.org/guides/analyzing-pypi-package-downloads/ で入手できます。

8