web-dev-qa-db-ja.com

JSONのような場合にwgetを使用するにはどうすればよいですか?

次のようなjsonがあるとします。

[{
    "title": "How to download File From Node Js",
    "extension": "mp4",
    "url" : "http://zzz.com/asd/what.mp4",
    "folder__relative_path": "tutorial/node"
}, {
    "title": "How to play Guitar",
    "extension": "mp4",
    "url" : "http://asdz.com/asd/dsa.mp4",
    "folder__relative_path": "another_folder/hello/tutorial/Guitar"
}
....
more
more
....
]

基本的に、ダウンロードURL、拡張子、拡張子付きのファイル名に関する情報を含むjsonファイルがあります。上記のリンクからダウンロードしたいだけです。

拡張子付きのタイトル付きの名前変更をダウンロードし、指定したディレクトリに保存するにはどうすればよいですか。

このようにwgetを使用できることを知っています

wget www.zzz.com/1.mp4 -O /var/cache/foobar/google.mp4

しかし、jsonからフェッチして保存するのは難しいことではありませんか?

とにかくこの問題を解決する方法はありますか?

1
Me Noob Sir

Pythonを使用して JSONを解析 および run wget にできます。

#! /usr/bin/python3
import json, sys, subprocess

for k in json.load(sys.stdin):
    cmd = ["echo", "wget", k["url"], "-O", '{:s}/{:s}.{:s}'.format(k["folder__relative_path"], k["title"], k["extension"])]
    subprocess.run(cmd)

サンプル入力の場合:

$ python3 f.py < foo.txt
wget http://zzz.com/asd/what.mp4 -O tutorial/node/How to download File From Node Js.mp4
wget http://asdz.com/asd/dsa.mp4 -O another_folder/hello/tutorial/Guitar/How to play Guitar.mp4

出力を確認した後、"echo",を削除して、実際にwgetコマンドを実行します。

1
muru