web-dev-qa-db-ja.com

jqを使用して要素のプロパティ値でオブジェクトの配列をフィルタリングする方法は?

jq を使用してjsonファイルをフィルタリングしたい:

jq . some.json

オブジェクトの配列を含むJSONを考えます:

{
  "theList": [
    {
      "id": 1,
      "name": "Horst"
    },
    {
      "id": 2,
      "name": "Fritz"
    },
    {
      "id": 3,
      "name": "Walter"
    },
    {
      "id": 4,
      "name": "Gerhart"
    },
    {
      "id": 5,
      "name": "Harmut"
    }
  ]
}

このリストをフィルター処理して、値が2と4のidを持つ要素のみを表示するため、期待される出力は次のようになります。

{
  "id": 2,
  "name": "Fritz"
},
{
  "id": 4,
  "name": "Gerhart"
}

Jqを使用してjsonをフィルタリングするにはどうすればよいですか?私はselectとmapをいじってみましたが、動作するものはありませんでした、例えば:

$ jq '.theList[] | select(.id == 2) or select(.id == 4)' array.json
true
24
k0pernikus

ドキュメントから:

jq '.[] | select(.id == "second")' 

入力[{"id": "first", "val": 1}, {"id": "second", "val": 2}]

出力{"id": "second", "val": 2}

次のようなことができると思います:

jq '.theList[] | select(.id == 2 or .id == 4)' array.json
36
André Senra

select内でmapを使用できます。

.theList | map(select(.id == (2, 4)))

またはよりコンパクト:

[ .theList[] | select(.id == (2, 4)) ]

式は比較されるすべての値に対して複製されるため、そのように書かれたとしても少し非効率的です。次のように書くと、より効率的で、おそらく読みやすくなります。

[ .theList[] | select(any(2, 4; . == .id)) ]
8
Jeff Mercado

ここでselect(.id == (2, 4))を使用することは一般に非効率的です(以下を参照)。

JqにIN/1がある場合、それを使用してより効率的なソリューションを実現できます。

.theList[] | select( .id | IN(2,3))

JqにIN/1がない場合は、次のように定義できます。

def IN(s): first(select(s == .)) // false;

効率

非効率を確認する1つの方法は、debugを使用することです。たとえば、次の式では、debugの呼び出しが10回行われますが、実際には同等性のチェックは9回だけ必要です。

.theList[] | select( (.id == (2,3)) | debug )

["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
  "id": 2,
  "name": "Fritz"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
  "id": 3,
  "name": "Walter"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]

インデックス/ 1

原則として、index/1の使用は効率的ですが、この執筆(2017年10月)の時点では、その実装は高速ですが(Cで記述されています)、非効率的です。

3
peak

indices を使用したソリューションは次のとおりです。

.theList | [ .[map(.id)|indices(2,4)[]] ]
0
jq170727