web-dev-qa-db-ja.com

フィールドを複数のスペースで区切って配列に格納するにはどうすればよいですか?

私のファイルmytxt

field1                    field2
------                    -------
this are numbers          12345
this letters              abc def ghi 

最初のフィールドを配列に格納したいとしましょう:

i=0
while read line; do 
    field_one[$i]=$(echo $line | awk '{print $1}')
    echo ${field_one[i]}  
    ((i++))
done < mytxt

これにより、出力にthisが2回表示されます。

それらを配列に格納して出力を取得する方法のアイデア:

this are numbers
this letters

区切り文字の変更、スペースの絞り込み、sedの使用を試みましたが、行き詰まっています。任意のヒントをいただければ幸いです。

私の最終的な目標は、両方のフィールドを配列に格納することです。

7
zou hai

this source に基づいて my comment を移動して、複数スペースベースのテーブルで特定の列を表示するだけです。

awk -F '  +' '{print $2}' mytxt.txt  # Or with -F ' {2,}'

これは 二重引用符を使用する場合は機能しません であることに注意してください。

私は、次のようなものを使用して、重複を見つけることが特に有用であるとわかりました。

somelist... | sort | uniq -c | sort -rn | grep -vP "^ +1 " | awk -F '  +' '{print $3}'
2
Pablo Bianchi

Colrmを使用してファイルから列を削除します。

#!/bin/bash

shopt -s extglob

a=()
while read; do
   a+=("${REPLY%%*( )}")
done < <(colrm 26 < text.txt)

printf %s\\n "${a[@]:2:3}"

(Bash組み込みバージョン):

#!/bin/bash

shopt -s extglob

a=()
while read; do
    b="${REPLY::26}"; a+=("${b%%*( )}")
done < text.txt

printf %s\\n "${a[@]:2:3}"
4
bac0n

組み込みのbash mapfile(別名readarray)を、パラメーター展開を使用するコールバックで使用して、2つのスペースで始まる最も長い末尾の部分文字列をトリムできます。

mapfile -c 1 -C 'f() { field_one[$1]="${2%%  *}"; }; f' < mytxt

例与えられた

$ cat mytxt
field1                    field2
------                    -------
this are numbers          12345
this letters              abc def ghi 

その後

$ mapfile -c 1 -C 'f() { field_one[$1]="${2%%  *}"; }; f' < mytxt
$
$ printf '%s\n' "${field_one[@]}" | cat -A
field1$
------$
this are numbers$
this letters$
2
steeldriver

この回答は、出力要件に一致するように配列から2つの見出し行を削除することに焦点を当てています。

$ cat fieldone.txt
field1                    field2
------                    -------
this are numbers          12345
this letters              abc def ghi 

$ fieldone
this are numbers         
this letters             

スクリプトは次のとおりです。

#!/bin/bash

# NAME: fieldone
# PATH: $HOME/askubuntu/
# DESC: Answer for: https://askubuntu.com/questions/1194620/
# how-would-you-separate-fields-with-multiple-spaces-and-store-them-in-an-array

# DATE: December 8, 2019.

i=0                                     # Current 0-based array index number
while read line; do                     # Read all lines from input file
    ((LineNo++))                        # Current line number of input file
    [[ $LineNo -eq 1 ]] && continue     # "Field 1     Field 2" skip first line
    if [[ $LineNo -eq 2 ]] ; then       # Is this is line 2?
        # Grab the second column position explained in:
        # https://unix.stackexchange.com/questions/153339/
        # how-to-find-a-position-of-a-character-using-grep
        Len="$(grep -aob ' -' <<< "$line" | \grep -oE '[0-9]+')"
        continue                        # Loop back for first field
    fi

    field_one[$i]="${line:0:$Len}"      # Extract line position 0 for Len
    echo "${field_one[i]}"              # Display array index just added
    ((i++))                             # Increment for next array element

done < fieldone.txt                     # Input filename fed into read loop

うまくいけば、コードとコメントは自明です。そうでない場合はコメントすることを躊躇しないでください。

2つの列を区切るスペースが1つだけの場合でもスクリプトは機能しますが、他のいくつかの答えは壊れます。

field1         field2
------         ------
this is letter abcdef
this is number 123456
2