web-dev-qa-db-ja.com

ファイル内の最長行の長さを取得する

ファイル内の最も長い行の長さを見つける簡単な方法を探しています。理想的には、スクリプトではなく単純なbash Shellコマンドです。

183
Andrew Prock

Wc(GNU coreutils)7.4の使用:

wc -L filename

与える:

101 filename
247
Daniel
awk '{print length, $0}' Input_file |sort -nr|head -1

参考: ファイル内の最長行の検索

95
Pale Blue Dot
awk '{ if (length($0) > max) {max = length($0); maxline = $0} } END { print maxline }'  YOURFILE 
64
Ramon

楽しみと教育目的のために、純粋なPOSIXシェルソリューション、猫を無駄に使用せず、外部コマンドに分岐しません。最初の引数としてファイル名を取ります:

#!/bin/sh

MAX=0 IFS=
while read -r line; do
  if [ ${#line} -gt $MAX ]; then MAX=${#line}; fi
done < "$1"
printf "$MAX\n"
23
Jens
wc -L < filename

与える

101
13
Anonymous
Perl -ne 'print length()."  line $.  $_"' myfile | sort -nr | head -n 1

長さ、行番号、および最も長い行の内容を出力します

Perl -ne 'print length()."  line $.  $_"' myfile | sort -n

行番号と長さとともに、すべての行のソートされたリストを印刷します

.は連結演算子です-length()の後にここで使用されます
$.は現在の行番号です
$_は現在の行です

11
Chris Koknat

上記の例で見落とされていた重要な点。

次の2つの例は、展開されたタブをカウントします

  wc -L  <"${SourceFile}" 
# or
  expand --tabs=1 "${SourceFile}" | awk '{ if (length($0) > max) {max = length($0)} } END { print max }'

次の2つは、拡張されていないタブをカウントします。

  expand --tabs=1 "${SourceFile}" | wc -L 
# or
  awk '{ if (length($0) > max) {max = length($0)} } END { print max }' "${SourceFile}"

そう

              Expanded    nonexpanded
$'nn\tnn'       10            5
5
John Kearney

すべての答えに見えますが、最も長い行の行番号は表示されません。次のコマンドは、行番号とおおよその長さを指定できます。

$ cat -n test.txt | awk '{print "longest_line_number: " $1 " length_with_line_number: " length}' | sort -k4 -nr | head -3
longest_line_number: 3 length_with_line_number: 13
longest_line_number: 4 length_with_line_number: 12
longest_line_number: 2 length_with_line_number: 11
4
wangf

ここにanwserの参照があります

cat filename | awk '{print length, $0}'|sort -nr|head -1

http://wtanaka.com/node/7719

3
Nadir SOUALEM

Perlの場合:

Perl -ne 'print ($l = $_) if (length > length($l));' filename | tail -1

これは行だけを印刷し、長さも印刷しません。

3
rsp

私はUnix環境にいて、サイズが数GBのgzip圧縮されたファイルを使用しています。レコード長2052の2 GBのgzip圧縮ファイルを使用して、次のコマンドをテストしました。

  1. zcat <gzipped file> | wc -L

そして

  1. zcat <gzipped file> | awk '{print length}' | sort -u

時代は荒れ果てていた

  1. 117秒

  2. 109秒

約10回実行した後のスクリプトを次に示します。

START=$(date +%s) ## time of start

zcat $1 |  wc -L

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"

START=$(date +%s) ## time of start

zcat $1 |  awk '{print length}' | sort -u

END=$(date +%s) ## time of end
DIFF=$(( $END - $START ))
echo "It took $DIFF seconds"
2
Jon

楽しみのために、Powershellバージョンを以下に示します。

cat filename.txt | sort length | select -last 1

そして、ちょうど長さを取得するには:

(cat filename.txt | sort length | select -last 1).Length
2
eddiegroves

テーマのバリエーション。

これは、ファイルで見つかった最長の行の長さを持つall行を表示し、ソースに表示される順序を保持します。

FILE=myfile grep `tr -c "\n" "." < $FILE | sort | tail -1` $FILE

だからmyfile

x
mn
xyz
123
abc

あげる

xyz
123
abc
1
martin clayton