web-dev-qa-db-ja.com

文字列がBashの他の作業よりも「大きい」かどうかをテストするにはどうすればよいですか?

バッシュでは次のテストを書くことができます

[[ "f" > "a" ]]

その結果、0、つまりtrueが返されます。 bashはどのようにこの文字列比較を実際に実行しますか?私の理解から>は整数比較を行います。オペランドのASCII=値を比較しようとしていますか?

23
helpermethod

_help test_から:

_  STRING1 > STRING2
                 True if STRING1 sorts after STRING2 lexicographically.
_

内部的には、bashはstrcoll()またはstrcmp()を使用します。

_else if ((op[0] == '>' || op[0] == '<') && op[1] == '\0')
  {
    if (Shell_compatibility_level > 40 && flags & TEST_LOCALE)
      return ((op[0] == '>') ? (strcoll (arg1, arg2) > 0) : (strcoll (arg1, arg2) < 0));
    else
      return ((op[0] == '>') ? (strcmp (arg1, arg2) > 0) : (strcmp (arg1, arg2) < 0));
  }
_

後者は実際にはASCII=コードを比較し、前者(ロケールが有効な場合に使用される)は、特定のロケールでのソートに適したより具体的な比較を実行します。

15
Michał Górny

これはアルファベット順の比較です(AIUIの並べ替え順序は現在のロケールの影響を受ける場合があります)。各文字列の最初の文字を比較し、左側の文字の値が大きい場合はtrue、小さい場合はfalseです。それらが同じ場合、2番目の文字を比較します。

これはnot整数比較と同じで、[[ 2 -gt 1 ]]または(( 2 > 1 ))を使用します。文字列と整数の比較の違いを説明するために、以下のすべてが「真」であると考えてください。

[[ 2 > 10 ]]     # because "2" comes after "1" in ASCII sort order
[[ 10 -gt 2 ]]   # because 10 is a larger number than 2
(( 10 > 2 ))     # ditto

文字列の比較としては真であるが、整数の比較では偽となるテストがいくつかあります。

[[ 05 < 5 ]]    # Because "0" comes before "5"
[[ +5 < 0 ]]    # Because "+" comes before the digits
[[ -0 < 0 ]]    # Because "-" comes before the digits
[[ -1 < -2 ]]   # Because "-" doesn't change how the second character is compared
8
Gordon Davisson

はい、ASCII値を比較し、等しい場合は次の文字で比較を繰り返します。

/* Copyright (C) 1991, 1996, 1997, 2003 Free Software Foundation, Inc. 
   This file is part of the GNU C Library. 

   The GNU C Library is free software; you can redistribute it and/or 
   modify it under the terms of the GNU Lesser General Public 
   License as published by the Free Software Foundation; either 
   version 2.1 of the License, or (at your option) any later version. 

   The GNU C Library is distributed in the hope that it will be useful, 
   but WITHOUT ANY WARRANTY; without even the implied warranty of 
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU 
   Lesser General Public License for more details. 

   You should have received a copy of the GNU Lesser General Public 
   License along with the GNU C Library; if not, write to the Free 
   Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 
   02111-1307 USA.  */ 

#include <string.h> 
#include <memcopy.h> 

#undef strcmp 

/* Compare S1 and S2, returning less than, equal to or 
   greater than zero if S1 is lexicographically less than, 
   equal to or greater than S2.  */ 
int 
strcmp (p1, p2) 
     const char *p1; 
     const char *p2; 
{ 
  register const unsigned char *s1 = (const unsigned char *) p1; 
  register const unsigned char *s2 = (const unsigned char *) p2; 
  unsigned reg_char c1, c2; 

  do 
    { 
      c1 = (unsigned char) *s1++; 
      c2 = (unsigned char) *s2++; 
      if (c1 == '\0') 
        return c1 - c2; 
    } 
  while (c1 == c2); 

  return c1 - c2; 
} 
1
olivecoder