web-dev-qa-db-ja.com

map :: find操作で大文字と小文字を区別しないようにするにはどうすればよいですか?

map::findメソッドは大文字小文字を区別しない検索をサポートしますか?次のような地図があります。

map<string, vector<string> > directory;

以下の検索で大文字と小文字を区別しないようにします。

directory.find(search_string);
45
Ankur

デフォルトではありません。 3番目の引数としてカスタムコンパレータを指定する必要があります。次のスニペットが役立ちます...

  /************************************************************************/
  /* Comparator for case-insensitive comparison in STL assos. containers  */
  /************************************************************************/
  struct ci_less : std::binary_function<std::string, std::string, bool>
  {
    // case-independent (ci) compare_less binary function
    struct nocase_compare : public std::binary_function<unsigned char,unsigned char,bool> 
    {
      bool operator() (const unsigned char& c1, const unsigned char& c2) const {
          return tolower (c1) < tolower (c2); 
      }
    };
    bool operator() (const std::string & s1, const std::string & s2) const {
      return std::lexicographical_compare 
        (s1.begin (), s1.end (),   // source range
        s2.begin (), s2.end (),   // dest range
        nocase_compare ());  // comparison
    }
  };

std::map< std::string, std::vector<std::string>, ci_less > myMap;のように使用してください

[〜#〜]注[〜#〜]:std :: lexicographical_compareには、重要な詳細があります。ロケールを考慮する場合、文字列の比較は必ずしも簡単ではありません。興味があればc.l.c ++の this スレッドを参照してください。

[〜#〜] update [〜#〜]:C++ 11ではstd::binary_functionは非推奨であり、型が推定されるため不要です自動的に。

  struct ci_less
  {
    // case-independent (ci) compare_less binary function
    struct nocase_compare
    {
      bool operator() (const unsigned char& c1, const unsigned char& c2) const {
          return tolower (c1) < tolower (c2); 
      }
    };
    bool operator() (const std::string & s1, const std::string & s2) const {
      return std::lexicographical_compare 
        (s1.begin (), s1.end (),   // source range
        s2.begin (), s2.end (),   // dest range
        nocase_compare ());  // comparison
    }
  };
65
Abhay

ここでは、他の代替手段をいくつか示します。

#include    <map>
#include    <string>
#include    <cstring>
#include    <iostream>
#include    <boost/algorithm/string.hpp>

using std::string;
using std::map;
using std::cout;
using std::endl;

using namespace boost::algorithm;

// recommended in Meyers, Effective STL when internationalization and embedded
// NULLs aren't an issue.  Much faster than the STL or Boost Lex versions.
struct ciLessLibC : public std::binary_function<string, string, bool> {
    bool operator()(const string &lhs, const string &rhs) const {
        return strcasecmp(lhs.c_str(), rhs.c_str()) < 0 ;
    }
};

// Modification of Manuel's answer
struct ciLessBoost : std::binary_function<std::string, std::string, bool>
{
    bool operator() (const std::string & s1, const std::string & s2) const {
        return lexicographical_compare(s1, s2, is_iless());
    }
};

typedef map< string, int, ciLessLibC> mapLibc_t;
typedef map< string, int, ciLessBoost> mapBoost_t;

int main(void) {
    mapBoost_t cisMap; // change to test other comparitor 

    cisMap["foo"] = 1;
    cisMap["FOO"] = 2;

    cisMap["bar"] = 3;
    cisMap["BAR"] = 4;

    cisMap["baz"] = 5;
    cisMap["BAZ"] = 6;

    cout << "foo == " << cisMap["foo"] << endl;
    cout << "bar == " << cisMap["bar"] << endl;
    cout << "baz == " << cisMap["baz"] << endl;

    return 0;
}
23

std::mapthreeパラメータでインスタンス化できます:キーのタイプ、値のタイプ、および比較関数-astrict弱い順序付け(本質的に、推移性と反反射性の観点からoperator<のように動作する関数または関数)。 「大文字と小文字を区別しない以下」を行うように3番目のパラメータを定義するだけです(たとえば、比較する小文字の文字列の<によって)。希望する「大文字と小文字を区別しないマップ」が作成されます。

6
Alex Martelli

私は以下を使用します:

bool str_iless(std::string const & a, 
               std::string const & b)
{
    return boost::algorithm::lexicographical_compare(a, b,  
                                                     boost::is_iless());
}
std::map<std::string, std::string, 
         boost::function<bool(std::string const &, 
                              std::string const &)> 
         > case_insensitive_map(&str_iless);
5
Manuel

(元の単純さと効率を維持するために)マップタイプに触れたくない場合は、大文字と小文字を区別しない遅い検索関数(O(N))を使用してもかまいません。

string to_lower(string s) {
    transform(s.begin(), s.end(), s.begin(), (int(*)(int)) tolower );
    return s;
}

typedef map<string, int> map_type;

struct key_lcase_equal {
    string lcs;
    key_lcase_equal(const string& s) : lcs(to_lower(s)) {}
    bool operator()(const map_type::value_type& p) const {
        return to_lower(p.first) == lcs;
    }
};

map_type::iterator find_ignore_case(map_type& m, const string& s) {
    return find_if(m.begin(), m.end(), key_lcase_equal(s));
}

PS:たぶんそれはロジャー・ペイトのアイデアだったかもしれませんが、詳細が少しずれていたため、確かではありません(std :: search ?、直接文字列コンパレータ?)

4
Alink

いいえ、findを使用してそれを行うことはできません。その場合、複数の一致があるためです。たとえば、挿入中に_map["A"] = 1_や_map["a"] = 2_などの処理を実行できますが、大文字と小文字を区別しない場合はmap.find("a")を使用すると、期待される戻り値は何になりますか?これを解決する最も簡単な方法は、1つのケース(大文字または小文字)でのみ文字列をマップに挿入し、検索中に同じケースを使用することです。

3
Naveen

テスト済み:

template<typename T>
struct ci_less:std::binary_function<T,T,bool>
  { bool operator() (const T& s1,const T& s2) const { return boost::ilexicographical_compare(s1,s2); }};

...

map<string,int,ci_less<string>> x=boost::assign::map_list_of
        ("One",1)
        ("Two",2)
        ("Three",3);

cout << x["one"] << x["TWO"] <<x["thrEE"] << endl;

//Output: 123
1
tibor.sz

マップテンプレートのCompare要素は、デフォルトでバイナリ比較クラス「less」に設定されています。実装を見てください:

http://www.cplusplus.com/reference/std/functional/less/

おそらく、binary_functionから派生する独自のクラス(親クラスからlessまで)を作成し、大文字と小文字を区別せずに同じ比較を行うことができます。

1
user208608

C++ 11以降の場合:

#include <strings.h>
#include <map>
#include <string>

namespace detail
{

struct CaseInsensitiveComparator
{
    bool operator()(const std::string& a, const std::string& b) const noexcept
    {
        return ::strcasecmp(a.c_str(), b.c_str()) < 0;
    }
};

}   // namespace detail


template <typename T>
using CaseInsensitiveMap = std::map<std::string, T, detail::CaseInsensitiveComparator>;



int main(int argc, char* argv[])
{
    CaseInsensitiveMap<int> m;

    m["one"] = 1;
    std::cout << m.at("ONE") << "\n";

    return 0;
}
1
James

Boostやテンプレートを使用せずに短い解決策を提示したいと思います。 C++ 11 なので、マップにカスタムコンパレータとして lambda expression を指定することもできます。 POSIX互換システムの場合、ソリューションは次のようになります。

_auto comp = [](const std::string& s1, const std::string& s2) {
    return strcasecmp(s1.c_str(), s2.c_str()) < 0;
};
std::map<std::string, std::vector<std::string>, decltype(comp)> directory(comp);
_

Ideonのコード

ウィンドウの場合、 strcasecmp() は存在しませんが、代わりに _stricmp() を使用できます。

_auto comp = [](const std::string& s1, const std::string& s2) {
    return _stricmp(s1.c_str(), s2.c_str()) < 0;
};
std::map<std::string, std::vector<std::string>, decltype(comp)> directory(comp);
_

注:システムと、Unicodeをサポートする必要があるかどうかに応じて、異なる方法で文字列を比較する必要がある場合があります。 このQ&A は良いスタートを切る。

0
honk

Std :: less関数を実装し、両方を同じケースに変更して比較します。

0
Vivek