web-dev-qa-db-ja.com

コンマ区切りのstd :: stringの解析

コンマ区切りの数値リストを含むstd :: stringがある場合、数値を解析して整数配列に入れる最も簡単な方法は何ですか?

私はこれを他のものの解析に一般化したくありません。 「1,1,1,1,2,1,1,1,1,0」のような単純なカンマ区切りの整数の文字列。

117
Piku
#include <vector>
#include <string>
#include <sstream>
#include <iostream>

int main()
{
    std::string str = "1,2,3,4,5,6";
    std::vector<int> vect;

    std::stringstream ss(str);

    int i;

    while (ss >> i)
    {
        vect.Push_back(i);

        if (ss.peek() == ',')
            ss.ignore();
    }

    for (i=0; i< vect.size(); i++)
        std::cout << vect.at(i)<<std::endl;
}
135
user229321

冗長性が低く、stdで、コンマで区切られたものをすべて使用します。

stringstream ss( "1,1,1,1, or something else ,1,1,1,0" );
vector<string> result;

while( ss.good() )
{
    string substr;
    getline( ss, substr, ',' );
    result.Push_back( substr );
}
91
Zoomulator

さらに別の、かなり異なるアプローチ:カンマを空白として扱う特別なロケールを使用します。

#include <locale>
#include <vector>

struct csv_reader: std::ctype<char> {
    csv_reader(): std::ctype<char>(get_table()) {}
    static std::ctype_base::mask const* get_table() {
        static std::vector<std::ctype_base::mask> rc(table_size, std::ctype_base::mask());

        rc[','] = std::ctype_base::space;
        rc['\n'] = std::ctype_base::space;
        rc[' '] = std::ctype_base::space;
        return &rc[0];
    }
}; 

これを使用するには、このファセットを含むロケールでストリームをimbue()します。これを行うと、カンマがまったくないかのように数字を読むことができます。たとえば、入力からコンマ区切りの数値を読み取り、標準出力で1行に1つずつ書き込みます。

#include <algorithm>
#include <iterator>
#include <iostream>

int main() {
    std::cin.imbue(std::locale(std::locale(), new csv_reader()));
    std::copy(std::istream_iterator<int>(std::cin), 
              std::istream_iterator<int>(),
              std::ostream_iterator<int>(std::cout, "\n"));
    return 0;
}
59
Jerry Coffin

C++ String Toolkit Library(Strtk) には、問題に対する次の解決策があります。

#include <string>
#include <deque>
#include <vector>
#include "strtk.hpp"
int main()
{ 
   std::string int_string = "1,2,3,4,5,6,7,8,9,10,11,12,13,14,15";
   std::vector<int> int_list;
   strtk::parse(int_string,",",int_list);

   std::string double_string = "123.456|789.012|345.678|901.234|567.890";
   std::deque<double> double_list;
   strtk::parse(double_string,"|",double_list);

   return 0;
}

より多くの例を見つけることができます ここ

44
Matthieu N.

汎用アルゴリズムと Boost.Tokenizer を使用した代替ソリューション

struct ToInt
{
    int operator()(string const &str) { return atoi(str.c_str()); }
};

string values = "1,2,3,4,5,9,8,7,6";

vector<int> ints;
tokenizer<> tok(values);

transform(tok.begin(), tok.end(), back_inserter(ints), ToInt());
17
TC.

次の関数も使用できます。

void tokenize(const string& str, vector<string>& tokens, const string& delimiters = ",")
{
  // Skip delimiters at beginning.
  string::size_type lastPos = str.find_first_not_of(delimiters, 0);

  // Find first non-delimiter.
  string::size_type pos = str.find_first_of(delimiters, lastPos);

  while (string::npos != pos || string::npos != lastPos) {
    // Found a token, add it to the vector.
    tokens.Push_back(str.substr(lastPos, pos - lastPos));

    // Skip delimiters.
    lastPos = str.find_first_not_of(delimiters, pos);

    // Find next non-delimiter.
    pos = str.find_first_of(delimiters, lastPos);
  }
}
6
kiamlaluno
std::string input="1,1,1,1,2,1,1,1,0";
std::vector<long> output;
for(std::string::size_type p0=0,p1=input.find(',');
        p1!=std::string::npos || p0!=std::string::npos;
        (p0=(p1==std::string::npos)?p1:++p1),p1=input.find(',',p0) )
    output.Push_back( strtol(input.c_str()+p0,NULL,0) );

もちろん、strtol()で変換エラーをチェックすることをお勧めします。コードは他のエラーチェックからも恩恵を受けるかもしれません。

ここにかなりひどい答えがたくさんあるので、私は私のものを追加します(テストプログラムを含む):

#include <string>
#include <iostream>
#include <cstddef>

template<typename StringFunction>
void splitString(const std::string &str, char delimiter, StringFunction f) {
  std::size_t from = 0;
  for (std::size_t i = 0; i < str.size(); ++i) {
    if (str[i] == delimiter) {
      f(str, from, i);
      from = i + 1;
    }
  }
  if (from <= str.size())
    f(str, from, str.size());
}


int main(int argc, char* argv[]) {
    if (argc != 2)
        return 1;

    splitString(argv[1], ',', [](const std::string &s, std::size_t from, std::size_t to) {
        std::cout << "`" << s.substr(from, to - from) << "`\n";
    });

    return 0;
}

素敵なプロパティ:

  • 依存関係なし(例:boost)
  • 非常識なワンライナーではありません
  • わかりやすい(願っています)
  • スペースを完璧に処理
  • あなたがしたくない場合、分割を割り当てません。示されているように、ラムダでそれらを処理できます。
  • 一度に1つずつ文字を追加しません-高速である必要があります。
  • C++ 17を使用している場合は、std::stringviewを使用するように変更できますが、割り当ては行われず、非常に高速です。

変更したいデザインの選択:

  • 空のエントリは無視されません。
  • 空の文字列は、f()を1回呼び出します。

入力と出力の例:

""      ->   {""}
","     ->   {"", ""}
"1,"    ->   {"1", ""}
"1"     ->   {"1"}
" "     ->   {" "}
"1, 2," ->   {"1", " 2", ""}
" ,, "  ->   {" ", "", " "}
4
Timmmm
#include <sstream>
#include <vector>

const char *input = "1,1,1,1,2,1,1,1,0";

int main() {
    std::stringstream ss(input);
    std::vector<int> output;
    int i;
    while (ss >> i) {
        output.Push_back(i);
        ss.ignore(1);
    }
}

不正な入力(たとえば、連続した区切り文字)はこれを台無しにしますが、単純なことを言いました。

2
Steve Jessop

std::regex を使用した解決策を誰も提案していないことに驚いています:

#include <string>
#include <algorithm>
#include <vector>
#include <regex>

void parse_csint( const std::string& str, std::vector<int>& result ) {

    typedef std::regex_iterator<std::string::const_iterator> re_iterator;
    typedef re_iterator::value_type re_iterated;

    std::regex re("(\\d+)");

    re_iterator rit( str.begin(), str.end(), re );
    re_iterator rend;

    std::transform( rit, rend, std::back_inserter(result), 
        []( const re_iterated& it ){ return std::stoi(it[1]); } );

}

この関数は、入力ベクトルの後ろにすべての整数を挿入します。正規表現を微調整して、負の整数や浮動小数点数などを含めることができます。

2
Sheljohn

私はまだコメントすることはできませんが(サイトで始めましょう)、Jerry Coffinの素晴らしいctypeの派生クラスのより一般的なバージョンを彼の投稿に追加しました。

素晴らしいアイデアをくれたジェリーに感謝します。

(査読が必要なため、一時的にここに追加します)

struct SeparatorReader: std::ctype<char>
{
    template<typename T>
    SeparatorReader(const T &seps): std::ctype<char>(get_table(seps), true) {}

    template<typename T>
    std::ctype_base::mask const *get_table(const T &seps) {
        auto &&rc = new std::ctype_base::mask[std::ctype<char>::table_size]();
        for(auto &&sep: seps)
            rc[static_cast<unsigned char>(sep)] = std::ctype_base::space;
        return &rc[0];
    }
};
1
mementum
string exp = "token1 token2 token3";
char delimiter = ' ';
vector<string> str;
string acc = "";
for(int i = 0; i < exp.size(); i++)
{
    if(exp[i] == delimiter)
    {
        str.Push_back(acc);
        acc = "";
    }
    else
        acc += exp[i];
}
1
knapcio

boost tokenizer に基づく単純なコピー/貼り付け機能。

void strToIntArray(std::string string, int* array, int array_len) {
  boost::tokenizer<> tok(string);
  int i = 0;
  for(boost::tokenizer<>::iterator beg=tok.begin(); beg!=tok.end();++beg){
    if(i < array_len)
      array[i] = atoi(beg->c_str());
    i++;
}
0
Daniel Eckert
bool GetList (const std::string& src, std::vector<int>& res)
  {
    using boost::lexical_cast;
    using boost::bad_lexical_cast;
    bool success = true;
    typedef boost::tokenizer<boost::char_separator<char> > tokenizer;
    boost::char_separator<char> sepa(",");
    tokenizer tokens(src, sepa);
    for (tokenizer::iterator tok_iter = tokens.begin(); 
         tok_iter != tokens.end(); ++tok_iter) {
      try {
        res.Push_back(lexical_cast<int>(*tok_iter));
      }
      catch (bad_lexical_cast &) {
        success = false;
      }
    }
    return success;
  }
0
KeithB

シンプルな構造、簡単に適応、簡単なメンテナンス。

std::string stringIn = "my,csv,,is 10233478,separated,by commas";
std::vector<std::string> commaSeparated(1);
int commaCounter = 0;
for (int i=0; i<stringIn.size(); i++) {
    if (stringIn[i] == ",") {
        commaSeparated.Push_back("");
        commaCounter++;
    } else {
        commaSeparated.at(commaCounter) += stringIn[i];
    }
}

最終的には、文のすべての要素がスペースで区切られた文字列のベクトルになります。空の文字列は個別のアイテムとして保存されます。

0
tony gil

これは最も簡単な方法で、私はよく使いました。任意の1文字の区切り文字に対して機能します。

#include<bits/stdc++.h>
using namespace std;

int main() {
   string str;

   cin >> str;
   int temp;
   vector<int> result;
   char ch;
   stringstream ss(str);

   do
   {
       ss>>temp;
       result.Push_back(temp);
   }while(ss>>ch);

   for(int i=0 ; i < result.size() ; i++)
       cout<<result[i]<<endl;

   return 0;
}
0