文字列内の文字置換のすべての組み合わせを作成します

Question

"ECET"という文字列があり、1つ以上の文字（最初の文字を除く）を "X"で置き換える可能な文字列をすべて作成したいと考えています。

したがって、この場合、私の結果は次のようになります。

> result [1] "EXET" "ECXT" "ECEX" "EXXT" "EXEX" "ECXX" "EXXX"

この問題への取り組み方に関するアイデアはありますか？

これは、「X」の可能な組み合わせ/順列を作成するだけでなく、それらを既存の文字列と組み合わせる方法も作成します。

Axeman · Accepted Answer

FUNのcombn引数を使用する：

a <- "ECET" fun <- function(n, string) { combn(nchar(string), n, function(x) { s <- strsplit(string, '')[[1]] s[x] <- 'X' paste(s, collapse = '') } ) } lapply(seq_len(nchar(a)), fun, string = a)

[[1]] [1] "XCET" "EXET" "ECXT" "ECEX" [[2]] [1] "XXET" "XCXT" "XCEX" "EXXT" "EXEX" "ECXX" [[3]] [1] "XXXT" "XXEX" "XCXX" "EXXX" [[4]] [1] "XXXX"

unlistは単一のベクトルを取得します。より高速なソリューションがおそらく利用可能です。

最初の文字を変更しないでおくには：

paste0( substring(a, 1, 1), unlist(lapply(seq_len(nchar(a) - 1), fun, string = substring(a, 2))) )

[1] "EXET" "ECXT" "ECEX" "EXXT" "EXEX" "ECXX" "EXXX"

Moody_Mudskipper · Answer

これは再帰的な解決策です：

f <- function(x,pos=2){ if(pos <= nchar(x)) c(f(x,pos+1), f(`substr<-`(x, pos, pos, "X"),pos+1)) else x } f(x)[-1] # [1] "ECEX" "ECXT" "ECXX" "EXET" "EXEX" "EXXT" "EXXX"

またはexpand.grid：

do.call(paste0, expand.grid(c(substr(x,1,1),lapply(strsplit(x,"")[[1]][-1], c, "X"))))[-1] # [1] "EXET" "ECXT" "EXXT" "ECEX" "EXEX" "ECXX" "EXXX"

またはcombn/Reduce/substr<-：

combs <- unlist(lapply(seq(nchar(x)-1),combn, x =seq(nchar(x))[-1],simplify = F),F) sapply(combs, Reduce, f= function(x,y) `substr<-`(x,y,y,"X"), init = x) # [1] "EXET" "ECXT" "ECEX" "EXXT" "EXEX" "ECXX" "EXXX"

2番目のソリューションの説明

pairs0 <- lapply(strsplit(x,"")[[1]][-1], c, "X") # pairs of original letter + "X" pairs1 <- c(substr(x,1,1), pairs0) # including 1st letter (without "X") do.call(paste0, expand.grid(pairs1))[-1] # expand into data.frame and paste

Tensibai · Answer

バイナリロジックを使用して別のオプションを追加するための種類：

文字列が常に4文字であると仮定します。

input<-"ECET" invec <- strsplit(input,'')[[1]] sapply(1:7, function(x) { z <- invec z[rev(as.logical(intToBits(x))[1:4])] <- "X" paste0(z,collapse = '') }) [1] "ECEX" "ECXT" "ECXX" "EXET" "EXEX" "EXXT" "EXXX"

文字列を長くする必要がある場合は、2のべき乗で値を計算できます。これは次のようになります。

input<-"ECETC" pow <- nchar(input) invec <- strsplit(input,'')[[1]] sapply(1:(2^(pow-1) - 1), function(x) { z <- invec z[rev(as.logical(intToBits(x))[1:(pow)])] <- "X" paste0(z,collapse = '') }) [1] "ECETX" "ECEXC" "ECEXX" "ECXTC" "ECXTX" "ECXXC" "ECXXX" "EXETC" "EXETX" "EXEXC" "EXEXX" "EXXTC" "EXXTX" "EXXXC" [15] "EXXXX"

考えられる変更の数を知ることです。これは3つの位置の2進数なので、置換文字列を保持したくないため、2 ^ 3-1です。7

intToBitsは5の整数のバイナリ値を返します。

> intToBits(5) [1] 01 00 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00

Rはデフォルトで32ビットを使用しますが、文字列の長さに対応する論理ベクトルが必要なため、元の文字列のncharを保持します。次に、論理値に変換し、この4つのブール値を逆にします。最後のビット（4文字で8）をトリガーすることはないため、trueになることはありません。

> intToBits(5) [1] 01 00 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 > tmp<-as.logical(intToBits(5)[1:4]) > tmp [1] TRUE FALSE TRUE FALSE > rev(tmp) [1] FALSE TRUE FALSE TRUE

元のベクトルを上書きしないようにするには、それをzにコピーし、この論理ベクトルを使用してzの位置を置き換えるだけです。

ナイス出力の場合、単一の文字列を再作成して文字ベクトルを取得するために、何もない状態で折りたたんでpaste0を返します。

Nicolas2 · Answer

Purrrを使用したCombnの別のバージョン：

s <- "ECET" f <- function(x,y) {substr(x,y,y) <- "X"; x} g <- function(x) purrr::reduce(x,f,.init=s) unlist(purrr::map(1:(nchar(s)-1), function(x) combn(2:nchar(s),x,g))) #[1] "EXET" "ECXT" "ECEX" "EXXT" "EXEX" "ECXX" "EXXX"

またはばりなし：

s <- "ECET" f <- function(x,y) {substr(x,y,y) <- "X"; x} g <- function(x) Reduce(f,x,s) unlist(lapply(1:(nchar(s)-1),function(x) combn(2:nchar(s),x,g)))

Rui Barradas · Answer

これが基本のRソリューションですが、3つの入れ子のループで複雑になっています。

replaceChar <- function(x, char = "X"){ n <- nchar(x) res <- NULL for(i in seq_len(n)){ cmb <- combn(n, i) r <- apply(cmb, 2, function(cc){ y <- x for(k in cc) substr(y, k, k) <- char y }) res <- c(res, r) } res } x <- "ECET" replaceChar(x) replaceChar(x, "Y") replaceChar(paste0(x, x))

psychOle · Answer

ブールインデックスを使用するベクトル化されたメソッド：

permX <- function(text, replChar='X') { library(gtools) library(stringr) # get TRUE/FALSE permutations for nchar(text) idx <- permutations(2, nchar(text),c(T,F), repeats.allowed = T) # we don't want the first character to be replaced idx <- idx[1:(nrow(idx)/2),] # split string into single chars chars <- str_split(text,'') # build data.frame with nrows(df) == nrows(idx) df = t(data.frame(rep(chars, nrow(idx)))) # do replacing df[idx] <- replChar row.names(df) <- c() return(df) } permX('ECET') [,1] [,2] [,3] [,4] [1,] "E" "C" "E" "T" [2,] "E" "C" "E" "X" [3,] "E" "C" "X" "T" [4,] "E" "C" "X" "X" [5,] "E" "X" "E" "T" [6,] "E" "X" "E" "X" [7,] "E" "X" "X" "T" [8,] "E" "X" "X" "X"

krads · Answer

もう1つのシンプルなソリューション

# expand.grid to get all combinations of the input vectors, result in a matrix m <- expand.grid( c('E'), c('C','X'), c('E','X'), c('T','X') ) # then, optionally, apply to paste the columns together apply(m, 1, paste0, collapse='')[-1] [1] "EXET" "ECXT" "EXXT" "ECEX" "EXEX" "ECXX" "EXXX"