web-dev-qa-db-ja.com

名前で複数の列の名前を変更する

誰かがすでにこれを尋ねるべきでしたが、答えが見つかりませんでした。私が持っていると言います:

x = data.frame(q=1,w=2,e=3, ...and many many columns...)  

位置が必ずしもわからない列の任意のサブセットを、他の任意の名前に名前を変更する最もエレガントな方法は何ですか?

例えば"q""e"の名前を"A""B"に変更するとします。これを行うための最もエレガントなコードは何ですか?

明らかに、ループを行うことができます:

oldnames = c("q","e")
newnames = c("A","B")
for(i in 1:2) names(x)[names(x) == oldnames[i]] = newnames[i]

しかし、もっと良い方法があるのだろうか?たぶんいくつかのパッケージを使用していますか? (plyr::renameなど)

58
qoheleth

data.tablepackageのsetnamesは、data.framesまたはdata.tablesで動作します

library(data.table)
d <- data.frame(a=1:2,b=2:3,d=4:5)
setnames(d, old = c('a','d'), new = c('anew','dnew'))
d


 #   anew b dnew
 # 1    1 2    4
 # 2    2 3    5

変更は参照によって行われるため、コピーは行われないことに注意してください(data.framesでも!)

84
mnel

Dplyrを使用すると、次のことができます。

library(dplyr)

df = data.frame(q = 1, w = 2, e = 3)

df %>% rename(A = q, B = e)

#  A w B
#1 1 2 3

または、@ Jelena-bioinfが示唆するように、ベクトルを使用する場合:

library(dplyr)

df = data.frame(q = 1, w = 2, e = 3)

oldnames = c("q","e")
newnames = c("A","B")

df %>% rename_at(vars(oldnames), ~ newnames)

#  A w B
#1 1 2 3
59
Gorka

大きすぎないデータフレームの別の解決策は次のとおりです(@thelatemailの回答に基づいて構築):

x <- data.frame(q=1,w=2,e=3)

> x
  q w e
1 1 2 3

colnames(x) <- c("A","w","B")

> x
  A w B
1 1 2 3

または、次を使用することもできます。

names(x) <- c("C","w","D")

> x
  C w D
1 1 2 3

さらに、列名のサブセットの名前を変更することもできます。

names(x)[2:3] <- c("E","F")

> x
  C E F
1 1 2 3
30
Jaap

そのため、列が存在するかどうか不明で、名前が変更されている列のみを変更したい場合、私は最近自分でこれに遭遇しました:

existing <- match(oldNames,names(x))
names(x)[na.omit(existing)] <- newNames[which(!is.na(existing))]
11
JoelKuiper

purrr::set_names()といくつかのstringr操作の組み合わせを使用して複数の列の名前を変更するのに最も効率的な方法を次に示します。

library(tidyverse)

# Make a tibble with bad names
data <- tibble(
    `Bad NameS 1` = letters[1:10],
    `bAd NameS 2` = rnorm(10)
)

data 
# A tibble: 10 x 2
   `Bad NameS 1` `bAd NameS 2`
   <chr>                 <dbl>
 1 a                    -0.840
 2 b                    -1.56 
 3 c                    -0.625
 4 d                     0.506
 5 e                    -1.52 
 6 f                    -0.212
 7 g                    -1.50 
 8 h                    -1.53 
 9 i                     0.420
 10 j                     0.957

# Use purrr::set_names() with annonymous function of stringr operations
data %>%
    set_names(~ str_to_lower(.) %>%
                  str_replace_all(" ", "_") %>%
                  str_replace_all("bad", "good"))

# A tibble: 10 x 2
   good_names_1 good_names_2
   <chr>               <dbl>
 1 a                  -0.840
 2 b                  -1.56 
 3 c                  -0.625
 4 d                   0.506
 5 e                  -1.52 
 6 f                  -0.212
 7 g                  -1.50 
 8 h                  -1.53 
 9 i                   0.420
10 j                   0.957
9
Matt Dancho

@ user3114046の答えに基づいて:

x <- data.frame(q=1,w=2,e=3)
x
#  q w e
#1 1 2 3

names(x)[match(oldnames,names(x))] <- newnames

x
#  A w B
#1 1 2 3

これは、xデータセット内の列の特定の順序に依存しません。

5
thelatemail

これにより、すべての名前の文字の出現がすべて変更されます。

 names(x) <- gsub("q", "A", gsub("e", "B", names(x) ) )
4
42-
names(x)[names(x) %in% c("q","e")]<-c("A","B")
4
James King

名前セットを取得し、リストとして保存してから、文字列に対して一括名前変更を行うことができます。これの良い例は、データセットで長いから広い遷移を行う場合です:

names(labWide)
      Lab1    Lab10    Lab11    Lab12    Lab13    Lab14    Lab15    Lab16
1 35.75366 22.79493 30.32075 34.25637 30.66477 32.04059 24.46663 22.53063

nameVec <- names(labWide)
nameVec <- gsub("Lab","LabLat",nameVec)

names(labWide) <- nameVec
"LabLat1"  "LabLat10" "LabLat11" "LabLat12" "LabLat13" "LabLat14""LabLat15"    "LabLat16" " 
2
Boyce Byerly

テーブルに同じ名前の2つの列が含まれている場合、コードは次のようになります。

rename(df,newname=oldname.x,newname=oldname.y)
1
varun

たくさんの答えがあるので、コピー/ペーストできるように関数を書いたところです。

rename <- function(x, old_names, new_names) {
    stopifnot(length(old_names) == length(new_names))
    # pull out the names that are actually in x
    old_nms <- old_names[old_names %in% names(x)]
    new_nms <- new_names[old_names %in% names(x)]

    # call out the column names that don't exist
    not_nms <- setdiff(old_names, old_nms)
    if(length(not_nms) > 0) {
        msg <- paste(paste(not_nms, collapse = ", "), 
            "are not columns in the dataframe, so won't be renamed.")
        warning(msg)
    }

    # rename
    names(x)[names(x) %in% old_nms] <- new_nms
    x
}

 x = data.frame(q = 1, w = 2, e = 3)
 rename(x, c("q", "e"), c("Q", "E"))

   Q w E
 1 1 2 3
1
Dan

注:1つの文字列をすべての列名に連結する場合は、この単純なコードを使用できます。

colnames(df) <- paste("renamed_",colnames(df),sep="")
1
Corey Levinson

データの1行にすべての列を変更する名前が含まれている場合

names(data) <- data[row,]

dataはデータフレームであり、rowは新しい値を含む行番号です。

次に、名前を含む行を削除できます

data <- data[-row,]
0

これはあなたが必要とする関数です:それから単にrename(X)でxを渡すだけで、表示されるすべての値の名前を変更し、そこになければエラーになりません

rename <-function(x){
  oldNames = c("a","b","c")
  newNames = c("d","e","f")
  existing <- match(oldNames,names(x))
  names(x)[na.omit(existing)] <- newNames[which(!is.na(existing))]
  return(x)
}
0
Zuti