web-dev-qa-db-ja.com

UTF-8エンコーディングのread.csv()

Csvファイルからデータを読み込み、文字のエンコードをUTF-8に指定しようとしています。 ?read.csv()命令を読んで、UTF-8に等しいfileEncodingセットがこれを達成するはずであるように見えます、しかし、チェックするとき、私はそれを見ません。データをインポートするときに文字列のエンコードをUTF-8に指定するより良い方法はありますか?

サンプルデータ:

ここからサンプルデータをダウンロード

fruit<- read.csv("fruit.csv", header = TRUE, fileEncoding = "UTF-8")
fruit[] <- lapply(fruit, as.character)
Encoding(fruit$Fruit)

出力は「不明」ですが、これは「UTF-8」になると予想されます。インポートされたすべての文字がUTF-8であることを保証する最良の方法は何ですか?ありがとうございました。

6
Rob.C
fruit       <- read.csv("fruit.csv", header = TRUE)
fruit[]     <- lapply(fruit, as.character)
fruit$Fruit <- paste0(fruit$Fruit, "\xfcmlaut") # Get non-ASCII char and jam it in!
Encoding(fruit$Fruit)

[1] "latin1" "latin1" "latin1"

fruit$Fruit <- enc2utf8(fruit$Fruit)
Encoding(fruit$Fruit)

[1]「UTF-8」「UTF-8」「UTF-8」

5
Hack-R