Craig Ringerが言ったように、client_encoding
を設定する Windows-1252への接続はおそらく最善の方法ではありません。実際、取得するデータにエキゾチックな文字が1つ含まれている場合は、問題が発生しています。
一方、R環境でUnicodeを使用することは不可能な場合があります(Sys.setlocale
の場合と同じ問題があります) ... この質問
。)
回避策は、次のような関数を使用して、すべてのデータでUTF-8エンコーディングを手動で宣言することです。
set_utf8 <- function(x) {
# Declare UTF-8 encoding on all character columns:
chr <- sapply(x, is.character)
x[, chr] <- lapply(x[, chr, drop = FALSE], `Encoding<-`, "UTF-8")
# Same on column names:
Encoding(names(x)) <- "UTF-8"
x
}
また、すべてのクエリでこの関数を使用する必要があります:
set_utf8(dbGetQuery(con, "SELECT myvar FROM mytable"))
編集: もう1つの可能性は、RPostgres を使用することです。 RPostgreSQLの代わりに。私はそれを(あなたの質問と同じ構成で)テストしました、そして私が見る限り、宣言されたすべてのエンコーディングは自動的にUTF-8に設定されます。