« [R]環境変数を取得する | トップページ | [R]溶液のpH値の99%信頼区間(「統計解析のはなし」(東京図書)pp.150-151) »

2023年5月 2日 (火)

[R]文字列の文字コードを変換する

iconv関数を使う。以下の例では、シフトSJISの環境下で、以下の3行からなるUTF-8(改行コードはCR+LF)で保存されたテキストファイル(ファイル名はutf8.txt)を直接読み込み、それをUTF-8からシフトJISに保存をしている。

ABC
あいう
阿位宇

ファイルを読み込み、文字列を変換する。

> scan("utf8.txt", what = character(), fileEncoding = "UTF-8")
Read 3 items
[1] "ABC" "あいう" "阿位宇"
> ch <- readChar("utf8.txt", 27, useBytes = TRUE)
> print(ch)
[1] "ABC\r\n縺ゅ>縺<86>\r\n髦ソ菴榊ョ<87>\r\n"
> iconv(ch, from = "UTF-8", to = "SJIS")
[1] "ABC\r\nあいう\r\n阿位宇\r\n"

« [R]環境変数を取得する | トップページ | [R]溶液のpH値の99%信頼区間(「統計解析のはなし」(東京図書)pp.150-151) »

R(文字と文字列)」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« [R]環境変数を取得する | トップページ | [R]溶液のpH値の99%信頼区間(「統計解析のはなし」(東京図書)pp.150-151) »

無料ブログはココログ

■■

■■■