« [R]数値ベクトルを作成する | トップページ | [R]文字列の文字コードをUTF-8に変換する »

2018年11月28日 (水)

[R]文字列の文字コードを確認する

charToRaw関数を使う。

> charToRaw("ABC")
[1] 41 42 43
> charToRaw("あいう亜位右")
[1] 82 a0 82 a2 82 a4 88 9f 88 ca 89 45

上記は、WindowsのRで実行した例。「A」はアスキーコードで0x41。日本語は、Windows環境の日本語コードはシフトJISであり、シフトJISでは「あ」は16進法表記で82A0(0x82a0)、「亜」は889F(0x889f)であり、そのように出力されているのが確認できる。

> charToRaw("あいう亜位右")
[1] e3 81 82 e3 81 84 e3 81 86 e4 ba 9c e4 bd 8d e5 8f b3

上記はUTF-8のLinuxのRで実行した例。

« [R]数値ベクトルを作成する | トップページ | [R]文字列の文字コードをUTF-8に変換する »

R(文字と文字列)」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« [R]数値ベクトルを作成する | トップページ | [R]文字列の文字コードをUTF-8に変換する »

無料ブログはココログ

■■

■■■