[R]文字列の文字コードを確認する
charToRaw関数を使う。
> charToRaw("ABC")
[1] 41 42 43
> charToRaw("あいう亜位右")
[1] 82 a0 82 a2 82 a4 88 9f 88 ca 89 45
上記は、WindowsのRで実行した例。「A」はアスキーコードで0x41。日本語は、Windows環境の日本語コードはシフトJISであり、シフトJISでは「あ」は16進法表記で82A0(0x82a0)、「亜」は889F(0x889f)であり、そのように出力されているのが確認できる。
> charToRaw("あいう亜位右")
[1] e3 81 82 e3 81 84 e3 81 86 e4 ba 9c e4 bd 8d e5 8f b3
上記はUTF-8のLinuxのRで実行した例。
« [R]数値ベクトルを作成する | トップページ | [R]文字列の文字コードをUTF-8に変換する »
「R(文字と文字列)」カテゴリの記事
- [R]同じ文字列を繰り返した文字列を作成する(2026.02.02)
- [R]文字列が数値に変換できるかどうか判定する(2025.12.31)
- [R]文字列の長さを得る(2025.12.30)
- [R]空白を追加した指定の長さの文字列を得る(2025.12.26)
- [R]文字列型ベクトルの要素を連結して文字列を作る(2025.12.17)

コメント