[Python]文字の文字コードを簡単に調べる
encodeメソッドを使用する。以下は、文字列「あい亜井」のそれぞれの文字の文字コードを調べた例。なお、これら文字の文字コード(左から、文字、その文字のシフトJISコード、その文字のutf-8コード)は以下のとおり(0xは16進数であることを示す接頭語)。
あ 0x82A0 0xE38182
い 0x82A2 0xE38184
亜 0x889F 0xE4BA9C
井 0x88E4 0xE4BA95
>>> s = "あい亜井"
>>> s.encode("sjis")
b'\x82\xa0\x82\xa2\x88\x9f\x88\xe4'
>>> s.encode("utf-8")
b'\xe3\x81\x82\xe3\x81\x84\xe4\xba\x9c\xe4\xba\x95'
文字型変数を使用しなくても、文字列に直接使用することもできる。
>>> "あい亜井".encode("sjis")
b'\x82\xa0\x82\xa2\x88\x9f\x88\xe4'
