[R]ウェブサイトのページの文字コードを調べる
rvestパッケージのread_html関数とhtml_node関数を組み合わせて使う。以下の例では、ページの文字コードがUTF-8であることがわかる。
> library(dplyr)
> library(rvest)
> s <- "https://www.kunaicho.go.jp"
> html <- read_html(s)
> html %>% html_node(xpath = "//meta[@content | @charset]")
{html_node}
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
« [R]ベクトルに値を代入する | トップページ | [R]二つの集合MとNの共通部分M∩Nと和集合M∪Nを得る »
「R(インターネット)」カテゴリの記事
- [R]ウェブサイトから読み取ったHTMLファイルをファイルに出力する(2026.03.14)
- [R]ウェブサイトの応答ヘッダーの取得に失敗する(2026.02.18)
- [R]エラーメッセージ「open.connection(x, "rb") でエラー: コネクションを開くことができません」(2026.02.17)
- [R]Webサイトのページを読み取る(2026.02.03)
- [R]ウェブサイトのページの表の中身を読み取る(2025.10.17)

コメント