« [R]ベクトルに値を代入する | トップページ | [R]二つの集合MとNの共通部分M∩Nと和集合M∪Nを得る »

2024年3月30日 (土)

[R]ウェブサイトのページの文字コードを調べる

rvestパッケージのread_html関数とhtml_node関数を組み合わせて使う。以下の例では、ページの文字コードがUTF-8であることがわかる。

> library(dplyr)
> library(rvest)
> s <- "https://www.kunaicho.go.jp"
> html <- read_html(s)
> html %>% html_node(xpath = "//meta[@content | @charset]")
{html_node}
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

« [R]ベクトルに値を代入する | トップページ | [R]二つの集合MとNの共通部分M∩Nと和集合M∪Nを得る »

R(インターネット)」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« [R]ベクトルに値を代入する | トップページ | [R]二つの集合MとNの共通部分M∩Nと和集合M∪Nを得る »