[R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(原文)を得る
この演説は公式ページで全文公開されており、このページをダウンロードして加工することで、テキスト形式で全文を手に入れることができる。以下のスクリプトを実行すると、その全文が含まれたテキストファイルmalalaun_en.txtがカレントディレクトリに作成される。
> library(rvest)
> s <- "https://malala.org/news-and-voices/malala-un-speech"
> html <- read_html(s)
> lns <- html |> html_elements("p") |> html_text()
> idx <- grep("(Bismillah|Education first\\.)", lns)
> lns <- lns[idx[1]:idx[2]]
> write(lns, "malalaun_en.txt")
« [Julia]パッケージマネージャーを起動する | トップページ | [R]数値を文字列に変換する »
「R(テキストマイニング)」カテゴリの記事
- [R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(原文)を得る(2026.04.28)
- [R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(日本語訳)を得る(2026.04.24)
- [R]MeCabで文章の形態素解析を簡単に行う(2026.04.18)
- [R]MeCabで文章の形態素解析を簡単に行う(2026.04.16)
- [R]MeCabに単語を追加する(Windows)(2026.04.07)


コメント