[R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(日本語訳)を得る
この演説は英語で行われているがその日本語訳は公式ページで全文公開されており、このページをダウンロードして加工することで、テキスト形式で日本語訳全文を手に入れることができる。以下のスクリプトを実行すると、その日本語訳全文が含まれたテキストファイルmalalaun_jp.txtがカレントディレクトリに作成される。
> library(rvest)
> s <- "https://www.unic.or.jp/news_press/features_backgrounders/4790/"
> html <- read_html(s)
> lns <- html |> html_elements("p") |> html_text()
> idx <- grep("(2013年07月12日|* *** *)", lns)
> lns <- lns[(idx[1] + 1):(idx[2] - 1)]
> write(lns, "malalaun_jp.txt")
« [gfortran]エラーメッセージ「libgfortran-5.dllが見つからないため、コードの実行を続行できません。プログラムを再インストールすると、この問題が解決する可能性があります。」 | トップページ | [Julia]コマンドプロンプトやPowerShellでREPL(対話型実行環境)を起動する »
「R(テキストマイニング)」カテゴリの記事
- [R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(原文)を得る(2026.04.28)
- [R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(日本語訳)を得る(2026.04.24)
- [R]MeCabで文章の形態素解析を簡単に行う(2026.04.18)
- [R]MeCabで文章の形態素解析を簡単に行う(2026.04.16)
- [R]MeCabに単語を追加する(Windows)(2026.04.07)
« [gfortran]エラーメッセージ「libgfortran-5.dllが見つからないため、コードの実行を続行できません。プログラムを再インストールすると、この問題が解決する可能性があります。」 | トップページ | [Julia]コマンドプロンプトやPowerShellでREPL(対話型実行環境)を起動する »


コメント