« [Julia]パッケージマネージャーを起動する | トップページ | [R]数値を文字列に変換する »

2026年4月28日 (火)

[R]マララ・ユスフザイの国連本部での演説(2013年7月12日)の文章(原文)を得る

この演説は公式ページで全文公開されており、このページをダウンロードして加工することで、テキスト形式で全文を手に入れることができる。以下のスクリプトを実行すると、その全文が含まれたテキストファイルmalalaun_en.txtがカレントディレクトリに作成される。

> library(rvest)
> s <- "https://malala.org/news-and-voices/malala-un-speech"
> html <- read_html(s)
> lns <- html |> html_elements("p") |> html_text()
> idx <- grep("(Bismillah|Education first\\.)", lns)
> lns <- lns[idx[1]:idx[2]]
> write(lns, "malalaun_en.txt")

R_malalaun_en

« [Julia]パッケージマネージャーを起動する | トップページ | [R]数値を文字列に変換する »

R(テキストマイニング)」カテゴリの記事

コメント

コメントを書く

コメントは記事投稿者が公開するまで表示されません。

(ウェブ上には掲載しません)

« [Julia]パッケージマネージャーを起動する | トップページ | [R]数値を文字列に変換する »

無料ブログはココログ

■■

■■■