Lahmanパッケージとは、Sean Lahman氏による1871年からのMLBのデータのデータベース。このパッケージをインストールすることで、いろいろな情報を簡単に扱うことができる。
> options(repos = "https://ftp.yz.yamagata-u.ac.jp/pub/cran/")
> install.packages("Lahman")
これに含まれるデータフレームPeopleには、選手別の簡単な情報が格納されている。イチロー、松井秀喜、大谷翔平に関する情報の一部を表示してみる。
> library(Lahman)
> nrow(People)
[1] 20676
> col <- c("playerID", "birthCountry", "nameFirst", "nameLast", "debut")
> subset(People, nameFirst == "Ichiro")[, col]
playerID birthCountry nameFirst nameLast debut
18191 suzukic01 Japan Ichiro Suzuki 2001-04-02
> subset(People, nameFirst == "Hideki" & nameLast == "Matsui")[, col]
playerID birthCountry nameFirst nameLast debut
11741 matsuhi01 Japan Hideki Matsui 2003-03-31
> subset(People, nameFirst == "Shohei")[, col]
playerID birthCountry nameFirst nameLast debut
13806 ohtansh01 Japan Shohei Ohtani 2018-03-29
上記のとおり、Peopleにはデータベースで扱っている全選手(約2万人)の情報が格納されており、選手のIDとしてplayerIDという文字列が用意されている。