[R]ある列の重複を除いた個数を調べる
group_by関数で列を指定してグループ化し、summarize関数で集計する。集計時にn関数を指定すると、その個数を返す。以下はあらかじめ用意したtibbleで実行した例。
> library(tidyverse)
> tib %>% as.data.frame()
nama title seiyu
1 ライスシャワー ウマ娘 石見舞菜香
2 スーパークリーク ウマ娘 優木かな
3 メイショウドトウ ウマ娘 和多田美咲
4 フィー ライザのアトリエ2 和多田美咲
5 黒川あかね 推しの子 石見舞菜香
> tib %>% group_by(title) %>% summarize(nn = n()) %>% as.data.frame()
title nn
1 ウマ娘 3
2 ライザのアトリエ2 1
3 推しの子 1
> tib %>% group_by(seiyu) %>% summarize(nn = n()) %>% as.data.frame()
seiyu nn
1 優木かな 1
2 和多田美咲 2
3 石見舞菜香 2
グループ化には2つ以上の列を同時に指定することもできる。
> tib2 <- bind_rows(tib, slice(tib, c(1, 1, 3)))
> tib2 %>% as.data.frame()
nama title seiyu
1 ライスシャワー ウマ娘 石見舞菜香
2 スーパークリーク ウマ娘 優木かな
3 メイショウドトウ ウマ娘 和多田美咲
4 フィー ライザのアトリエ2 和多田美咲
5 黒川あかね 推しの子 石見舞菜香
6 ライスシャワー ウマ娘 石見舞菜香
7 ライスシャワー ウマ娘 石見舞菜香
8 メイショウドトウ ウマ娘 和多田美咲
> tib2 %>% group_by(title, seiyu) %>% summarize(nn = n()) %>% as.data.frame()
`summarise()` has grouped output by 'title'. You can override using the `.groups` argument.
title seiyu nn
1 ウマ娘 優木かな 1
2 ウマ娘 和多田美咲 2
3 ウマ娘 石見舞菜香 3
4 ライザのアトリエ2 和多田美咲 1
5 推しの子 石見舞菜香 1
« [R]tibbleで特殊な列名を使用して操作する | トップページ | [R]ベクトルの要素の先頭に要素を追加する »
「R(tidyverse)」カテゴリの記事
- [R]2つの列による重複を調べてその重複の数を表示する(2025.12.24)
- [R]tibbleから指定した一列を取り出してベクトルにする(2025.10.19)
- [R]tibbleを指定した列だけのtibbleに変換する(2025.10.14)
- [R]tibbleを指定した行だけのtibbleに変換する(2025.10.13)
- [R]tibbleの列名を得る(2025.07.17)
« [R]tibbleで特殊な列名を使用して操作する | トップページ | [R]ベクトルの要素の先頭に要素を追加する »

コメント