"R 그룹별 건수 구하기"의 두 판 사이의 차이

36번째 줄: 36번째 줄:
* [[R sqldf()]]
* [[R sqldf()]]
* [[R length()]]
* [[R length()]]
* [[R aggregate()]]
* [[R 그룹별 합 구하기]]
* [[R 그룹별 합 구하기]]
* [[SQL 그룹별 건수 구하기]]
* [[SQL 그룹별 건수 구하기]]


[[분류: R 데이터 전처리]]
[[분류: R 데이터 전처리]]

2019년 8월 25일 (일) 19:15 판

1 개요

R 그룹별 건수 구하기
  • 대략 "SELECT fruit, COUNT(ea) FROM df GROUP BY fruit"
df <- read.csv( header=T, stringsAsFactors=F, text="
day,fruit,ea
2019-06-01,apple,1
2019-06-11,apple,1
2019-06-21,banana,2
2019-07-01,apple,3
2019-07-11,banana,4
2019-08-25,orange,2
")

aggregate(ea ~ fruit, df, length)
##    fruit ea
## 1  apple  3
## 2 banana  2
## 3 orange  1

table(df$fruit)
##  apple banana orange 
##      3      2      1
library(sqldf)
sqldf("SELECT fruit, COUNT(ea) FROM df GROUP BY fruit")
##    fruit COUNT(ea)
## 1  apple         3
## 2 banana         2
## 3 orange         1

2 같이 보기

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}