노트/R : 통계(12)
-
[분류] 스팸메일 분류기 만들기
베이즈정리 $P(Yes | Sunny, normal) =$ $P(Yes)*P(Sunny, normal|Yes) \over {P(Yes)* P(Sunny,normal|Yes) + P(No) * P(Sunny,normal|No)}$ 데이터 # stringAsFactors = True : Factor 형태로 스트링을 읽겠다. sms_raw VectorSource() sms_corpus >> [1] "대한민국 조선 우리나라 민국 대한민국" gsub("우리나라","코리아",x) >>> [1] "대한민국 조선 코리아 민국 대한민국" gsub("조선","코리아",x) >>> [1] "대한민국 코리아 우리나라 민국 대한민국" # 형태소 분석 install.packages("SnowballC") library(Snowb..
2020.11.28 -
[분류] C50, rpart 라이브러리를 활용한 의사결정
데이터 데이터 불러오기 credit
2020.11.22 -
[분류] k-means clustering(군집화, 클러스터링)
군집(clustering) : 데이터 셋을 클러스터 라는 그룹으로 나누는 작업 기업 입장에서는 타깃 마케팅, 고객 데이터, 유사한 구매 패턴을 가지는 그룹들로 나눔 데이터 데이터 불러오기 teens
2020.11.16 -
[분류] Apriori 라이브러리를 이용한 장바구니 분석 하기
데이터 패키지 설치 install.packages("arules") library(arules) 데이터 읽어오기 # read.csv로 읽어오면 안됌 # groceries
2020.11.16 -
[분류] KNN 알고리즘을 이용한 데이터 분류하기
중고차 데이터 usedcars
2020.10.24 -
[R 기초] 데이터 다루기(2) - apply 함수
# 데이터 생성 subject_name
2020.10.24