[분류] 스팸메일 분류기 만들기
베이즈정리 $P(Yes | Sunny, normal) =$ $P(Yes)*P(Sunny, normal|Yes) \over {P(Yes)* P(Sunny,normal|Yes) + P(No) * P(Sunny,normal|No)}$ 데이터 # stringAsFactors = True : Factor 형태로 스트링을 읽겠다. sms_raw VectorSource() sms_corpus >> [1] "대한민국 조선 우리나라 민국 대한민국" gsub("우리나라","코리아",x) >>> [1] "대한민국 조선 코리아 민국 대한민국" gsub("조선","코리아",x) >>> [1] "대한민국 코리아 우리나라 민국 대한민국" # 형태소 분석 install.packages("SnowballC") library(Snowb..
2020.11.28