노트(211)
-
[분류] 스팸메일 분류기 만들기
베이즈정리 $P(Yes | Sunny, normal) =$ $P(Yes)*P(Sunny, normal|Yes) \over {P(Yes)* P(Sunny,normal|Yes) + P(No) * P(Sunny,normal|No)}$ 데이터 # stringAsFactors = True : Factor 형태로 스트링을 읽겠다. sms_raw VectorSource() sms_corpus >> [1] "대한민국 조선 우리나라 민국 대한민국" gsub("우리나라","코리아",x) >>> [1] "대한민국 조선 코리아 민국 대한민국" gsub("조선","코리아",x) >>> [1] "대한민국 코리아 우리나라 민국 대한민국" # 형태소 분석 install.packages("SnowballC") library(Snowb..
2020.11.28 -
[파이썬 알고리즘 인터뷰] 문자열 뒤집기
출처: 파이썬 알고리즘 인터뷰 6장 문자열을 뒤집는 함수를 작성하라. 입력값은 문자 배열이며, 리턴 없이 리스트 내부를 직접 조작하라. 예제1. 입력: ["h", "e", "l", "l", "o"] 출력: ["o", "l", "l", "e", "h"] 예제2. 입력: ["H", "a", "n", "n", "a", "h] 출력: ["h", "a", "n", "n", "a", "H] # 풀이 1. 투 포인터를 이용한 스왑 def reverseString(s)-> None: left, right = 0 , len(s) -1 while left < right: s[left], s[right] = s[right] , s[left] left += 1 right -= 1 return s # 풀이 2. 파이썬 다운 방..
2020.11.28 -
[파이썬알고리즘 인터뷰] 유효한 팰린드롬 구하기
출처: 파이썬 알고리즘 인터뷰 6장 주어진 문자열이 팰린드롬인지 확인하라. 대소문자를 구분하지 않으며, 영문자와 숫자만을 대상으로 한다 "A man, a plan, a canal: Panama" -> true "race a car" -> false test = "A man, a plan, a canal: Panama" test2 = "race a car" # 풀이1. 리스트로 변환 def isPalindrome(sentence): # 전처리 strs = [] for char in sentence: if char.isalnum(): strs.append(char.lower()) # 팰린드롬 여부 판별 while len(strs) > 1: if strs.pop(0) != strs.pop(): # 첫번째꺼를 ..
2020.11.28 -
[분류] C50, rpart 라이브러리를 활용한 의사결정
데이터 데이터 불러오기 credit
2020.11.22 -
[분류] k-means clustering(군집화, 클러스터링)
군집(clustering) : 데이터 셋을 클러스터 라는 그룹으로 나누는 작업 기업 입장에서는 타깃 마케팅, 고객 데이터, 유사한 구매 패턴을 가지는 그룹들로 나눔 데이터 데이터 불러오기 teens
2020.11.16 -
[분류] Apriori 라이브러리를 이용한 장바구니 분석 하기
데이터 패키지 설치 install.packages("arules") library(arules) 데이터 읽어오기 # read.csv로 읽어오면 안됌 # groceries
2020.11.16