노트/Data Science : 데이터과학(15)
-
[Foundation of Data science] 추론 통계
목차 : 이항 분포 (Binomial Distribution) 연속 Uniform 분포 (Continuous Uniform Distribution) 정규 분포 (Normal Distribution) 중심 극한 정리 (Central Limit Theorem (CLT)) 점 추정 (Point estimation) 신뢰 구간 (Confidence Interval) 이항 분포 (Binomial Distribution) 문제 설명 Lavista 박물관의 방문객중 80%는 박물관 내의 기념품 점에서 결국 기념품을 구매합니다. 다음주 일요일날, 임의의 10명의 표본이 선택되었습니다. : 모든 사람들이 기념품 점에서 결국 기념품을 구매할 확률을 구하세요. 최대 7명의 방문객들이 기념품 점에서 기념품을 구매할 확률을 구..
2022.12.10 -
[Foundations of Data Science] 유산소 운동 피트니스 분석 (기술통계 분석 EDA)
유산소 운동 피트니스 케이스 스터디 - 기술 통계(Descriptive Statistics) AdRight의 시장 리서치 팀에게 유산소 운동 피트니스에서 제공된 각 런닝머신 기구에 대한 일반적인 고객들의 프로파일을 확인하라는 업무가 할당되었습니다. 시장 리서치 팀은 고객 특성과 관련하여 제품군에 걸쳐 차이가 있는지 조사하기로 결정했습니다. 팀에서는 과거 3개월 동안 유산소 운동 피트니스 소매점의 런닝머신 기구를 구매한 개인들에대한 데이터를 수집하였습니다. 이 데이터는 CardioGoodFitness.csv 파일입니다. 팀은 다음 고객 변수를 연구하기로 했습니다. 구매된 상품, TM195, TM498, or TM798 성별 나이 교육 수준 관계 상태, 싱글 또는 파트너가 있는지, 연간 가구 소득 고객이 매..
2022.11.06 -
[Foundations of Data Science] 자살률 분석 (이변량 분석 EDA)
이변량 분석 (Bivariate Analysis) 이변량 분석을 통해서, 2가지 변수를 동시에 분석할 예정이다. 하나의 변수에 대한 특성을 확인하는 단변량 분석 (Univariate Analysis)과는 달리, 이변량 분석 에서는 두가지 변수 사이의 어떤 관계성을 결정할 것이다. 이변량 분석에서 수행하게 되는 3가지 주요한 시나리오는 다음과 같다. Tip [질적(qualitative) data] : 원칙적으로 숫자로 표시될 수 없는 자료 이지만, 측정 대상의 특성을 분류하거나, 확인할 목적으로 숫자를 부여하며, 그 크기가 양적인 크기를 나타내는 것이 아님. [양적(quantative) data] : 이산형 자료 (discrete data) vs 연속형 자료 (continuous data) 로 나뉘어 지며..
2022.09.15