노트(211)
-
[파이썬기초] 데이터 합치기(병합)
pandas.merge() : 하나 이상의 키를 기준으로 DataFrame의 로우를 합침 join메서드 : 컬럼이 겹치지 않고, 완전히 같거나 유사한 색인구조를 가진 여러개의 DataFrame 객체를 합침 pandas.concat() : 하나의 축을 따라 객체를 이어 붙임 combine_first 메서드 : 두 객체를 포개서 한 객체에서 누락된 데이터를 다른 객체에 있는 값으로 채움 예제 데이터 생성 import pandas as pd dleft=pd.DataFrame({"key":['k0','k1','k2','k3'], "A":['a0','a1','a2','a3'], "B":['b0','b1','b2','b3']}) dright=pd.DataFrame({"key":['k2','k3','k4','k5']..
2020.04.13 -
[파이썬기초] 문자열(str) 데이터 다루기
문자열 데이터 변형 data = " a, b, apple" #공백문자 (줄바꿈 문자 포함) 제거하여 리스트로 생성 list=[x.strip() for x in data.split(",")] >>> ['a', 'b', 'apple'] # 쉼표 구분 없이 문자열들의 나열로 리스트 생성 " ".join(list) >>> 'a b apple' join() : 문자열을 구분자로 하여 다른 문자열을 순서대로 이어붙인다. index() : 부분 문자열의 첫번째 글자의 위치를 반환한다. 없을 경우 ValueError find() : 부분 문자열의 첫번째 글자의 위치를 반환한다. 없을 경우 -1 rfind() : 부분 문자 문자열의 마지막 글자의 위치를 반환한다. replcae() " 문자열을 다른 문자열로 치환한다. ..
2020.04.13 -
[파이썬기초] 시계열 데이터 생성하기
시계열 데이터 생성 # 시계열 데이터 생성 import pandas as pd data_ix = pd.date_range("2020/04/13",periods=5,freq="D") #일 >>>DatetimeIndex(['2020-04-13', '2020-04-14', '2020-04-15', '2020-04-16', '2020-04-17'], dtype='datetime64[ns]', freq='D') data_ix = pd.date_range("2020/04/13",periods=5,freq="M") #월 >>>DatetimeIndex(['2020-04-30', '2020-05-31', '2020-06-30', '2020-07-31', '2020-08-31'], dtype='datetime64[ns]'..
2020.04.13 -
[github] 깃헙으로 재택 근무 하기
1. gitbash 를 설치 https://gitforwindows.org/ Git for Windows Git for Windows focuses on offering a lightweight, native set of tools that bring the full feature set of the Git SCM to Windows while providing appropriate user interfaces for experienced Git users and novices alike. Git BASH Git for Windows provides a BA gitforwindows.org 2. 작업할 폴더 내부 공간에서 마우스 오른쪽 클릭 > Git Bash Here 클릭 3. 저장소 설정 아래 코드 ..
2020.04.10 -
[토픽모델링] LSA (Latent Similarity Analysis)를 이용한 토픽모델링 파이썬 코드
데이터 불러오기 from sklearn.datasets import fetch_20newsgroups #20 가지의 서로다른 뉴스데이터 dataset=fetch_20newsgroups(shuffle=True, random_state=1, remove=("headers","footers","quotes")) type(dataset) #sklearn.utils.Bunch documents=dataset.data len(documents) #11314건의 뉴스기사 print(type(documents)) #list 가공이 안된 law data이여서 데이터 전처리 과정이 필요 # 카테고리 확인 dataset.target_names sklearn 패키지에서 분류해놓은 카테고리 ( 결과값 ), 토픽모델링을 하면 여..
2020.04.09 -
[로고제작] 무료 로고제작 사이트
https://hatchful.shopify.com/your-logos Hatchful | Your digital logo designer Create stunning logos in seconds - no design skills required! hatchful.shopify.com business 컨셉 선택 시각적 스타일 선택 중복 선택 가능 business 이름 입력 logo 사용처 선택 중복선택 가능 마음에드는 로고 선택 다운로드 이메일로 전송됌 인스타그램, 유투브, 링크드인 로고 제작 가능
2020.04.09