[자연어처리] word2vec 로 워드임베딩 하기
* 원핫인코더 vs 워드임베딩 원핫인코더 -> 멀캠 => [0,1,,0,0,0,0,0,] 1000차원 워드임베딩 -> 멀캠 => [0.3,-1.5] 100차원 * word2vec 알고리즘이 구현된 사이트 https://word2vec.kr/search/ Korean Word2Vec ABOUT 이곳은 단어의 효율적인 의미 추정 기법(Word2Vec 알고리즘)을 우리말에 적용해 본 실험 공간입니다. Word2Vec 알고리즘은 인공 신경망을 생성해 각각의 한국어 형태소를 1,000차원의 벡터 스페이 word2vec.kr * Word2vec Skip-gram : 중간 단어들로 부터 주변 단어를 예측 CBOW : 주변 단어들로 부터 중간 단어를 예측 모델 생성 코드 import re from lxml import..
2020.05.18