Word Embedding 원핫 벡터화를 통해 발생하는 sparse vector를 Dense하게 바꿔주는 과정을 말한다. ex) 오토인코더와 비슷하게 생겼다. - 차원을 압축, 해제하면서 특징 추출을 자동으로 학습하게 한다.(Latent Space) TF-IDF - TF: 단어의 문서 내 출현 횟수 - IDF: 단어가 출현한 문서의 갯수의 역수(inverse) TF / DF -> The와 같은 단어는 하나의 문서 내에서도 자주 등장했을 테지만 전체 문서를 기준으로 봤을 때도 대다수의 문서에 포함되었을 것이다. 이러한 단어에 패널티를 가하는 방식이다. Context Windowing 가정: 의미가 비슷한 단어는 쓰임새도 비슷할 것이다. 그래서 같이 등장할 확률이 높을 것이다. - 지정한 단어의 앞 뒤 n개..