수피의 느슨한 개발

  • 홈
  • 태그

word2vec 1

Word Embedding에 대한 간략 정리

Word Embedding 원핫 벡터화를 통해 발생하는 sparse vector를 Dense하게 바꿔주는 과정을 말한다. ex) 오토인코더와 비슷하게 생겼다. - 차원을 압축, 해제하면서 특징 추출을 자동으로 학습하게 한다.(Latent Space) TF-IDF - TF: 단어의 문서 내 출현 횟수 - IDF: 단어가 출현한 문서의 갯수의 역수(inverse) TF / DF -> The와 같은 단어는 하나의 문서 내에서도 자주 등장했을 테지만 전체 문서를 기준으로 봤을 때도 대다수의 문서에 포함되었을 것이다. 이러한 단어에 패널티를 가하는 방식이다. Context Windowing 가정: 의미가 비슷한 단어는 쓰임새도 비슷할 것이다. 그래서 같이 등장할 확률이 높을 것이다. - 지정한 단어의 앞 뒤 n개..

데이터사이언스 이론 공부 2022.10.31
이전
1
다음
더보기
프로필사진

수피의 느슨한 개발

백엔드, 프론트, 앱 개발 머신러닝 등을 공부하며 유익했던 시간을 기록합니다.

  • 분류 전체보기
    • 일상 속 개발 탐구
    • 데이터사이언스 이론 공부
    • 백엔드 개발자(node.js)가 되는 과정
    • 파이썬 코딩 한줄

Tag

MSA, JWT, S3 bucket, 파이썬 계이름맞히기, sequelize, github, 스코프, Express, nest.js, RTMP, socket.io, Kafka, MySQL, 호이스팅, nodeJS, Access Token, node.js, CloudFront, Transformer, refresh token,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바