🎥 Doc2Vec의 문서 임베딩 – 문서 전체를 하나의 벡터로 Clipchamp로 제작
- Track: nlp
- Era: all
- Video ID: d7c-_mvwCRU
- Playlist: PLSucJlr3QLmwYcQ3XsyNkyiOl1chU3pAA
- YouTube: Watch
- Thumbnail:

📘 14. Doc2Vec의 문서 임베딩 – 문서 전체를 하나의 벡터로
단어 임베딩이 개별 단어의 의미를 수치화하며 큰 혁신을 이루었지만, 인간은 문서와 문장 전체에서 의미를 이해합니다. 도크투벡은 단어가 아니라 문서 전체를 하나의 벡터로 표현하며, 글의 주제와 맥락을 직접 학습했습니다.
이 방식은 문서 분류, 추천, 검색을 한 단계 발전시켰고, 단순한 키워드 검색에서 벗어나 글의 의미적 구조를 반영할 수 있게 했습니다. 그러나 문서에 고정된 벡터를 부여하다 보니 문맥 변화나 긴 글의 세부 구조를 충분히 담지 못하는 한계도 있었습니다.
그럼에도 도크투벡은 단어 수준을 넘어 문서 수준으로 확장한 첫 걸음이었고, 이후 맥락적 임베딩 모델로 이어지는 중요한 전환점이 되었습니다.
👉 다음 에피소드: 15. 캐릭터 단위 모델링 – Char-RNN, 문자 수준에서 배우는 언어의 구조
🏷️ #자연어처리 #도크투벡 #문서임베딩 #NLPOdyssey #AI역사
