Video thumbnail

🎥 Doc2Vec의 문서 임베딩 – 문서 전체를 하나의 벡터로 Clipchamp로 제작


📘 14. Doc2Vec의 문서 임베딩 – 문서 전체를 하나의 벡터로

단어 임베딩이 개별 단어의 의미를 수치화하며 큰 혁신을 이루었지만, 인간은 문서와 문장 전체에서 의미를 이해합니다. 도크투벡은 단어가 아니라 문서 전체를 하나의 벡터로 표현하며, 글의 주제와 맥락을 직접 학습했습니다.

이 방식은 문서 분류, 추천, 검색을 한 단계 발전시켰고, 단순한 키워드 검색에서 벗어나 글의 의미적 구조를 반영할 수 있게 했습니다. 그러나 문서에 고정된 벡터를 부여하다 보니 문맥 변화나 긴 글의 세부 구조를 충분히 담지 못하는 한계도 있었습니다.

그럼에도 도크투벡은 단어 수준을 넘어 문서 수준으로 확장한 첫 걸음이었고, 이후 맥락적 임베딩 모델로 이어지는 중요한 전환점이 되었습니다.

👉 다음 에피소드: 15. 캐릭터 단위 모델링 – Char-RNN, 문자 수준에서 배우는 언어의 구조

🏷️ #자연어처리 #도크투벡 #문서임베딩 #NLPOdyssey #AI역사


🎥 Doc2Vec의 문서 임베딩 – 문서 전체를 하나의 벡터로 Clipchamp로 제작 - AI Odyssey NLP