TF-IDF 행렬의 특이값 분해를 통한 LSA(Latent Semantic Analysis)의 구현과 빈도 기반 토픽 모델의 한계
2023-02-17 09:55

TF-IDF 행렬의 특이값 분해를 통한 LSA(Latent Semantic Analysis)의 구현과 빈도 기반 토픽 모델의 한계

Step 1. 토픽모델링이란
토픽모델링은 특정 문서의 확률적 카테고리를 나누는 비지도학습 방법론이며 기본적인 컨셉은 다음과 같다.
문서는 단어의 조합이다.
문서 내 함께 등장하는 단어는 서로 연관성이 있다.
모든 문서에서 자주 등...
자연어 처리 및 텍스트 분석 방법론
NLP
Python
tfidf
데이터분석
데이터사이언스
데이터시각화
워드임베딩
자연어처리
토픽모델링
파이썬
001

댓글