본문 바로가기
파이썬

파이썬 gensim word2vec: Find number of words in vocabulary

by º기록 2020. 11. 9.
반응형


 

해결 방법

 

어휘는 Word2Vec 모델의 wv 속성의 vocab 필드에 사전으로 있으며 키는 각 토큰 (단어)입니다. 따라서 딕셔너리의 길이를 얻는 것은 일반적인 Python입니다.

len(w2v_model.wv.vocab)

(0.13 이전의 gensim 버전에서는 vocab 이 모델에 직접 나타났습니다. 따라서 w2v_model.wv.vocab 대신 w2v_model.vocab 를 사용합니다. .)

 

참조 페이지 https://stackoverflow.com/questions/35596031

 

 

반응형

댓글