본문 바로가기
파이썬

파이썬 Python에서 Twitter에 대한 감정 분석

by º기록 2020. 10. 4.
반응형


저는 트위터에서 "youtube"와 같은 검색어를 검색하고 "행복한"트윗과 "슬픈"트윗을 계산하는 애플리케이션을 작성 중입니다. I'm using Google's appengine, so it's in python. I'd like to be able to classify the returned search results from twitter and I'd like to do that in python. I haven't been able to find such sentiment analyzer so far, specifically not in python. 내가 사용할 수있는 오픈 소스 구현에 대해 잘 알고 있습니까? 바람직하게는 이것은 이미 파이썬으로되어 있지만 그렇지 않다면 파이썬으로 번역 할 수 있기를 바랍니다.

내가 분석하는 텍스트는 매우 짧고 트윗입니다. 이상적으로이 분류기는 이러한 짧은 텍스트에 최적화되어 있습니다.

BTW, twitter는 검색에서 ":)"및 ":("연산자를 지원합니다.이 연산자는이 작업을 수행하는 것을 목표로합니다.하지만 불행히도 그들에 의해 제공되는 분류는 그다지 좋지 않아서 제가 직접 시도해 볼 수 있다고 생각했습니다. .

감사!


 

해결 방법

 

대부분의 이러한 종류의 응용 프로그램에서는 통계적 분류 작업을 위해 많은 자체 코드를 롤링해야합니다. Lucka가 제안했듯이 NLTK는 귀하의 목표가 라이센스의 비 상업적 특성을 방해하지 않는 한 Python에서 자연어 조작을위한 완벽한 도구입니다. 그러나 모델링을위한 다른 소프트웨어 패키지를 제안합니다. Python에 사용할 수있는 강력한 고급 기계 학습 모델을 많이 찾지 못했기 때문에 쉽게 협력 할 수있는 독립 실행 형 바이너리를 제안하려고합니다.




작업에 행운을 빕니다. 정말 어려운 부분은 아마도 모델이 학습 할 '시드 세트'를 분류하는 데 필요한 지식 엔지니어링의 양일 것입니다. 이진 분류 (행복 vs 슬픔)를 수행하는지 또는 전체 범위의 감정 (더 많은 것이 필요함)을 수행하는지 여부에 따라 상당히 크기가 커야합니다. 테스트를 위해이 엔지니어링 된 데이터 중 일부를 보관하거나 10 배 또는 1 개 제거 테스트를 실행하여 실제로 예측을 잘 수행하고 있는지 확인하세요. 그리고 무엇보다도 재미있게 보내십시오! 이것은 제 생각에 NLP와 AI의 가장 좋은 부분입니다.

 

참조 페이지 https://stackoverflow.com/questions/573768

 

 

반응형

댓글