DataProcessing/NLP
반응형
-
[Spark] Python 자연어처리 KoNLPy 형태소 분석 (feat. '코로나')DataProcessing/NLP 2021. 1. 30. 16:46
파이썬에서는 텍스트분석을 위한 자연어처리(Natural language processing) 오픈소스 라이브러리를 제공하는데 그 중에서도 한국어 자연어 처리를 위한 파이썬 패키지로는 KoNLPy ("코엔엘파이")가 있습니다. 일명 '파이썬 한글 형태소 분석기' 라고 합니다. KoNLPy에는 5가지의 종류의 형태소 분석기가 클래스로 포함되어 있습니다: Okt(Open Korea Text) 꼬꼬마(Kkma) 메캅(Mecab) 코모란(Komoran) 한나눔(Hannanum) 이는 자바 기반의 형태소 분석기 이므로 pip으로 바로 설치되지 않고, Java jdk와 Jpype를 설치해야 합니다. liveyourit.tistory.com/56 KoNLPy (파이썬 한글 형태소 분석기 ) 윈도우 설치 방법 파이썬 한..