수영장의 수영_데이터 분석 블로그

06. 한글 형태소 분석 기법 본문

Study/텍스트마이닝

06. 한글 형태소 분석 기법

슈빔멘 2022. 1. 3. 17:34

한글 형태소 분석기 종류

 

1. Arirang

- 검색엔진을 위한 색인작업 목표로 개발됨 (루씬)

- 루씬에서 한글만 뽑아내어 아리랑 개발

 

2. kkma 꼬꼬마

- 휴리스틱 + 히든 마르코프 모델

- NLP 실습에서 종종 본 분석기

 

3. KLT

- 초기 분석기 선두주자

 

4. 한나눔

- 각 단계를 모듈별로 분할

- 광범위한 한글 태그 제공

- 이 분석기도 자주 보았음

 

1) 전처리

2) 형태소 분석

3) POS Tagging

 

5. Komoran

- 여러 어절을 하나의 품사로 분석할 수 있음

- 공백이 있는 고유명사를 정확히 분석

- 불규칙 어절에 대한 분석 정확도 up

- 이거 많이 사용했다

 

 

'Study > 텍스트마이닝' 카테고리의 다른 글

08. 벡터 공간 모델  (0) 2022.01.10
07. 한글 구문 분석  (0) 2022.01.03
05. 한글 품사 태깅  (0) 2022.01.03
04. 형태소 분석  (0) 2022.01.03
03. 영어 전처리  (0) 2021.12.28