Study/텍스트마이닝

05. 한글 품사 태깅

슈빔멘 2022. 1. 3. 17:26

1. 규칙기반 접근방법

- 정밀하게 고안된 규칙이면 정확도가 높지만

- 현재처럼 많은 새로운 단어가 등장하는 시기엔 맞지 않음

 

2. 통계적 접근방법

- 충분한 분량의 태그가 제공되는 말뭉치에서 -> 통계 정보를 추출해 활용

- 태그가 부착된 말뭉치를 구축하는 게 어려우나, 그 외엔 자동화가 가능해진다

- Hidden Markov Model 등의 기계학습 방식을 적용 -> 품사 예측

 

3. 복합적 접근방법

- 여러가지를 복합적으로 활용

 

 

 

세종 말뭉치 태그 세트