Study/텍스트마이닝
05. 한글 품사 태깅
슈빔멘
2022. 1. 3. 17:26
1. 규칙기반 접근방법
- 정밀하게 고안된 규칙이면 정확도가 높지만
- 현재처럼 많은 새로운 단어가 등장하는 시기엔 맞지 않음
2. 통계적 접근방법
- 충분한 분량의 태그가 제공되는 말뭉치에서 -> 통계 정보를 추출해 활용
- 태그가 부착된 말뭉치를 구축하는 게 어려우나, 그 외엔 자동화가 가능해진다
- Hidden Markov Model 등의 기계학습 방식을 적용 -> 품사 예측
3. 복합적 접근방법
- 여러가지를 복합적으로 활용