Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 태블로기초
- 오블완
- LSTM
- microsoft pl-300
- PowerBI
- POWER BI
- NLP
- pl-300
- 태블로
- 파워BI
- 파워비아이
- gru
- 구글애널리틱스
- GA4챌린지
- 신입일기
- pl300
- 인턴일기
- ga4
- 티스토리챌린지
- 모두의구글애널리틱스4
- data
- microsoft power bi
- 데이터분석
- RNN
- 길벗출판사
- 태블로입문
Archives
- Today
- Total
수영장의 수영_데이터 분석 블로그
06. 한글 형태소 분석 기법 본문
한글 형태소 분석기 종류
1. Arirang
- 검색엔진을 위한 색인작업 목표로 개발됨 (루씬)
- 루씬에서 한글만 뽑아내어 아리랑 개발
2. kkma 꼬꼬마
- 휴리스틱 + 히든 마르코프 모델
- NLP 실습에서 종종 본 분석기
3. KLT
- 초기 분석기 선두주자
4. 한나눔
- 각 단계를 모듈별로 분할
- 광범위한 한글 태그 제공
- 이 분석기도 자주 보았음
1) 전처리
2) 형태소 분석
3) POS Tagging
5. Komoran
- 여러 어절을 하나의 품사로 분석할 수 있음
- 공백이 있는 고유명사를 정확히 분석
- 불규칙 어절에 대한 분석 정확도 up
- 이거 많이 사용했다
'Study > 텍스트마이닝' 카테고리의 다른 글
08. 벡터 공간 모델 (0) | 2022.01.10 |
---|---|
07. 한글 구문 분석 (0) | 2022.01.03 |
05. 한글 품사 태깅 (0) | 2022.01.03 |
04. 형태소 분석 (0) | 2022.01.03 |
03. 영어 전처리 (0) | 2021.12.28 |