파이썬에서 한글 사용하기 위한 절차:
import konlpy
KoNLPy 패키지는 꼬꼬마, 한나눔, 트위터 분석기를 제공한다. 서로 약간의 차이점이 있으니 다음과 같이 비교해 본다.
# 꼬꼬마 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!!!
kkma = konlpy.tag.Kkma()
my_text = "한국어를 사용해 봅시다 너무 재미있어요 함께 분석해 볼까요?"
# 문장으로 분리.
kkma.sentences(my_text)
['한국어를 사용해 봅시다', '너무 재미있어요', '함께 분석해 볼까요?']
# 명사 추출.
kkma.nouns(my_text)
['한국어', '분석']
# 형태소.
print(kkma.morphs(my_text))
['한국어', '를', '사용하', '어', '보', 'ㅂ시다', '너무', '재미있', '어요', '함께', '분석', '하', '어', '보', 'ㄹ까요', '?']
# 품사 태깅.
print(kkma.pos(my_text))
[('한국어', 'NNG'), ('를', 'JKO'), ('사용하', 'VV'), ('어', 'ECS'), ('보', 'VV'), ('ㅂ시다', 'EFA'), ('너무', 'MAG'), ('재미있', 'VA'), ('어요', 'EFN'), ('함께', 'MAG'), ('분석', 'NNG'), ('하', 'XSV'), ('어', 'ECS'), ('보', 'VXV'), ('ㄹ까요', 'EFQ'), ('?', 'SF')]
# 한나눔 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!
hannanum = konlpy.tag.Hannanum()
# 명사 추출.
hannanum.nouns(my_text)
['한국어', '사용', '분석']
# 형태소.
print(hannanum.morphs(my_text))
['한국어', '를', '사용', '하', '어', '보', 'ㅂ시다', '너무', '재미있', '어', '요', '함께', '분석', '하', '어', '보', 'ㄹ까', '요', '?']
# 품사 태깅.
print(hannanum.pos(my_text))
[('한국어', 'N'), ('를', 'J'), ('사용', 'N'), ('하', 'X'), ('어', 'E'), ('보', 'P'), ('ㅂ시다', 'E'), ('너무', 'M'), ('재미있', 'P'), ('어', 'E'), ('요', 'J'), ('함께', 'M'), ('분석', 'N'), ('하', 'X'), ('어', 'E'), ('보', 'P'), ('ㄹ까', 'E'), ('요', 'J'), ('?', 'S')]
# 트위터 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!
okt = konlpy.tag.Okt()
# 명사 추출.
okt.nouns(my_text)
['한국어', '사용', '분석', '요']
# 형태소.
print(okt.morphs(my_text))
['한국어', '를', '사용', '해', '봅시다', '너무', '재미있어요', '함께', '분석', '해', '볼까', '요', '?']
# 품사 태깅.
print(okt.pos(my_text))
[('한국어', 'Noun'), ('를', 'Josa'), ('사용', 'Noun'), ('해', 'Verb'), ('봅시다', 'Verb'), ('너무', 'Adverb'), ('재미있어요', 'Adjective'), ('함께', 'Adverb'), ('분석', 'Noun'), ('해', 'Verb'), ('볼까', 'Verb'), ('요', 'Noun'), ('?', 'Punctuation')]