한글 사용:¶

파이썬에서 한글 사용하기 위한 절차:

Java SDK 다운로드 페이지에서 JDK를 다운로드 한다.
jdk 폴더를 환경 변수로 설정해야 한다 (JAVA_HOME).
KoNLPy 패키지 설치.
Jype1 패키지 설치.

In [1]:

import konlpy

KoNLPy 패키지는 꼬꼬마, 한나눔, 트위터 분석기를 제공한다. 서로 약간의 차이점이 있으니 다음과 같이 비교해 본다.

꼬꼬마 분석기:¶

In [2]:

# 꼬꼬마 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!!!
kkma = konlpy.tag.Kkma()

In [3]:

my_text = "한국어를 사용해 봅시다 너무 재미있어요 함께 분석해 볼까요?"

In [4]:

# 문장으로 분리.
kkma.sentences(my_text)

Out[4]:

['한국어를 사용해 봅시다', '너무 재미있어요', '함께 분석해 볼까요?']

In [5]:

# 명사 추출.
kkma.nouns(my_text)

Out[5]:

['한국어', '분석']

In [6]:

# 형태소.
print(kkma.morphs(my_text))

['한국어', '를', '사용하', '어', '보', 'ㅂ시다', '너무', '재미있', '어요', '함께', '분석', '하', '어', '보', 'ㄹ까요', '?']

In [7]:

# 품사 태깅.
print(kkma.pos(my_text))

[('한국어', 'NNG'), ('를', 'JKO'), ('사용하', 'VV'), ('어', 'ECS'), ('보', 'VV'), ('ㅂ시다', 'EFA'), ('너무', 'MAG'), ('재미있', 'VA'), ('어요', 'EFN'), ('함께', 'MAG'), ('분석', 'NNG'), ('하', 'XSV'), ('어', 'ECS'), ('보', 'VXV'), ('ㄹ까요', 'EFQ'), ('?', 'SF')]

한나눔 분석기:¶

In [8]:

# 한나눔 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!
hannanum = konlpy.tag.Hannanum()

In [9]:

# 명사 추출.
hannanum.nouns(my_text)

Out[9]:

['한국어', '사용', '분석']

In [10]:

# 형태소.
print(hannanum.morphs(my_text))

['한국어', '를', '사용', '하', '어', '보', 'ㅂ시다', '너무', '재미있', '어', '요', '함께', '분석', '하', '어', '보', 'ㄹ까', '요', '?']

In [11]:

# 품사 태깅.
print(hannanum.pos(my_text))

[('한국어', 'N'), ('를', 'J'), ('사용', 'N'), ('하', 'X'), ('어', 'E'), ('보', 'P'), ('ㅂ시다', 'E'), ('너무', 'M'), ('재미있', 'P'), ('어', 'E'), ('요', 'J'), ('함께', 'M'), ('분석', 'N'), ('하', 'X'), ('어', 'E'), ('보', 'P'), ('ㄹ까', 'E'), ('요', 'J'), ('?', 'S')]

트위터 분석기:¶

In [12]:

# 트위터 분석기 객체를 가져와서 분석 준비를 한다. 대문자 주의!
okt = konlpy.tag.Okt()

In [13]:

# 명사 추출.
okt.nouns(my_text)

Out[13]:

['한국어', '사용', '분석', '요']

In [14]:

# 형태소.
print(okt.morphs(my_text))

['한국어', '를', '사용', '해', '봅시다', '너무', '재미있어요', '함께', '분석', '해', '볼까', '요', '?']

In [15]:

# 품사 태깅.
print(okt.pos(my_text))

[('한국어', 'Noun'), ('를', 'Josa'), ('사용', 'Noun'), ('해', 'Verb'), ('봅시다', 'Verb'), ('너무', 'Adverb'), ('재미있어요', 'Adjective'), ('함께', 'Adverb'), ('분석', 'Noun'), ('해', 'Verb'), ('볼까', 'Verb'), ('요', 'Noun'), ('?', 'Punctuation')]

In [ ]: