! pip install python-mecab-ko -U
%reset -f
import kss
import mecab
text = "회사 동료 분들과 다녀왔는데 분위기도 좋고 음식도 맛있었어요 다만, 강남 토끼정이 강남 쉑쉑버거 골목길로 쭉 올라가야 하는데 다들 쉑쉑버거의 유혹에 넘어갈 뻔 했답니다 강남역 맛집 토끼정의 외부 모습."
kss.split_morphemes(text, backend="mecab", num_workers=8)
# kss.split_sentences(text, backend="mecab", num_workers=8, ignores=[])
['회사 동료 분들과 다녀왔는데 분위기도 좋고 음식도 맛있었어요', '다만, 강남 토끼정이 강남 쉑쉑버거 골목길로 쭉 올라가야 하는데 다들 쉑쉑버거의 유혹에 넘어갈 뻔 했답니다', '강남역 맛집 토끼정의 외부 모습.']
from mecab import MeCab
mecab = MeCab()
mecab.pos('자연주의 쇼핑몰은 어떤 곳인가?')
[('자연주의', 'NNG'), ('쇼핑몰', 'NNG'), ('은', 'JX'), ('어떤', 'MM'), ('곳', 'NNG'), ('인가', 'VCP+EF'), ('?', 'SF')]
mecab.parse('즐거운 하루 보내세요!')
[Morpheme(span=Span(start=0, end=3), surface='즐거운', feature=Feature(pos='VA+ETM', semantic=None, has_jongseong=True, reading='즐거운', type='Inflect', start_pos='VA', end_pos='ETM', expression='즐겁/VA/*+ᆫ/ETM/*')), Morpheme(span=Span(start=4, end=6), surface='하루', feature=Feature(pos='NNG', semantic=None, has_jongseong=False, reading='하루', type=None, start_pos=None, end_pos=None, expression=None)), Morpheme(span=Span(start=7, end=9), surface='보내', feature=Feature(pos='VV', semantic=None, has_jongseong=False, reading='보내', type=None, start_pos=None, end_pos=None, expression=None)), Morpheme(span=Span(start=9, end=11), surface='세요', feature=Feature(pos='EP+EF', semantic=None, has_jongseong=False, reading='세요', type='Inflect', start_pos='EP', end_pos='EF', expression='시/EP/*+어요/EF/*')), Morpheme(span=Span(start=11, end=12), surface='!', feature=Feature(pos='SF', semantic=None, has_jongseong=None, reading=None, type=None, start_pos=None, end_pos=None, expression=None))]
from gensim.models import FastText
FastText.load_fasttext_format(
!curl -c ./cookie -s -L "https://drive.google.com/uc?export=download&id=1CQT4Sear6NKxGiZIW3WpAGkTanO0azrl" > /dev/null
!curl -Lb ./cookie \"https://drive.google.com/uc?export=download&confirm=`awk '/download/ {print $NF}' ./cookie`&id=1CQT4Sear6NKxGiZIW3WpAGkTanO0azrl\" -o wiki_20190620_small.txt
zsh:1: parse error near `&'
!curl -c ./cookie -s -L \"https://drive.google.com/uc?export=download&id=1CQT4Sear6NKxGiZIW3WpAGkTanO0azrl\" > /dev/null
zsh:1: no matches found: "https://drive.google.com/uc?export=download
from mecab import MeCab
mecab = MeCab()
mecab.morphs('영등포구청역에 있는 맛집 좀 알려주세요.')
['영등포구청역', '에', '있', '는', '맛집', '좀', '알려', '주', '세요', '.']