import dhlab.nbtext as nb
import dhlab.graph_networkx_louvain as gnl
import pandas as pd
from dhlab.module_update import update, css, code_toggle
%matplotlib inline
css()
For å hente ut ordparadigmer kan vi bruke funksjonen nb.word_paradigm('ord')
Resultatet blir alle formene for dette ordet, hentet fra Norsk Ordbank.
Eksempler:
nb.word_paradigm("meter")
[['subs', ['meter', 'meteren', 'meterne']]]
# Vi kan også legge dette i en variabel, som vi kan se på
søster = nb.word_paradigm('søster')
søster
[['subs', ['søster', 'søstera', 'søsteren', 'søstre', 'søstrene', 'søstrer']]]
# Eksempel med ord som er både adjektiv, substantiv og verb
fisker = nb.word_paradigm('fisker')
fisker
[['adj', ['fiska', 'fiskede', 'fiskende', 'fisket', 'fiskete']], ['subs', ['fisk', 'fisken', 'fiskene', 'fisker', 'fiska', 'fiske', 'fisket', 'fiskere', 'fiskeren', 'fiskerer', 'fiskerne']], ['verb', ['fisk', 'fiska', 'fiske', 'fisker', 'fiskes', 'fisket']]]
For en introduksjon til n-gram, se eksempelfil om N-gram og galakser eller NB N-gram.
Her har vi en funksjon som viser ngram for ordene i word_paradigm, paradigme_ngram
.
y=
definerer hvilken av ordgruppene vi får ut. Default er satt til 0.
z=
her kan vi angi ord utenfor paradigmet som vi også ønsker å undersøke.
paradigme_ngram = lambda x, y =0, z='': nb.nb_ngram(','.join(nb.word_paradigm(x)[y][1]+[z])).plot(figsize=(10,5),lw=(3))
paradigme_ngram("søster", y=0, z='')
<matplotlib.axes._subplots.AxesSubplot at 0x1c1d1311d0>
Tilbake til DHLAB ved Nasjonalbiblioteket