Notebook

In [1]:

from datetime import datetime
print(f'Päivitetty {datetime.now().date()} / Aki Taanila')

Päivitetty 2024-07-23 / Aki Taanila

Datan automaattinen analysointi - tulokset Excel-tiedostoon¶

Tämän muistion avulla voit laskea automaattisesti frekvenssitaulukot, ristiintaulukoinnit, dikotomisten muuttujien yhteenvedot, tilastolliset tunnusluvut ja korrelaatiot. Tulokset kirjoitetaan Excel-tiedostoon.

Sinun tehtäväksesi jää

Vaihda avattavan datan tilalle analysoitava data
Tarkista data ja tee tarvittavat muutokset
Määrittele analysoitavat muuttujat Käyttäjän määrittelyt-otsikon alla.

In [2]:

# Analysoinnissa käytettävät Python-paketit
import numpy as np
import pandas as pd
from scipy.stats import chi2_contingency, ttest_ind, pearsonr

Datan avaaminen¶

Esimerkkinä käyttämäni data osoitteessa https://taanila.fi/data1.xlsx. Datan tilalle voit vaihtaa toisen datan.

info()-listauksesta näet

datan rivien määrän
muuttujien nimet
muuttujakohtaiset havaintojen lukumäärät
muuttujien tyypit (int64 tarkoittaa kokonaislukua ja float64 liukulukua).

In [3]:

df = pd.read_excel('https://taanila.fi/data1.xlsx')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 82 entries, 0 to 81
Data columns (total 16 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   nro       82 non-null     int64  
 1   sukup     82 non-null     int64  
 2   ikä       82 non-null     int64  
 3   perhe     82 non-null     int64  
 4   koulutus  81 non-null     float64
 5   palveluv  80 non-null     float64
 6   palkka    82 non-null     int64  
 7   johto     82 non-null     int64  
 8   työtov    81 non-null     float64
 9   työymp    82 non-null     int64  
 10  palkkat   82 non-null     int64  
 11  työteht   82 non-null     int64  
 12  työterv   47 non-null     float64
 13  lomaosa   20 non-null     float64
 14  kuntosa   9 non-null      float64
 15  hieroja   22 non-null     float64
dtypes: float64(7), int64(9)
memory usage: 10.4 KB

Käyttäjän määrittelyt¶

Määrittele listoina kategoriset, määrälliset (kvantit) ja dikotomiset muuttujat. Tarvittaessa sama muuttuja voi olla useammassakin listassa. Muuttujan voi jättää myös pois listoista, jolloin sitä ei analysoida.

Tärkeää: Jos kategoriset, kvantit tai dikotomiset -listaan ei tule muuttujia, niin jätä kuitenkin tyhjä lista [ ].

Jos kategorisen muuttujan arvot ovat datassa numeroita, niin voit määritellä numeroita vastaavat tekstimuotoiset arvot listat-sanakirjana. Näin saat tekstimuotoiset arvot automaattisesti tulostaulukoihin. Kirjoita tekstimuotoiset arvot niitä vastaavien numeroarvojen mukaisessa järjestyksessä.

Tärkeää: Jos et määrittele tekstimuotoisia arvoja, niin jätä kuitenkin tyhjä listat-sanakirja listat = { }

Voit hyödyntää sarakenimien listaa (columns) omia listoja kirjoittaessa:

In [4]:

df.columns

Out[4]:

Index(['nro', 'sukup', 'ikä', 'perhe', 'koulutus', 'palveluv', 'palkka',
       'johto', 'työtov', 'työymp', 'palkkat', 'työteht', 'työterv', 'lomaosa',
       'kuntosa', 'hieroja'],
      dtype='object')

In [5]:

# Tarkasteltavat muuttujat
kategoriset = ['sukup', 'perhe', 'koulutus', 'johto', 'työtov', 'työymp', 'palkkat', 'työteht']
kvantit = ['ikä', 'palveluv', 'palkka', 'johto', 'työtov', 'työymp', 'palkkat', 'työteht']
dikotomiset = ['työterv', 'lomaosa', 'kuntosa', 'hieroja']

# Esimerkkidatassa on useita samalla asteikolla mitattuja muuttujia
# Toiston välttämiseksi tallennetaan asteikko listana
tyytyvaisyys = ['Erittäin tyytymätön', 'Tyytymätön','Ei tyytymätön eikä tyytyväinen',
                'Tyytyväinen', 'Erittäin tyytyväinen']

# Tekstiarvot df:n kategorisille muuttujille, joiden arvot datassa koodattu numeroina
listat = {'sukup':['Mies', 'Nainen'],
         'perhe':['Perheetön', 'Perheellinen'],
         'koulutus':['Peruskoulu', '2. aste', 'Korkeakoulu', 'Ylempi korkeakoulu'],
         'johto':tyytyvaisyys,
         'työtov':tyytyvaisyys,
         'työymp':tyytyvaisyys,
         'palkkat':tyytyvaisyys,
         'työteht':tyytyvaisyys}

Arvojen tarkistus¶

Seuraavan solun koodin avulla voit tarkistaa kategoristen ja dikotomisten muuttujien arvot.

Kokonaislukutyyppisten (int) muuttujien arvot näytetään sellaisenaan.
Liukulukutyyppisten muuttujien arvot näytetään desimaalipisteellä varustettuna, esimerkiksi 1. 2. jne.
nan tarkoittaa puuttuvaa arvoa.
Numeerinen muuttuja, jolla on puuttuvia arvoja on aina liukulukutyyppinen, koska kokonaislukutyyppisille muuttujille puuttuvaa arvoa ei ole määritelty.
Jos huomaat asiaan kuulumattomia arvoja, niin tee dataan tarvittavat korjaukset.

In [6]:

for var in df[kategoriset + dikotomiset]:
    try:
        print(var, np.unique(df[var]))
    except:
        print(var, pd.unique(df[var]))

sukup [1 2]
perhe [1 2]
koulutus [ 1.  2.  3.  4. nan]
johto [1 2 3 4 5]
työtov [ 2.  3.  4.  5. nan]
työymp [1 2 3 4 5]
palkkat [1 2 3 4 5]
työteht [1 2 3 4 5]
työterv [ 1. nan]
lomaosa [ 1. nan]
kuntosa [ 1. nan]
hieroja [ 1. nan]

Excelin alustus¶

Voit halutessasi vaihtaa Excel-tiedoston (pika.xlsx) nimen.

Tärkeää: Jos samanniminen Excel-tiedosto on jo olemassa niin menetät sen, koska koodi ylikirjoittaa tiedoston kysymättä.

In [7]:

# Excel-tiedoston luonti
writer = pd.ExcelWriter('pika.xlsx', engine='xlsxwriter')
workbook = writer.book

# Muotoilut
decimal3_format = workbook.add_format({'num_format':'0.000'})
percent_format = workbook.add_format({'num_format':'0.0 %'})
header_format = workbook.add_format({'align': 'right', 'bottom': 1})
title_format = workbook.add_format({'align': 'left', 'bottom':1})
index_format = workbook.add_format({'align': 'left', 'border':0})
bold_format = workbook.add_format({'bold': True})
right_format = workbook.add_format({'align':'right'})

Tulosten laskenta¶

Tulosten laskenta toistuu samanlaisena usealle muuttujalle. Tämän vuoksi seuraavassa käytetään valmiita funktioita (def), joita kutsutaan jokaisen laskettavan muuttujan kohdalla.

Tulosten kirjoittaminen Exceliin ja muotoilu Excelissä muodostaa ison osan koodista. Tässä käytetään xlsxwriteria, josta löydät lisätietoa osoitteesta https://xlsxwriter.readthedocs.io/

Frekvenssitaulukot kategorisille muuttujille¶

Laskee frekvenssitaulukot df:n muuttujille, joiden nimet löytyvät kategoriset-listasta.
Taulukoihin lisätään muuttujien tekstimuotoiset arvot, jotka löytyvät listat-sanakirjasta.
Jos sanakirjan arvojen lukumäärä ei ole sama kuin frekvenssitaulukossa esiintyvien arvojen lukumäärä, niin tekstimuotoisia arvoja ei listätä frekvenssitaulukkoon.

In [ ]:

In [8]:

def frekv(muuttuja):

    '''Frekvenssitaulukko df:n muuttujalle muuttuja'''

    df1 = pd.crosstab(df[muuttuja], columns='f')
    df1.columns.name = ''
    n = df1['f'].sum()
    df1['%'] = df1['f']/n

    # muuttujan tekstimuotoiset arvot
    if muuttuja in listat.keys():
        if len(listat[muuttuja]) == len(df1.index):
            df1.index = listat[muuttuja]

    df1.loc['Yhteensä'] = df1.sum()

    return df1


if kategoriset:
    rivi = 2    # Excelin rivinumero, johon seuraava taulukko kirjoitetaan
    ws1 = workbook.add_worksheet('frekvenssitaulukot')
    for muuttuja in kategoriset:

        df1 = frekv(muuttuja)

        df1.to_excel(writer, sheet_name='frekvenssitaulukot', startrow=rivi)
        ws1.write(rivi, 0, muuttuja, title_format)
        for sarake, arvo in enumerate(df1.columns):
            ws1.write(rivi, sarake+1, arvo, header_format)
        for rivinumero, arvo in enumerate(df1.index):
            ws1.write(rivi+rivinumero+1, 0, arvo, index_format)

        rivi = rivi+df1.shape[0] + 2

    ws1.set_column('C:C', cell_format=percent_format)
    ws1.write(0, 0, 'Kategoristen muuttujien frekvenssitaulukot', bold_format)

Ristiintaulukoinnit kategorisille muuttujille¶

Laskee ristiintaulukoinnit df:n muutujille, jotka löytyvät kategoriset-listasta.
Ristiintaulukointien prosentit ovat prosentteja sarakkeiden kokonaismääristä (taulukoissa näkyvät n-arvot).
Taulukoihin lisätään muuttujien tekstimuotoiset arvot, jotka löytyvät listat-sanakirjasta.
Jos sanakirjan arvojen lukumäärä ei ole sama kuin ristiintaulukoinnissa esiintyvien arvojen lukumäärä, niin tekstimuotoisia arvoja ei listätä taulukkoon.
Ristiintaulukoinnin viereen lasketaan khiin neliö -testimuuttuja, khiin neliö -testin p-arvo ja vapausasteiden lukumäärä.

In [9]:

def risti(muuttuja1, muuttuja2):

    '''Ristiintaulukointi df:n muuttujille muuttuja1 ja muuttuja2.
    Funktio palauttaa ristiintaulukoinnin lisäksi n-arvot ja khiin neliö -testin tuloksen.'''

    khi_testi = chi2_contingency(pd.crosstab(df[muuttuja1], df[muuttuja2]))
    df1 = pd.crosstab(df[muuttuja1], df[muuttuja2], margins=True)
    df2 = pd.crosstab(df[muuttuja1], df[muuttuja2], margins=True, normalize='columns')

    # muuttujien tekstimuotoiset arvot
    if muuttuja1 in listat.keys():
        if len(listat[muuttuja1]) == len(df1.index) - 1:
            df1.index = listat[muuttuja1] + ['Yhteensä']
            df2.index = listat[muuttuja1]
        else:
            df1.rename(index={'All':'Yhteensä'}, inplace=True)
    else:
        df1.rename(index={'All':'Yhteensä'}, inplace=True) 
    if muuttuja2 in listat.keys():
        if len(listat[muuttuja2]) == len(df1.columns) - 1:
            df1.columns = listat[muuttuja2] + ['Yhteensä']
            df2.columns = listat[muuttuja2] + ['Yhteensä']
        else:
            df1.rename(columns={'All':'Yhteensä'}, inplace=True)
            df2.rename(columns={'All':'Yhteensä'}, inplace=True)
    else:
        df1.rename(columns={'All':'Yhteensä'}, inplace=True)
        df2.rename(columns={'All':'Yhteensä'}, inplace=True)

    n_arvot = ['n']
    for i in range(df1.shape[1]):
        n_arvot.append(df1.iloc[-1, i])

    return df2, n_arvot, khi_testi


if len(kategoriset) > 1:
    rivi = 3 # Excelin rivinumero, johon seuraava taulukko kirjoitetaan
    ws2 = workbook.add_worksheet('ristiintaulukoinnit')
    for muuttuja1 in kategoriset:
        for muuttuja2 in kategoriset:
            if muuttuja1 != muuttuja2:

                df2, n_arvot, khi_testi = risti(muuttuja1, muuttuja2)

                df2.to_excel(writer, sheet_name='ristiintaulukoinnit', startrow=rivi)
                for sarake, n in enumerate(n_arvot):
                    ws2.write(rivi+df2.shape[0]+1, sarake, n)
                ws2.write(rivi, 0, muuttuja1, title_format)
                ws2.write(rivi-1, 1, muuttuja2)
                for sarake, arvo in enumerate(df2.columns):
                    ws2.write(rivi, sarake + 1, arvo, header_format)
                for rivinumero, arvo in enumerate(df2.index):
                    ws2.write(rivi+rivinumero+1 , 0, arvo, index_format)
                for rivinumero in range(rivi+1, rivi+df2.shape[0]+1):
                    ws2.set_row(rivinumero, cell_format=percent_format)

                ws2.write(rivi, df2.shape[1]+2, f'khiin neliö = {khi_testi[0]:.3f}, p-arvo = {khi_testi[1]:.3f}, vapausasteet = {khi_testi[2]}')
                ws2.write(rivi+1, df2.shape[1]+2, f'Alle viiden suuruisia odotettuja frekvenssejä {((khi_testi[3]<5).sum()/khi_testi[3].size*100).round(2)} %')

                rivi = rivi+df2.shape[0] + 4

    ws2.write(0, 0, 'Kategoristen muuttujien ristiintaulukoinnit', bold_format)

Dikotomisten muuttujien yhteenvedot¶

Laskee dikotomiset-listasta löytyville muuttujille arvojen summan.
Oletuksena on että dikotomisella muuttujalla on vain arvoja 1 ja 0 (tai puuttuva arvo).
Prosentit lasketaan otoksen koosta (taulukossa näkyvä n-arvo).

In [10]:

def dikot(dikotomiset):

    '''Frekvenssit dikotomiset-listasta löytyville df:n muuttujille'''

    df1 = df[dikotomiset].sum().to_frame('f').sort_values('f', ascending=False)
    n = df.shape[0]
    df1['% vastaajista'] = df1['f']/n

    return df1, n

if dikotomiset:
    rivi = 2 # Excelin rivinumero, johon seuraava taulukko kirjoitetaan
    ws3 = workbook.add_worksheet('dikotomiset')

    df1, n = dikot(dikotomiset)

    df1.to_excel(writer, sheet_name='dikotomiset', startrow=rivi)
    ws3.write(rivi, 0, '', title_format)
    ws3.write(rivi+df1.shape[0]+1, 2, f'n = {n}', right_format)
    for sarake, arvo in enumerate(df1.columns.values):
        ws3.write(rivi, sarake+1, arvo, header_format)
    for rivinumero, arvo in enumerate(df1.index.values):
        ws3.write(rivi+rivinumero+1 , 0, arvo, index_format)

    ws3.set_column('C:C', 12, cell_format=percent_format)
    ws3.write(0, 0, 'Dikotomisten muuttujien yhteenvedot', bold_format)

Kategoristen ristiintaulukointi dikotomisten muuttujien kanssa¶

Laskee dikotomiset-listan muuttujien arvojen summat prosentteina kategoristen muuttujien määräämistä ryhmistä (ryhmien koot näkyvät n-arvoissa).
Oletuksena on että dikotomisella muuttujalla on vain arvoja 1 ja 0 (tai puuttuva arvo).

In [11]:

def risti_dikot(muuttuja, dikotomiset):

    '''Ristiintaulukointi df:n muuttujan muuttuja ja dikotomiset-listan mukaisten
    dikotomisten muuttujien välille'''

    df1 = df.groupby(muuttuja)[dikotomiset].sum()
    dfn = pd.crosstab(df[muuttuja], 'f')   # n-arvot

    # Prosenttien laskenta
    n_arvot = ['n']
    for i in range(df1.shape[0]):
        df1.iloc[i, :] = df1.iloc[i, :]/dfn.iloc[i, 0]
        n_arvot.append(dfn.iloc[i, 0])

    # kategorisen muuttujan tekstimutoiset arvot
    if muuttuja in listat.keys():
        if len(listat[muuttuja]) == len(df1.index):
            df1.index = listat[muuttuja]

    return df1.T, n_arvot


if dikotomiset:
    if kategoriset:
        rivi = 3
        ws4 = workbook.add_worksheet('kategoriset+dikotomiset')
        for muuttuja in kategoriset:

            df1, n_arvot = risti_dikot(muuttuja, dikotomiset)

            df1.to_excel(writer, sheet_name='kategoriset+dikotomiset', startrow=rivi)
            ws4.write(rivi-1, 1, muuttuja)
            for sarake, n in enumerate(n_arvot):
                ws4.write(rivi+df1.shape[0]+1, sarake, n)
            ws4.write(rivi, 0, '', title_format)
            for sarake, arvo in enumerate(df1.columns.values):
                ws4.write(rivi, sarake + 1, arvo, header_format)
            for rivinumero, arvo in enumerate(df1.index.values):
                ws4.write(rivi+rivinumero+1 , 0, arvo, index_format)
            for i in range(rivi+1, rivi+df1.shape[0]+1):
                ws4.set_row(i, cell_format=percent_format)

            rivi = rivi + df1.shape[0] + 4

        ws4.write(0, 0, 'Kategoristen muuttujien ristiintaulukoinnit dikotomisten kanssa', bold_format)

Tilastolliset tunnusluvut ja tunnusluvut kategoristen muuttujien määräämissä ryhmissä¶

Laskee tilastolliset tunnusluvut kvantit-listasta löytyville muuttujille.
Tunnusluvut lasketaan myös kategoriset-listan muuttujien määräämissä ryhmissä.
Jos kategorinen muuttuja määrittää täsmälleen kaksi ryhmää, niin keskiarvojen viereen lasketaan kahden riippumattoman otoksen t-testi testimuuttuja ja p-arvo.

In [12]:

tunnusluvut = ['Lukumäärä', 'Keskiarvo', 'Keskihajonta', 'Pienin', 'Alaneljännes',
              'Mediaani', 'Yläneljännes', 'Suurin']

def tunnu(kvantit):

    '''Laskee kvantit-listan sisältämien muuttujien tilastolliset tunnusluvut'''

    if len(kvantit) == 1:
        df1 = df[kvantit].describe().to_frame()
    else:
        df1 = df[kvantit].describe()
    df1.index = tunnusluvut

    return df1


def risti_tunnu(muuttuja1, muuttuja2):

    '''Muuttujan muuttuja2 tunnuslukuja kategorisen muuttujan muuttuja1 määräämissä ryhmissä
    Jos kategorinen muuttuja määrittää täsmälleen kaksi ryhmää, niin funktio
    palauttaa myös kahden riippumattoman otoksen t-testin tuloksen.'''

    df1 = df.groupby(muuttuja1)[muuttuja2].describe().T
    df1.index = tunnusluvut

    if muuttuja1 in listat.keys():
        if len(listat[muuttuja1]) == len(df1.columns):
            df1.columns = listat[muuttuja1]

    kategoriat = df[muuttuja1].dropna().unique()
    if len(kategoriat) == 2:
        ryhma1 = df[muuttuja2][df[muuttuja1]==kategoriat[0]]
        ryhma2 = df[muuttuja2][df[muuttuja1]==kategoriat[1]]
        testi = ttest_ind(ryhma1, ryhma2, equal_var=False, nan_policy='omit')
    else:
        testi=False

    return df1, testi


if kvantit:
    rivi = 2
    ws5 = workbook.add_worksheet('tunnusluvut')

    df1 = tunnu(kvantit)

    df1.to_excel(writer, sheet_name='tunnusluvut', startrow=rivi)
    ws5.write(rivi, 0, '', title_format)
    for sarake, arvo in enumerate(df1.columns.values):
        ws5.write(rivi, sarake+1, arvo, header_format)
    for rivinumero, arvo in enumerate(df1.index.values):
        ws5.write(rivi+rivinumero+1, 0, arvo, index_format)

    if kategoriset:
        rivi = rivi + 11
        for muuttuja1 in kategoriset:
            for muuttuja2 in kvantit:
                if muuttuja1 != muuttuja2:

                    df1, testi = risti_tunnu(muuttuja1, muuttuja2)

                    df1.to_excel(writer, sheet_name='tunnusluvut', startrow=rivi)
                    ws5.write(rivi-1, 1, muuttuja1)
                    ws5.write(rivi, 0, muuttuja2, title_format)
                    for sarake, arvo in enumerate(df1.columns.values):
                        ws5.write(rivi, sarake+1, arvo, header_format)
                    for rivinumero, arvo in enumerate(df1.index.values):
                        ws5.write(rivi+rivinumero+1 , 0, arvo, index_format)

                    if testi != False:
                        ws5.write(rivi+2, 4, f't = {testi[0]:.3f}, p-arvo = {testi[1]:.3f}')

                    rivi = rivi+11

    ws5.set_column(0, 0, 12)
    ws5.write(0, 0, 'Määrällisten muuttujien tunnusluvut ja tunnusluvut kategoristen muuttujien määräämissä ryhmissä', bold_format)

Korrelaatiokertoimet määrällisille muuttujille¶

Laskee korrelaatiokertoimet kvantit-listan muuttujille.
Lisäksi lasketaan korrelaatioketoimiin liittyvät p-arvot ja n-arvot.

In [13]:

def korre(kvantit):

    '''Laskee kvantit-listan sisältämien muuttujien väliset Pearsonin korrelaatiokertoimet sekä
    kertoimiin liittyvät p-arvot ja n-arvot.'''

    dfr = pd.DataFrame(index=df[kvantit].columns, columns=df[kvantit].columns).astype('float')
    dfp = pd.DataFrame(index=df[kvantit].columns, columns=df[kvantit].columns).astype('float')
    dfn = pd.DataFrame(index=df[kvantit].columns, columns=df[kvantit].columns)
    for muuttuja1 in df[kvantit]:
        for muuttuja2 in df[kvantit]:
            if muuttuja1 != muuttuja2:
                df_dropna = df.dropna(subset=[muuttuja1, muuttuja2])
                r, p = pearsonr(df_dropna[muuttuja1], df_dropna[muuttuja2])
                n = df_dropna.shape[0]
                dfr.loc[muuttuja1, muuttuja2] = r
                dfp.loc[muuttuja1, muuttuja2] = p
                dfn.loc[muuttuja1, muuttuja2] = n
    return dfr, dfp, dfn

if kvantit:
    if len(kvantit) > 1:
        rivi = 2
        ws6 = workbook.add_worksheet('korrelaatiot')

        dfr, dfp, dfn = korre(kvantit)

        dfr.to_excel(writer, sheet_name='korrelaatiot', startrow=rivi)
        ws6.write(rivi, 0, '', title_format)
        for sarake, arvo in enumerate(dfr.columns.values):
            ws6.write(rivi, sarake+1, arvo, header_format)
        for rivinumero, arvo in enumerate(dfr.index.values):
            ws6.write(rivi+rivinumero+1, 0, arvo, index_format)
        for rivinumero in range(rivi+1, rivi+dfr.shape[0]+1):
            ws6.set_row(rivinumero, cell_format=decimal3_format)

        rivi = rivi + dfr.shape[0] + 2

        dfp.to_excel(writer, sheet_name='korrelaatiot', startrow=rivi)
        ws6.write(rivi, 0, 'p-arvot', title_format)
        for sarake, arvo in enumerate(dfr.columns.values):
            ws6.write(rivi, sarake+1, arvo, header_format)
        for rivinumero, arvo in enumerate(dfr.index.values):
            ws6.write(rivi+rivinumero+1, 0, arvo, index_format)
        for rivinumero in range(rivi+1, rivi+dfp.shape[0]+1):
            ws6.set_row(rivinumero, cell_format=decimal3_format)

        rivi = rivi + dfr.shape[0] + 2

        dfn.to_excel(writer, sheet_name='korrelaatiot', startrow=rivi)
        ws6.write(rivi, 0, 'n-arvot', title_format)
        for sarake, arvo in enumerate(dfr.columns.values):
            ws6.write(rivi, sarake+1, arvo, header_format)
        for rivinumero, arvo in enumerate(dfr.index.values):
            ws6.write(rivi+rivinumero+1, 0, arvo, index_format)

        ws6.write(0, 0, 'Määrällisten muuttujien väliset korrelaatiokertoimet', bold_format)

Excel-tiedoston sulkeminen¶

Tärkeää: Viimeisen solun suoritus on tärkeää, jotta tuotoksena syntynyt Excel-tiedosto on myöhemmin avattavissa

Jos tulostiedoston avaaminen Exceliin ei onnistu, niin todennäköisesti jokin koodisolu on antanut virheilmoituksen ja writer.close()-komento on jäänut suorittamatta. Suorita tällöin komento writer.close() seuraavasta solusta. Selvitä sen jälkeen mistä virheilmoitus johtui.

In [14]:

writer.close()