In [1]:
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns, pandas as pd
In [2]:
df=pd.read_csv('BoldvalaszKuldeni.csv')
In [3]:
df.columns
Out[3]:
Index(['Sorszám', 'Neme?', 'Életkora', 'Városban lakik?',
       'A legmagasabb iskolai végzettsége', 'Hányan élnek egy háztartásban?',
       'Hogy érzi, mennyire boldog? A jelenlegi élethelyzetében a létra melyik fokán áll?',
       'Hogyan érzékeli a szakmai pályafutását? Jelenleg melyik fokon áll karrier szempontjából?',
       'Hogyan érzékeli az egészségi állapotát? Jelenleg  melyik fokon áll egészségileg?',
       'Milyeneknek érzi a baráti kapcsolatait? Jelenleg  melyik fokon áll az emberi kapcsolatokban?',
       'Milyennek érzékeli a természeti környezetet, amely körülveszi? Jelenleg  melyik fokon áll a környezetével kapcsolatokban?',
       'Megfelelő kikapcsolódási és szórakozási lehetőségei vannak? Jelenleg  melyik fokon áll a kikapcsolódás és szórakozás terén?',
       'Vallásos-e ön?',
       'Hogyan látja a jövőt? A boldogságát tekintve melyik fokon fog állni 5 év múlva?',
       'Hogyan érzékeli az anyagi helyzetét? Jelenleg  melyik fokon áll anyagilag?',
       'Milyeneknek érzi a családi kapcsolatait? Jelenleg  melyik fokon áll a családi kapcsolatokban?',
       'Egy főre jutó nettó jövedelem a háztartásban', 'Munkaviszonya',
       'Végez hetente legalább 3-szor legkevesebb 30 perc testmozgást?',
       'Milyen lesz a természeti környezet, amely körülveszi? 5 év múlva melyik fokon fog állni a környezetével kapcsolatokban?',
       'Milyen a spiritualitással való kapcsolata? Jelenleg a létra melyik fokán áll a spiritualitás terén?',
       'Ha bajba kerül vagy problémája adódik, van-e valaki a családjában vagy a közvetlen környezetében, akinek a segítségére vagy támogatására számíthat?',
       'Melyik székely szék településén van állandó lakhelye? (Az, ahol valóban lakik, nem az, amit a személyazonossági igazolványa ír.)',
       'Szokott-e pénzzel vagy önkéntes munkával segíteni rászorulóknak, esetleg a rászorulókat támogató szervezeteknek? ',
       'Adományozott-e pénzt (bármilyen csekély összeget) az elmúlt hónapban?',
       'Leggyakrabban (nem a jelen pillanatban) milyen a kedélyállapota? Ha az előző szakaszban említett létrán 0 a mély depresszió és 10 a maximális eufória, akkor jelenleg a létra melyik fokán áll általános kedélyállapotát tekintve?',
       'Az ön közvetlen családjában (szülők, testvérek, házastárs, vagy gyermek) volt-e öngyilkossági kísérlet?',
       'Önnek, személy szerint volt-e öngyilkossági kísérlete?',
       'Úgy érzi, hogy van elég választási szabadsága, amikor fontos élethelyzetekben kell döntenie?',
       'Korruptnak tartja-e a kormányzatot?',
       'Korruptnak tartja-e a székelyföldi politikusokat?',
       'Korruptnak tartja-e a székelyföldi üzletembereket? A helyi gazdasági életben csak korrupcióval lehet érvényesülni?',
       'Unnamed: 32', 'Unnamed: 33'],
      dtype='object')
In [36]:
dc={'Sorszám':'ID', 
   'Neme?':'Nem', 
   'Életkora':'Életkor',
    'Városban lakik?':'Város',
   'A legmagasabb iskolai végzettsége':'Iskola', 
    'Hányan élnek egy háztartásban?':'Család mérete',
   'Hogy érzi, mennyire boldog? A jelenlegi élethelyzetében a létra melyik fokán áll?':'Boldogság',
   'Hogyan érzékeli a szakmai pályafutását? Jelenleg melyik fokon áll karrier szempontjából?':'Szakmai siker',
   'Hogyan érzékeli az egészségi állapotát? Jelenleg  melyik fokon áll egészségileg?':'Egészség',
   'Milyeneknek érzi a baráti kapcsolatait? Jelenleg  melyik fokon áll az emberi kapcsolatokban?':'Barátok',
   'Milyennek érzékeli a természeti környezetet, amely körülveszi? Jelenleg  melyik fokon áll a környezetével kapcsolatokban?':'Természet',
   'Megfelelő kikapcsolódási és szórakozási lehetőségei vannak? Jelenleg  melyik fokon áll a kikapcsolódás és szórakozás terén?':'Szórakozás',
   'Vallásos-e ön?':'Vallásosság',
   'Hogyan látja a jövőt? A boldogságát tekintve melyik fokon fog állni 5 év múlva?':'Boldogság 5 év múlva',
   'Hogyan érzékeli az anyagi helyzetét? Jelenleg  melyik fokon áll anyagilag?':'Anyagi helyzet',
   'Milyeneknek érzi a családi kapcsolatait? Jelenleg  melyik fokon áll a családi kapcsolatokban?':'Családi helyzet',
   'Egy főre jutó nettó jövedelem a háztartásban':'Jövedelem', 
    'Munkaviszonya':'Munkaviszony',
   'Végez hetente legalább 3-szor legkevesebb 30 perc testmozgást?':'Testmozgás',
   'Milyen lesz a természeti környezet, amely körülveszi? 5 év múlva melyik fokon fog állni a környezetével kapcsolatokban?':'Természet 5 év múlva',
   'Milyen a spiritualitással való kapcsolata? Jelenleg a létra melyik fokán áll a spiritualitás terén?':'Spiritualitás',
   'Ha bajba kerül vagy problémája adódik, van-e valaki a családjában vagy a közvetlen környezetében, akinek a segítségére vagy támogatására számíthat?':'Segítség',
   'Melyik székely szék településén van állandó lakhelye? (Az, ahol valóban lakik, nem az, amit a személyazonossági igazolványa ír.)':'Szék',
   'Szokott-e pénzzel vagy önkéntes munkával segíteni rászorulóknak, esetleg a rászorulókat támogató szervezeteknek? ':'Rászorulók',
   'Adományozott-e pénzt (bármilyen csekély összeget) az elmúlt hónapban?':'Adomány',
   'Leggyakrabban (nem a jelen pillanatban) milyen a kedélyállapota? Ha az előző szakaszban említett létrán 0 a mély depresszió és 10 a maximális eufória, akkor jelenleg a létra melyik fokán áll általános kedélyállapotát tekintve?':'Kedély',
   'Az ön közvetlen családjában (szülők, testvérek, házastárs, vagy gyermek) volt-e öngyilkossági kísérlet?':'Öngyilkosság családban',
   'Önnek, személy szerint volt-e öngyilkossági kísérlete?':'Öngyilkosság',
   'Úgy érzi, hogy van elég választási szabadsága, amikor fontos élethelyzetekben kell döntenie?':'Választási szabadság',
   'Korruptnak tartja-e a kormányzatot?':'Korrupt kormányzat',
   'Korruptnak tartja-e a székelyföldi politikusokat?':'Korrupt politikusok',
   'Korruptnak tartja-e a székelyföldi üzletembereket? A helyi gazdasági életben csak korrupcióval lehet érvényesülni?':'Korrupt üzletemberek'}
In [40]:
df=df[list(df.columns)[:-2]]
In [42]:
df.columns=[dc[i] for i in df.columns]
In [244]:
#0: igen nem, 1: categorical, 2: 1-10, jovo: 5 ev mulva
cats={'ID':1, 
    'Nem':0, 
    'Életkor':1, 
    'Város':0, 
    'Iskola':1, 
    'Család mérete':1, 
    'Boldogság':2,
    'Szakmai siker':2, 
    'Egészség':2, 
    'Barátok':2, 
    'Természet':2, 
    'Szórakozás':2,
    'Vallásosság':1, 
    'Boldogság 5 év múlva':3, 
    'Anyagi helyzet':2,
    'Családi helyzet':2, 
    'Jövedelem':1, 
    'Munkaviszony':1, 
    'Testmozgás':0,
    'Természet 5 év múlva':3, 
    'Spiritualitás':2, 
    'Segítség':0, 
    'Szék':1,
    'Rászorulók':1, 
    'Adomány':0, 
    'Kedély':2, 
    'Öngyilkosság családban':0,
    'Öngyilkosság':0, 
    'Választási szabadság':0, 
    'Korrupt kormányzat':0,
    'Korrupt politikusok':0, 
    'Korrupt üzletemberek':0}
In [45]:
sns.factorplot(data=df, 
               x='Boldogság',
               y='Szakmai siker',  
       )
Out[45]:
<seaborn.axisgrid.FacetGrid at 0x20f86807550>
In [48]:
sns.factorplot(data=df, 
               x='Boldogság',
               y='Szakmai siker',  
               col='Nem'
              )
Out[48]:
<seaborn.axisgrid.FacetGrid at 0x20f8614f550>
In [178]:
df['Szék'].unique()
Out[178]:
array(['Udvarhelyszék', 'Csíkszék', 'Marosszék', 'Sepsiszék',
       'Gyergyószék', 'Bardóc-Miklósvárszék', 'Orbaiszék', 'Kézdiszék'], dtype=object)
In [182]:
df=df.replace('Bardóc-Miklósvárszék','Háromszék')\
   .replace('Orbaiszék','Háromszék')\
   .replace('Kézdiszék','Háromszék')\
   .replace('Sepsiszék','Háromszék')
In [183]:
sns.factorplot(data=df, 
              ax = sns.violinplot(x="day", y="total_bill", data=tips) x='Boldogság',
               y='Szakmai siker',  
               col='Szék'
              )
Out[183]:
<seaborn.axisgrid.FacetGrid at 0x20f9f131048>
In [184]:
g = sns.FacetGrid(df, col='Szék') 
g.map(sns.distplot, 'Boldogság',bins=11)
Out[184]:
<seaborn.axisgrid.FacetGrid at 0x20f8e843b38>
In [55]:
g = sns.FacetGrid(df, col='Jövedelem') 
g.map(sns.distplot, 'Boldogság')
Out[55]:
<seaborn.axisgrid.FacetGrid at 0x20f87b98048>
In [56]:
g = sns.FacetGrid(df, col='Jövedelem') 
g.map(plt.scatter,'Szakmai siker', 'Boldogság')
Out[56]:
<seaborn.axisgrid.FacetGrid at 0x20f8a1a02e8>
In [57]:
g = sns.FacetGrid(df, col='Jövedelem') 
g.map(sns.regplot,'Szakmai siker', 'Boldogság')
Out[57]:
<seaborn.axisgrid.FacetGrid at 0x20f8a176b38>
In [58]:
g = sns.FacetGrid(df, col='Jövedelem',row='Nem') 
g.map(sns.kdeplot,'Szakmai siker', 'Boldogság')
Out[58]:
<seaborn.axisgrid.FacetGrid at 0x20f89579860>
In [62]:
g = sns.FacetGrid(df, col='Jövedelem',row='Nem') 
g.map(sns.kdeplot,'Anyagi helyzet', 'Boldogság')
Out[62]:
<seaborn.axisgrid.FacetGrid at 0x20f8cfb3080>
In [32]:
sns.jointplot('Hogyan érzékeli a szakmai pályafutását? Jelenleg melyik fokon áll karrier szempontjából?', 'Hogy érzi, mennyire boldog? A jelenlegi élethelyzetében a létra melyik fokán áll?', data=df, kind='kde')
Out[32]:
<seaborn.axisgrid.JointGrid at 0x20f84025a58>
In [33]:
df.columns
Out[33]:
Index(['Sorszám', 'Neme?', 'Életkora', 'Városban lakik?',
       'A legmagasabb iskolai végzettsége', 'Hányan élnek egy háztartásban?',
       'Hogy érzi, mennyire boldog? A jelenlegi élethelyzetében a létra melyik fokán áll?',
       'Hogyan érzékeli a szakmai pályafutását? Jelenleg melyik fokon áll karrier szempontjából?',
       'Hogyan érzékeli az egészségi állapotát? Jelenleg  melyik fokon áll egészségileg?',
       'Milyeneknek érzi a baráti kapcsolatait? Jelenleg  melyik fokon áll az emberi kapcsolatokban?',
       'Milyennek érzékeli a természeti környezetet, amely körülveszi? Jelenleg  melyik fokon áll a környezetével kapcsolatokban?',
       'Megfelelő kikapcsolódási és szórakozási lehetőségei vannak? Jelenleg  melyik fokon áll a kikapcsolódás és szórakozás terén?',
       'Vallásos-e ön?',
       'Hogyan látja a jövőt? A boldogságát tekintve melyik fokon fog állni 5 év múlva?',
       'Hogyan érzékeli az anyagi helyzetét? Jelenleg  melyik fokon áll anyagilag?',
       'Milyeneknek érzi a családi kapcsolatait? Jelenleg  melyik fokon áll a családi kapcsolatokban?',
       'Egy főre jutó nettó jövedelem a háztartásban', 'Munkaviszonya',
       'Végez hetente legalább 3-szor legkevesebb 30 perc testmozgást?',
       'Milyen lesz a természeti környezet, amely körülveszi? 5 év múlva melyik fokon fog állni a környezetével kapcsolatokban?',
       'Milyen a spiritualitással való kapcsolata? Jelenleg a létra melyik fokán áll a spiritualitás terén?',
       'Ha bajba kerül vagy problémája adódik, van-e valaki a családjában vagy a közvetlen környezetében, akinek a segítségére vagy támogatására számíthat?',
       'Melyik székely szék településén van állandó lakhelye? (Az, ahol valóban lakik, nem az, amit a személyazonossági igazolványa ír.)',
       'Szokott-e pénzzel vagy önkéntes munkával segíteni rászorulóknak, esetleg a rászorulókat támogató szervezeteknek? ',
       'Adományozott-e pénzt (bármilyen csekély összeget) az elmúlt hónapban?',
       'Leggyakrabban (nem a jelen pillanatban) milyen a kedélyállapota? Ha az előző szakaszban említett létrán 0 a mély depresszió és 10 a maximális eufória, akkor jelenleg a létra melyik fokán áll általános kedélyállapotát tekintve?',
       'Az ön közvetlen családjában (szülők, testvérek, házastárs, vagy gyermek) volt-e öngyilkossági kísérlet?',
       'Önnek, személy szerint volt-e öngyilkossági kísérlete?',
       'Úgy érzi, hogy van elég választási szabadsága, amikor fontos élethelyzetekben kell döntenie?',
       'Korruptnak tartja-e a kormányzatot?',
       'Korruptnak tartja-e a székelyföldi politikusokat?',
       'Korruptnak tartja-e a székelyföldi üzletembereket? A helyi gazdasági életben csak korrupcióval lehet érvényesülni?',
       'Unnamed: 32', 'Unnamed: 33'],
      dtype='object')
In [35]:
sns.jointplot('Milyen a spiritualitással való kapcsolata? Jelenleg a létra melyik fokán áll a spiritualitás terén?', 'Hogy érzi, mennyire boldog? A jelenlegi élethelyzetében a létra melyik fokán áll?', data=df, kind='kde')
Out[35]:
<seaborn.axisgrid.JointGrid at 0x20f862069b0>
In [245]:
c=[]
for j in range(4):
    c.append([i for i in df.columns if cats[i]==j])
In [246]:
c[2]
Out[246]:
['Boldogság',
 'Szakmai siker',
 'Egészség',
 'Barátok',
 'Természet',
 'Szórakozás',
 'Anyagi helyzet',
 'Családi helyzet',
 'Spiritualitás',
 'Kedély']
In [161]:
q1=['Boldogság',
 'Szakmai siker',
 'Egészség',
 'Természet']
In [162]:
q2=['Boldogság',
 'Barátok',
 'Anyagi helyzet',
 'Családi helyzet']
In [163]:
q3=['Boldogság',
 'Szórakozás',
 'Spiritualitás',
 'Kedély']
In [166]:
lg='Jövedelem'
g = sns.PairGrid(df[q1+[lg]],hue=lg)
g.map_diag(sns.kdeplot, shade=True, bw=0.6)
g.map_lower(sns.kdeplot, cmap='Blues', n_levels=8, shade=True, shade_lowest=False, bw=0.6);
g.map_upper(sns.regplot);
g.set(ylim=(-0.5,10.5))
g.set(xlim=(-0.5,10.5))
g = g.add_legend()
In [175]:
lg='Nem'
al=0.7
g = sns.PairGrid(df[q1+[lg]],hue=lg)
g.map_diag(sns.kdeplot, shade=True, bw=0.6)
g.map_lower(sns.kdeplot, cmap='Blues', n_levels=8, shade=True, shade_lowest=False, bw=0.6,alpha=al);
g.map_upper(sns.regplot,x_jitter=.4,y_jitter=.4);
g.set(ylim=(-0.5,10.5))
g.set(xlim=(-0.5,10.5))
g = g.add_legend()