Tasa-arvoinen avioliittolaki käsitellään eduskunnassa 28.11.2014. Sivistysvaliokunta asettui niukasti vastustamaan uudistusta. Mielenkiintoiseksi asian tekee sen, että vastustajien ja kannattajien välillä menee selkeä ikäraja, kuten ao. HS:n uutisgrafiikasta nähdään (HS 21.11.2014).
Helsingin sanomat tutki myös kansanedustajien kantoja perustuen “useista eri lähteistä ja haastatteluista saatuihin tietoihin kansanedustajien kannoista, ja muutamassa tapauksessa kansanedustajien omiin ilmoituksiin” (HS 21.11.2014).
Onko näiden kansanedustajien kantojen ja heidän ikänsä välillä yhtä vahva korrelaatio kuin sivistysvaliokunnassa?
Tarvittavat tiedot saa HS:n artikkelista ja eduskunnan sivuilta ja niistä saa kätevästi plotattua jakaumia ja histogrammeja R:n ggplot2-kirjastolla. Alla on kuva viiden vuoden bineihin jaetuista histogrammeista.
Alla vielä toinen kuva jossa on estimoitu kunkin mielipiteen osuus kaikista iän mukaan.
Vaikka ero kannassa iän mukaan ei olekaan enää yhtä selvä kuin sivistysvaliokunnassa, näyttää siltä, että vanhemmat todennäköisemmin äänestävät ei, nuoremmat jaa ja epävarmat ovat iältään siltä väliltä. Huomattavaa on, että vanhin kansanedustaja Jörn Donner puoltaa ehdotusta, kun taas nuorin edustaja Miko Niikko vastustaa sitä, mikä näkyy myös kuvaajissa selvästi.
Iltasanomat teetti aiheesta kyselyn kansanedustajille, tätä olisi mielenkiintoista verrata HS:n arvioon (IS 24.11.2014).
Tarkempi kuvaus työprosessista
Kansanedustajien kannat sai suoraan copy-pasteamalla HS:n artikkelista. Sen sijaan heidän syntymävuotensa vaati enemmän työtä, koska mihinkään ei ole koottu kaikkien tämänhetkisten kansanedustajien tarkkoja syntymävuosia. Helposti on saatavissa syntymäaika vuosikymmenittäin, joka saattaisi riittää, mutta päätin kuitenkin hakea jokaisen kansanedustajan syntymävuoden erikseen eduskunnan kansanedustajalistauksesta, jossa on linkki kunkin kansanedustajan tietosivulle, josta saa kansanedustajan syntymäajan.
Koska vanhat konstit ovat monesti parempia kuin pussillinen uusia, päätin tietojen haun lynxillä ja käsittelyn pythonilla, joka subprocess-kirjastoa käyttäen kutsuu lynxiä. Käsittelyn jälkeen minulla oli csv-tiedosto, jossa on kunkin kansanedustajan nimi, syntymävuosi ja oletettu kanta tasa-arvoiseen avioliittolakiin. Ääkkösten kanssa joutui vähän kikkailemaan, koska sivuilta suoraan hakiessa ja toisaalta HS:n artikkelista copy-pastetessa ääkköset joutuivat eri formaattiin. En kuitenkaan tarvinnut kansanedustajien nimiä sinänsä, joten hoidin asian yksinkertaisella replace-rimpsulla.
Plottausvaihtoehtojen tarkasteluun käytin kattavaa Making histograms and density plots with ggplot2 -blogikirjoitusta.
Kirjoittaja Jaakko Särelä on Reaktor Innovations Oy:n Senior Data Scientist ja harrastaa vapaa-aikanaan yhteiskunnallista vaikuttamista ja kaupunkiaktivismia.
Päivitys 24.11.2014: Vaihdettu paremmat kuvat ja data csv:nä. Lisätty linkki Iltasanomien uutiseen aiheesta.