Taas yksi tietokirjallisuuden helmi: Signaali ja kohina

Nyt on tullut aika palata blogin toiseen tukijalkaan, joka jo blogin otsikossa mainitaan. Siis kirjoihin. Olen nimittäin jo liiankin kauan jättänyt esittelemättä erään kirjan, jonka aivan varmasti entistä useamman pitäisi lukea. Olen lukenut kirjan varmasti jo yli vuosi sitten, mutta kirja on tässä vaiheessan pakko selata uudelleen ja esitellä nyt teille kaikille.
Nate Silverin kirja Signaali ja kohina.

Kirja on nimittäin Nate Silverin ”Signaali ja kohina. Miksi monet ennusteet epäonnistuvat, mutta jotkut eivät”. Alkuteos ”The Signal and the Noise. Why So Many Predictions Fail but Some Don't” ilmestyi vuonna 2012, ja suomentajana oli Kimmo Pietiläinen.

Tapahtumien ennustaminen on osoittautunut usein vaikeaksi. Yhdysvaltain presidentinvaalien tuloksen ennustaminen, vuoden 2008 rahoituskriisi, maanjäristysten tai myrskytuhojen ennustaminen tai urheiluvedonlyönti tarjoavat hyviä esimerkkejä siitä, miten arvostettujen asiantuntijoiden ennusteet ovat menneet vikaan.

Silver kertoo eräänä esimerkkinä professori Philip Tetlockin pitkäaikaisesta tutkimuksesta, jossa hän on systemaattisesti kysellyt asiantuntijoilta mielipiteitä tulevista tapahtumista. Kysymysten aiheina käytettiin suuria määriä erilaisia tapahtumia Persianlahden sodasta Japanin kiinteistökuplaan tai Quebecin eroon Kanadasta. Asiantuntijat onnistuivat ennustamisessa huonommin kuin alkeelliset tilastolliset menetelmät. 15 prosenttia asiantuntijoiden mahdottomiksi arvioimista asioista tapahtumista toteutui, ja neljäsosa heidän täysin varmoiksi uskomista tapahtumista jäi toteutumatta. Asiantuntijat ennustivat kaikkien alojen tapahtumat yhtä itsevarmasti päin honkia, osaamatta laskea todennäköisyyksiä.

Poliittiset ennusteet ovat vaikeita siksi, että ennustajalla voi olla oma ideologia, jonka läpi hän maailmaa katsoo. Silver esittelee Tetlockin käyttämän luokituksen ketun ja siilin ajattelutapoihin, ja selittää, miksi jälkimmäiset ovat parempia ennustajia. Lähtökohtana on, että kettu tietää monta pientä asiaa, mutta siili vain yhden suuren asian, mutta tarkempi analyysi kannattaa lukea kirjasta. Paljastettakon nyt kuitenkin, että ketun lähtökohta on ennustamiseen yleisesti ottaen parempi.

Kirjan nimi tulee radiosignaalista, jota voi olla vaikea erottaa satunnaisesta taustakohinasta. Kun talouden tai luonnon ilmiöitä koskevaa aineistoa tutkitaan, on hyvin helppo käsitellä aineistoa, kuin se kuvaisi pelkästään tutkittavaa ilmiötä. Jos tilastoaineistoon sovitetaan mahdollisimman hyvin sopiva kaava, niin hyvin usein se selittää aineistossa olevia satunnaiskohinasta johtuvia piirteitä. Tällöin itse ilmiö tulee huonommin kuvatuksi, ja malli ei ennusta tulevia tapahtumia läheskään niin hyvin, kuin tutkimusaineisto antaa olettaa.

Kirjassa käsitellään sitä, miksi sääennustaminen on nykyään oleellisesti helpompaa kuin maanjäristysten ennustaminen, ja miksi on mahdollista, että maanjäristysten ennustamisessa ei ikinä saavuteta merkittävää edistystä.

Yksi kirjan pääasioista on ennusteen epävarmuuden arvioinnin tärkeys. Erityisesti talouden ennusteiden suhteen on leimallista, että ennusteille ei anneta mitään virhemarginaaleja, ja ennusteet jäävät usein hyvin kauas todellisista tapahtumista. Ja kun virhemarginaaleja annetaan, ennusteet ovat liian itsevarmoja. Esimerkiksi tutkitussa aineistossa BKT osui 90 prosentin ennustevälin ulkopuolelle lähes puolessa tapauksista, vaikka niin pitäisi tapahtua vain 10 prosentissa tapauksia.

Nate Silver löytää viihdyttäviä ja syvällisiä pointteja siitä, miten tilastoja voi käyttää yhtä hyvin menestyksekkäästi ja tuhoisasti. Kirjassa kevyempää puolta edustaa urheilutulosten ennustaminen ja rahan ansaitseminen sillä tavoin. Myös pokerikuplan selittäminen on esimerkki kirjan kevyemmästä aineistosta. Kirjassa selitetään sopivan lyhyesti myös se, mikä Texas hold'em -tyyppisessä pokerissa on pelaamisen kannalta oleellista. Samalla selitetään, millä tavoin nettipokerilla pystyi kuplan aikana tienaamaan hyvinkin, ja miksi se on nykyään hyvin hankalaa. Itse en ole koskaan pelannut pokeria, ja silti Silverin esitys oli mielestäni hyvin selkeä ja antoi pelistä yllättävänkin valaisevan kuvan. Aihe on mielenkiintoinen, vaikka en koskaan aiokaan ryhtyä urheiluvedonlyöjäksi, enkä edes kokeilla nettipokeria.

* * * * *

Viime aikoina olen seurannut USA:n vaaliasetelmia. Eräs hiljattain löytämäni nettisivu on Nate Silverin http://fivethirtyeight.com/ , jossa kirjassakin esitettyjen periaatteiden mukaisesti vaaliennusteet muodostetaan ottamalla huomioon eri osavaltioiden kaikki vaaligallupit, arvioidaan niiden suhteellinen luotettavuus, ja yhdistetään näistä saatu informaatio eri osavaltioista saatavaan taloudelliseen ja väestörakenteelliseen informaatioon. Järjestelmään syötetään gallupien tiedot melko lailla reaaliajassa, ja systeemi siis perustuu tietokonemallinnukseen, eikä mihinkään ad hoc päättelyyn. Menetelmä on toiminut erittäin hyvin aiempien vaalien tuloksia (etukäteen) ennustettaessa, ja siinä vältetään oman poliittisen kannan vaikutus omien suosikkien ja inhokkien menestyksen arvioinnissa.

Varsinkin, jos olet kiinnostunut vaalien ohella myös baseballin tai amerikkalaisen jalkapallon tilastoista tai niitä koskevasta vedonlyönnistä, niin kyseinen nettisivu on oleva selvä suosikkisi. Silti pelkkä vaaliteemakin tekee sivun kiinnostavaksi. Muistelin jo sivun löytäessäni, että kyseinen nettisivu oli mainittu tässä kirjassa, mutta vasta tänään tajusin, että tosiaan se on mainittu, mutta tämän kirjan kirjoittaja on tuo samainen Nate Silver, joka tuota sivuakin pitää.

* * * * *

Mainittakoon nyt, että kirja löytyy verraten edullisesti ainakin Adlibriksen valikoimasta sekä suomeksi että alkukielellä. Kirjastoistakin teos löytynee.

Kommentit

Tässä vähän mainoksia ja muuta mielenkiintoista:

Tämän blogin suosituimmat tekstit

Jordan Ellenberg: Miten välttää virheet, matemaattisen ajattelun voima

"Lyhyt" selostus hahmottelemistani seuraavien vuosien sijoitus- säästö- ja rahankäyttöperiaatteista

Mitenkäs paljon siihen Suomen rikkaimpaan prosenttiin pääsemiseksi oikein tarviittiinkaan?