Joukkoistamalla parempaa dataa

Joukkoistamalla
laatua avoimeen
ja isoon dataan.

Missä pyörätie,
pysäkki? Kuka vastaa
tietomallista?

Yli seitsemänkymmentä avoimuudesta ja joukkoistamisesta kiinnostunutta aktiivia kokoontui Pasilaan Ravintola Vaunun auditorioon 26.3.2014 Sytykkeen, OKF Finlandin ja ProGISin Joukkoistetut paikkatietoaineistot -seminaariin. Liikennevirasto tarjosi tilat ja Karttakeskus kahvit, sämpylät ja hedelmäpalat. Paikalle saapuneiden lisäksi etäosallistujat eri puolilta Suomea pääsivät mukaan seminaariin ja Sytykkeen kevätkokoukseen Ambientian ja OKF Finlandin vuosikokoukseen Otavan Opiston tarjoamalla Adobe Connect -yhteydellä.
Tilaisuus alkoi järjestäjien edustajien puheenvuoroilla. Data on murroksessa ja ison datan merkitys kasvaa. Mitä dataa voisimme jakaa? Miten datalla voidaan synnyttää uutta dataa ja tietämystä? Olemme tekemisissä isojen asioiden kanssa; avoimet toimintatavat ja avoin tieto mahdollistavat kehityksen.
Unelma avointen paikkatietoaineistojen yhteistuotantomallista
Tilaisuuden juontanut Antti Poikola kertoi seminaarin taustasta. Liikennevirasto otti yhteyttä pyöräilijöihin saadakseen entistä tarkempaa tietoa pyöräreiteistä. Avoimilla toimintatavoilla ja eri toimijoiden yhteistyöllä syntyy entistä parempaa dataa, kun kansalaiset täydentävät viranomaisten tuottamaa dataa vihjetietokantaan. Sitä validoimalla data paranee syklisesti.
Digiroad
Markus Melander Liikennevirastosta kertoi Digiroadista ja joukkoistamisen mahdollisuuksista aineiston rikastamisessa. Tavoitteena on toisaalta lisätä pyöräilyä ja jalankulkua nykyisestä parikymmentä prosenttia, toisaalta varmistaa kaikkien liikennemuotojen sujuvuus. Avoimesta datasta saatu palaute ja joukkoistaminen ovat lähellä toisiaan. Palautteena saatu tieto käsitellään vihjetietona.
Tiedonsiirto eri verkoissa on edelleen haasteellista. OpenStreetMapissa pyritään tuntemaan jokainen risteysväli yksilöivällä tunnisteella. Kehittämistä joukkoistetaan pyöräilyseuran kanssa vaiheittain.
Keskustelussa kysyttiin, miten valtakunnallisten vaellusreittien tietoja päivitetään. Digiroad voi ottaa vastaan tietoa, jos joku sen tuottaa, mutta tiedon lisäksi pitäisi päivittää sen ominaisuudetkin. Fokus on ylläpidon prosessissa. johon voidaan ottaa mallia tiedon tuottamisesta Wikipediaan.
Avoin data ja kartat
Pekka Sarkola totesi, että OpenStreetMapissa kartoitetaan dataa ympäri maailmaa jatkuvasti. Pitäisikö viranomaisen kerätä tietoa itse? Miten eri viranomaiset voisivat työskennellä yhdessä? Esimerkiksi New Yorkin kaupunki tekee yhteistyötä OpenStreetMapin kanssa.
Suomessa Maanmittauslaitoksen maastotietokanta vapautettiin vappuna pari vuotta sitten. Meni kuitenkin pari vuotta ennen kuin kyseistä dataa saatiin OpenStreetMapiin.
Pekka Sarkola teetätti Aalto-yliopiston teekkareilla sovelluksen, jolla kerätään tietoa rakennusten sisäänkäynneistä. GitHubiin viety sovellus toimii HSL-navigaattorissa -ja lennossa Puolassakin. Se tarjoaa myös virheraportoinnin.
Bisnesideoita on ilmassa valtavasti. Esimerkiksi Android-laitteiden käyttäjät ovat jo – ehkä tietämättään – osallistuneet OpenCellId-projektiin.
Keskustelussa kysyttiin, miten pääsee mukaan keräämään dataa. Pekka Sarkola totesi, että tietomalli ei ole helppo; tarvitaan osaamista.
Kunnat Digiroad-tiedon tuottajana – joukkoistamisesta apua tuskaan
Outi Hermansin mukaan kaikkeen tietoon pitäisi liittää sijainti, jolloin kuvistakin saisi älykästä paikkatietodataa. Ilmasta havainnoinnissa on omat ongelmansa. Helsingin kaupungilla on valtavasti tietoa, mutta sitä jaetaan verkkosivuilla pdf-muodossa.
Datan avoimuus on parasta, mitä vuosiin on tapahtunut. Viranomainen voi vain avata tiedon ja katsoa, mitä sille joukkoistamalla tapahtuu. Ongelmat ovat kuitenkin massiivisia. Kukaan ei halua omistaa tietoa, koska se tietää vastuuta. Onko vastuu tiedosta kunnnalla vai valtiolla? Alueet ja Digiroad-reitit eivät ole täydellisesti yhteensopivia. Entä kuka vastaa joukkoistetun tiedon laadusta? Virallinen tieto on luotettavaa, mutta millä prosessilla vihjetiedot saadaan luotettaviksi.
Tietomallista sopiminen on tärkeää. Pyörätiet, jotka ovat kiinni ajoradoissa, voisivat olla omia kohteita eivätkä ajoratojen ominaisuuksia. Historia selittää nykyistä mallinnusta, mutta emme enää elä siinä maailmassa.
Eteenpäin päästään pienin askelin.

  • Lisätään tietoisuutta avoimesta aineistosta, jotta saadaan palautetta datan parantamiseksi.
  • Avataan dataa joukkoistamalla parannettavaksi.
  • Kehitetään yhdessä datan uusia käyttömahdollisuuksia kaupungin kehittämiseksi.

Jo kymmenen vuotta sitten puhuttiin tietoyhteiskunnasta ja infoähkystä. Konkretisoituuko se nyt?
Case: Joukkoliikenteen infrastruktuurin keruu
Tero Piirainen ja Mikko Rinne kutsuivat mukaan ensi lokakuun liikenneaiheiseen Dev4Transport-kehittäjätapahtumaan.
Datan kerääminen virkamiestyönä on kallista, joten joukkoistamiseen pitäisi löytää menetelmä kerätä tietoa laadukkaasti ja kustannustehokkaasti. Nyt formaatit ja ontologiat ovat levällään. Järkevämmällä toiminnalla voitaisiin tarjota paljon uusia liiketoimintamahdollisuuksia. Tietojen julkaisemiseenhan on olemassa kansallisia ja kansainvälisiä tapoja.
Liikenteestä on laadittu XML-speksit, mutta datat liitetään käsityönä. Jotkin ilmiselvät virheet voitaisiin tarkistaa automaattisesti. Esimerkiksi tiellä voi olla kolme kaistaa, mutta data ei voi liittyä kolmeen eri tiehen.
Joukkkoliikenteessä Googlella menee lujaa. OpenStreetMap ja vastaavat joustavat ja niitä käytetään maailmanlaajuisesti.
Kun nykyisin kaupungeilla on omia speksejä, niin on vaikea kehittää sovelluksia, jotka toimisivat edes kaikissa Suomen kaupungeissa. Pysäkki on tietyssä paikassa, mutta pyörätie voi olla tässä tai hiukan vieressä – tai olla epävirallinen. Kun pysäkkitieto on kunnossa, sitä voidaan soveltaa muuhunkin. Bussit voivat pysähtyä muuallakin kuin pysäkeillä ja liikennevaloissa.
Verkkovälitteinen yhteistyö GitHubissa
Petri Kola kertoi 2010-luvun verkkovälitteisestä yhteistyöstä GitHubissa. Ihmiset osallistuvat, kun saavat mahdollisimman paljon hyötyä mahdollisimman vähällä vaivalla. Kitkaa vähentää avoin data, saatavuus ja muokattavuus sekä monikäyttöiset palaset, joihin voi luottaa.
Ohjelmoijatkin ovat ihmisiä, eivät he huvikseen hakkaa päätään dataan. Käytettävyyttä kaipaavat paitsi loppukäyttäjät myös tekniset käyttäjät.
GitHubissa syntyy hajautettu, linux-tyyppinen flow, kun koteloituja työsuorituksia yhdistellään. Digituotosten asteittaisen parantamisen mekanismissa yhdistämispyyntö, pull request, on kätevä: ”Ota tästä, jos kelpaa.” Luottamus kertyy kuten somessa; käyttäjä voi arvioida, kuinka meritoitunut pull requestin tekijä on.
Data.okfn.org-palvelussa csv-formaattia ollaan uudelleen herättämässä henkiin, vaikka piste- ja pilkkuongelma haittaa edelleen. Data-aineistot kannattaa julkaista riittävän pienissä paloissa joukkoistamiseen. Esityksensä päätteeksi Petri Kola demosi datapakettien muokkaamista ja yhdistämispyyntöä.
Automaatiota ja sosiaalista helpotusta
Ilkka Rinne Spatineosta toivoi paikkatietojen rajapintojen laadun parantamista, yhteiskäyttöisiä tietomalleja, yksinkertaistamista ja rikastamista sekä yhteistä käsitteistöä ja tunnuksia.
Datan yhteisöllisessä keräämisessä voisi valtuuttaa joukkoistamisen. Kiinnostuneet sidosryhmät, kuten Helsingin pyöräilijät, voisivat helposti käsitellä ja arvioida aineistoja. Näin ”meitsitietoa” (MyData) voisi muuttaa viralliseksi tiedoksi.
Yksityisyys ja avoimuus nostavat tietosuojakysymykset nopeasti esiin. Paikkaan sidotut kontekstuaaliset palvelut esim. juna-asemalla voivat antaa täsmäpalvelua. Kuitenkin ihmisen pitäisi itse saada päättää, kenelle hän antaa tiedon sijainnistaan.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *