Case 1: Graduntekijälle tilanne on tuttu: tutkielman aloittaminen uudelleen tauon jälkeen on vaikeaa, kun aineistoon liittyvät asiat ovat päässeet unohtumaan.
► metadata eli dataa kuvaileva tieto auttaa ymmärtämään, millaista data on
Case 2: Datan jakaminen ryhmätyön tekijöiden kesken käy työlääksi, kun jokainen on tuottanut ja työstänyt dataa omin päin ilman yhteistä suunnitelmaa.
► tiedostoformaattien valinnalla voidaan helpottaa datan yhteiskäyttöä ja hyödyntämistä pitkällä aikavälillä
► kansiorakenteet ja tiedostojen nimeäminen vaikuttavat datan löydettävyyteen
Case 3: Olet tehnyt dataan muutoksia, jotka osoittautuvat virheellisiksi – vanhaan versioon ei ole kuitenkaan enää paluuta.
► versionhallinta tekee datan käsittelystä turvallista
Tiedostoformaatin valinta vaikuttaa sekä tutkimuksenaikaiseen työskentelyyn että datan käytettävyyteen pitkällä aikavälillä. Yksiselitteistä suositusta ei ole, mutta formaatin valinnassa on hyvä noudattaa muutamia perusperiaatteita:
Tiedostojen nimeäminen ja kansioiden järjestäminen vaikuttavat datan löytämiseen ja tietosisältöjen hahmottamiseen. Nimeämisessä on pari nyrkkisääntöä:
Versionhallinta on tärkeä osa datan järjestämistä, koska dataa käsiteltäessä siitä syntyy eri versioita ja joskus voi tulla tarve palata aiempiin versioihin. Versionhallinta voi olla automaattista, mikä on suositeltavaa, tai manuaalista.
Automaattisessa versionhallinnassa järjestelmä huolehtii versioiden luomisesta ja järjestämisestä
► kehittyneempään versionhallintaan on työkaluja, kuten Git (katso myös Gitin käyttöön liittyvä ohje).
Manuaalisessa versionhallinnassa käyttäjä luo ja hallinnoi versioita itse (huom. nimeämisen tärkeys)
► sopii pieniin datamääriin, joita datan tuottaja yksin hallinnoi.
Metadata (metatieto = "tietoa tiedosta") eli kuvailutieto tekee datasta ymmärrettävää, löydettävää ja käytettävää, sillä metadata kertoo:
Metatiedoista yksinkertaisin on datasetin nimi. Muut kuvailutiedot voivat liittyä datan:
Metadatan tuottamiseen voi tutustua lyhyen yhteenvedon (pdf) kautta. Lisää vinkkejä kattavaan datan kuvailuun ja dokumentointiin löytyy Tietoarkiston sivulta.