Samle Data

Å samle data for forskning kan være en utfordrende oppgave. Vi bruker data for å svare på forskningsspørsmål og teste våre hypoteser.

Når vi samler inn data så må vi forholde oss til noen grunnprinsipper.

Typer Data

Kvalitativ data

Kvalitativ data er data som gjerne uttrykkes med ord og gjennom tolkning og kategorisering. Generelt så er det noe som er observert men ikke kan måles med et numerisk resultat. Det kan være hvordan en person føler om ulike tema. Dette er vanskelig å måles numerisk, og må gjerne tolkes på en annen måte enn f eks en temperaturmåling.

Kvantitativ data

Kvantitativ data er data som kan måles og analyseres numerisk. Dette er gjerne observasjoner og målinger for et spesifikt formål.

I Air:Bit så måler vi kvantitativ data, vi måler temperatur, GPS, partikler i luften og fuktighet, sammen med et klokkeslett. Denne dataen gir oss faktiske observasjoner om verden, men skal vi svare på forskningsspørsmål så må dataen også analyseres.

Analyse av kvantitativ data skjer med datahåndtering, statistiske og numeriske metoder, samt visualisering.

Å samle data i forskning

Når man samler data i forskning, så er det for å bygge opp et empirisk grunnlag. Empiri kommer fra gresk og betyr noe som er opplevd eller erfart. Vi bruker begrepet i forskning om kunnskap som bygger på systematiske observasjoner og undersøkelser. Hvis vi ser på kunnskap og antakelser som er basert på personlige inntrykk og ikke-systematiske observasjoner, så kaller vi det gjerne anekdotisk bevis. Anekdotisk bevis er gjerne ikke sett på som vitenskapelig, med noen unntak, da mye av dette er basert på individuell erfaring, rykter og tilfeldighet, og er gjerne påvirket av den som observerer.

Når vi samler inn data, så er det viktig å tenke på alle faktorer som kan påvirke et resultat. Med Air:Bit så må vi være veldig nøye på at det vi faktisk måler, er det vi ønsker å måle, og at de målingene ikke påvirkes av noe annet.

img

https://xkcd.com/2652/

Her er et eksempel

Vi ønsker å se om våte veier gjør at det er mindre støv i luften.

Vi måler i 1 time kl 08:00 på en hverdag, og samler inn 
støvmålinger ved en trafikkert vei.

Så må vi vente en stund på at det skal regne, 
og endelig på en Lørdag kl 15:00 så regner det, 
så vi måler ved den samme plassen i 1 time.

Når vi nå ser på resultatene så ser vi at det 
er vesentlig mindre støv når det hadde regnet. 
Så vi konkluderer med at våt vei, gir mindre veistøv. 
Eller kan vi det?

Hvis vi tenker litt på når vi gjør målingene. 
Det kan være at det er ganske mange færre biler 
som kjører på veien kl 15:00 på en Lørdag sammenlignet med kl 08:00 på en hverdag. 
Så kanskje er det mindre støv rett og slett fordi det er færre biler? 
Eller kanskje er det flere biler fordi flere kjører når det er regn, 
i stedet for å for eksempel sykle?

Dette er bare et eksempel på noe som kan gi oss målinger som ikke nødvendigvis måler (kun) det vi ønsker å måle. Som forskere så må vi prøve å identifisere slike faktorer og prøve å motvirke deres effekt på dataen vår. I eksemplet over, så kan vi måle på akkurat samme tidspunkt hver gang, og måle flere ganger for å skaffe et større datagrunnlag. Vi kan prøve å finne ut av mengden trafikk på veien fra vegvesenet eller andre kilder. Poenget er at vi prøver å isolere så godt vi kan det vi ønsker å måle, og minimere påvirkningen av andre faktorer som vi ikke kan kontrollere.

Hypoteser

Filosofen Karl Popper argumenterte for at vi bør bygge hypoteser som falsifiseres av bevis. Det vil si at vi lager oss hypoteser som er mulig å motbevise, for så å lete etter data som motbeviser vår hypotese. Et klassisk eksempel på dette er:

Alle svaner er hvite.

Og i stedet for å lete etter alle hvite svaner, så prøver vi heller å lete etter svaner som ikke er hvite, og dermed motbeviser eller falsifiserer vår egen hypotese. Hvis vi gjennom systematisk observasjon ikke klarer å falsifisere vår egen hypotese, og vi kan med større sikkerhet si at alle svare er hvite. Hvis vi derimot observerer en svart svane, så er hypotesen vår falsifisert, og vi må finne en ny hypotese som bedre samsvarer med våre observasjoner.

Konklusjoner basert på data

I forsknings å jobber vi aldri med absolutte sannheter. Vi prøver gjerne å være så sikre som vi klarer å bli. Når en hypotese gjentatte ganger ikke lar seg falsifisere, så får den gjerne en høyere status, nemlig teori. I vitenskapen er teori så sikre som vi kan bli. Vi må være nøye med å skille på den dagligdagse bruken av ordet teori, hvor vi gjerne mener noe mer som en hypotese.

Eksempler på teorier vi har i dag er evolusjonsteori, atomteori, relativitetsteorien osv.

Det betyr ikke at en teori ikke kan endres eller falsifiseres, men vi har testet disse hypotesene i såpass høy grad at vi kan være veldig sikker på at de ikke vil forandre seg drastisk, og sannsynligvis aldri falsifiseres.