Interne og eksterne data

Så var vi endelig fremme ved hvor vi faktisk finner dataene. Det korte svaret er selvsagt overalt.
Mer hensiktsmessig er det kanskje da å snakke om hva slags tilgang og eierskap du har til ulike data, samt rent praktisk hvordan du kan gå frem for å tilgjengeliggjøre dem og ta dem i bruk. For å starte med det siste først, må vi aller først bli kjent med begrepet «datasiloer».

Datasiloer

Den gode nyheten er at alle virksomheter har massevis av data. Den dårlige nyheten er at de mest sannsynligvis er spredt for alle vinder.
Kanskje finnes noe du trenger i et e-postvedlegg, mens andre data har sitt hjem i ulike skyløsninger eller en lagerhall full av papirkvitteringer som ingen har rukket å digitisere ennå. Eller de er fordelt på ulike applikasjoner, på lokale servere, i nettskyen, i e-postvedlegg, på skrivebordet ditt og hos leverandører.
Når data er separert på denne måten sier vi at de ligger i «siloer». Så lenge dataene ligger i siloer, er det veldig vanskelig å ta dem i bruk eller sammenligne dem på kryss og tvers. Vi må altså løfte dem ut av siloene for å skape mening og verdi av dem.

Eksempel

Sykkelutleien

En bedrift som driver med utleie av elsykler sitter på data om hvem som leier sykler, til hvilke tidspunkt, med hvor lang varighet og til hvilke priser.
I tillegg kan de ha interesse av tredjeparts, eksterne data om vær, trafikk, kollektivtrafikk, arbeidstider, sport- og kulturbegivenheter, hvor og hvordan folk beveger seg, og så videre.
Gjennom å samle flere av disse dataene, kan de oppdage sammenhenger og innsikter som hjelper dem med å jobbe mer effektivt og tjene mer penger.
Da må de først samle og tilgjengeliggjøre alle de relevante dataene på ett og samme sted – i dette tilfellet kanskje en skybasert programvare – i et format og en struktur som gjør at dataene kan brukes sammen. Hvor og hvordan dataene kan struktureres og lagres, vil du lære mer om videre i Datareisen.
Når dataene er løftet ut av siloene sine og samlet på ett sted, har bedriften nå mye bedre forutsetninger for å jobbe målrettet med eksempelvis hvor og når de setter ut sykler – fordi de kan følge bruksmønstre og etterspørsel i dataene. Og kanskje de også vil oppdage muligheter for nye forretningsmuligheter og strategiske samarbeid?

Innsikt

Hva innebærer det å tilgjengeliggjøre data?

Å tilgjengeliggjøre data kan i visse tilfeller være så enkelt som å kartlegge hvor de finnes, og sørge for at de som trenger dem har riktige innloggingsdetaljer, og så videre. Men prosessen med å løfte dataene ut av siloene er også viktig. Det kan bety å rett og slett laste ned data fra de ulike kildene og samle dem på samme sted manuelt, for eksempel i et Excel-ark. Dette kan være greit hvis man leter etter en konkret innsikt, og skal lage for eksempel en rapport.
Når vi snakker om å jobbe datadrevet, vil imidlertid ikke en slik manuell jobb være hensiktsmessig. I stedet vil dere sette opp en form for automatisering, for eksempel ved å utnytte API-er, for å samle alle relevante data på ett sted. Hva slags sted dette kan være – som databaser og dataplattformer – vil du lære mer om i neste kapittel. Der vil du også se at dataene veldig ofte må bearbeides og ryddes opp i før de er sammenlignbare og brukbare.

Hvilken tilgang har vi på dataene?

For en bedrift eller organisasjon vil det finnes relevante data både i og utenfor virksomheten – altså interne og eksterne data. Denne distinksjonen er viktig fordi det handler om eierskapet til dataene, noe som påvirker både tilgangen og bruksområdene.
En nyttig måte å sortere datakildene våre på, er etter hvilket nivå av tilgang vi har. Er du bevisst på dette, er det også enklere å vite hva du kan gjøre med dataene og hvordan de kan bearbeides i senere faser.
Interne data kan eksempelvis være samlet inn av eller delt med kunder, partnere eller leverandører og ikke være deres alene, eller bruken av dem kan være underlagt lover og regler, for eksempel med tanke på personvern.
Med det i mente, la oss nå se på hvor du kan få tak i data og hvilken tilgang du har på dem.

Interne data

Vi kan skille mellom to typer interne data:
  • Egne data: Data som virksomheten selv har samlet inn og/eller kontrollerer, for eksempel om regnskap, kunder, logistikk, drift, utstyr, etc.
  • Delte data: Data dere helt eller delvis kontrollerer og har tilgang på, men som også andre har eierskap til eller tilgang på. Dere kan ikke nødvendigvis endre eller bruke dataene fritt.
Alle virksomheter har interne data, men volumet, kvaliteten og tilgjengeligheten varierer enormt. Her er noen av (men langt fra alle) kategoriene:
  • Kunder: Navn, adresser, e-post, demografi, sted, organisasjonsnummer, kundeserviceinteraksjoner, historikk, potensielle kunder
  • Nettside: Brukeradferd, henvisninger, frafall før kjøp, søkemotoroptimalisering
  • Sosiale medier: Målgrupper, publikum, annonser, resultater, engasjement, pengebruk
  • Forsyningskjeder: Leverandørdata, pris, beholdning, logistikk, transport, bestillinger, potensielle leverandører
  • Marked / bransje: Konkurrenter, priser, trender, søketrender, undersøkelser, relaterte produkter og tjenester, forretningsmodeller
  • Drift: Sensorer, kontrollsystemer, utstyrsdata, vedlikeholdsdata
  • Regnskap og transaksjoner: Kjøp, salg, faste utgifter, faste inntekter, andre utgifter og inntekt
Dette er på langt nær en utfyllende liste, men det er kanskje eksempler her du kan kjenne igjen i virksomheten hvor du holder til eller hos andre?

Blikkenslagerverkstedet

La oss se et eksempel på hva slags data en virksomhet kan ha internt – i dette tilfellet det fiktive verkstedet Blikkbåsen.
Men selv om vi blir skikkelig gode på å bruke interne data til nyskapning og forbedring kan det være enda mer å hente på å vende blikket utover – med eksterne data.

Eksterne data

Igjen kan vi gjøre et skille, med to typer eksterne data:
  • Åpne/offentlige data: Data fra eksterne kilder som er åpent tilgjengelig. Med «offentlig» menes ikke her nødvendigvis at dataene kommer fra offentlig sektor, men snarere at de er tilgjengelige for offentligheten
  • Proprietære/private data: Data fra eksterne kilder som ikke alle uten videre har tilgang på eller lov til å bruke. Dataene kan komme fra profesjonelle tilbydere som samler og selger data. Eller, de kan komme fra leverandører og andre i verdikjeden til en virksomhet.
Eksterne data er data vi ikke eier og kontrollerer selv, men som vi enten finner åpent tilgjengelig eller får tilgang på via samarbeidspartnere og leverandører.
Dette kan være data om ting som trafikk, vær, hav og næring – og ikke minst data om produksjon, logistikk, vedlikehold og prosess hos andre virksomheter vi kan drive datautveksling med.
Tenk bare på hvor mange spesialiserte bedrifter som er i sving når et skip med alle sine komponenter skal bygges eller hvor mange aktører som er involvert i norsk fiskeri og eksport.
Her er det mange som jobber mot samme mål og dermed kan dra nytte av samarbeid og datautveksling – enten det er å redusere utslipp eller å bygge smarte og bærekraftige byer og lokalsamfunn.
Eksterne data kan ofte integreres direkte i virksomhetens egne systemer og tjenester gjennom API-er, og dermed få enda større verdi.
Et typisk eksempel er data fra Brønnøysundregistrene eller Kartverket, som lar hvem som helst benytte seg av ting som enhetsregisteret eller høydedata og dybdedata. Også organisasjoner som Verdens helseorganisasjon (WHO) og UNICEF deler store mengder data som fritt kan brukes. Det finnes også noen offentlige datasett som ikke uten videre ligger åpent tilgjengelig, men hvor man kan søke om tilgang, for eksempel enkelte opplysninger fra Folkeregisteret eller Skatteetaten.

Eksempel

Fiskher

Hva som er mulig med åpne, eksterne data er best illustrert gjennom et reelt eksempel. Nemlig den populære appen Fiskher, som viser fritidsfiskere over hele Skandinavia veien til over 70.000 fiskeområder.
Appen ville vært vanskelig å lage uten åpne data fra Kartverket og Geonorge som er fritt tilgjengelig for alle å bruke.
Ved å kombinere satellittbilder, kartdata, værdata og en rekke andre datasett med maskinlæring ble det mulig å peke ut tusenvis av habitater for fisk.
Fiskere kan også registrere fangsten sin, noe som betyr at Fiskher produserer egne data som kan bli til nytte for andre igjen. For eksempel gir det institusjoner som Havforskningsinstituttet og Universitetet i Tromsø bedre oversikt over fritidsfisket i landet.
I 2022 er data en betydelig del av verdensøkonomien, og flere leverandører av proprietære data er multinasjonale selskaper med tusenvis av ansatte.
Her er noen eksempler på proprietære data:
  • Opphavsrettsbeskyttet data: Åndsverk som musikk, film, foto, romaner, lærebøker – men også patenterte varemerker og teknologier.
  • Markedsundersøkelser: Profesjonelle markedsanalysebyråer kan på bestilling levere data og innsikt om spesifikke temaer eller problemstillinger.
  • Data som muliggjør digitale annonseplattformer: Sosiale medier som Facebook, Snapchat og TikTok – men også nettaviser som VG og Dagbladet – eier data som genereres på deres plattformer. Strenge personvernregler hindrer disse fra å dele eller selge detaljerte personopplysninger. Sammenstilt bruker- og atferdsdata kan likevel brukes til å lage skreddersydde annonser mot spesifikke målgrupper.
Hvis du er en leder eller ansatt i en virksomhet – eller for den saks skyld har et eget prosjekt – stopp gjerne opp og tenk på hvilke eksterne data du kunne dratt nytte av, og hvilke data du sitter på som andre kunne dratt nytte av.
Men husk: Selv om du eier data selv eller har kjøpt tilgang, er det som sagt ikke nødvendigvis slik at de dermed kan brukes helt fritt. Du må fortsatt forholde deg til lover som GDPR. Hvordan vi faktisk har lov til å bruke dataene vil vi snakke om i neste del.
Men aller først må vi innom en ting som vi har hoppet bukk over så langt: nemlig at å samle inn data, nødvendigvis innebærer å samle dem et sted. Dataene må også lagres. Dette skal vi se raskt på i neste emne.