Programmet SPREDNING: forklaringer og dokumentasjon

Programmet SPREDNING ble skrevet for å estimere en populasjons spredningshastighet ut fra data på populasjonens utbredelse i tid og rom. Bruksområdet var klassifiseringen av fremmede arter i Norge i 2012, der spredningshastighet inngikk i kriterium b på invasjonsaksen.

Merk at programmet SPREDNING ikke lenger brukes til dette formålet. Programmet vil forbli tilgjengelig her en stund til, men vil ikke lenger bli oppdatert eller vedlikeholdt. Fra 2016 har det blitt erstattet av programmet EKSPANSJON.

 

Innføring og installasjon

R-scriptet krever ingen forkunnskaper om R, men forutsetter at R er installert på maskinen. Her følger en punkt-for-punkt-beskrivelse av bruken:

·    R er et gratis og åpent programmeringsspråk. Det kan lastes ned på http://www.r-project.org. Følg installasjonsveiledninga på nettsida for å installere pakken.

·    Etter at R er installert og startet, kan sprednings-scriptet lastes på to måter:

·     skriv load(url("http://www.evol.no/hanno/11/spredng.rtx")) direkte i R-vinduet (dette krever at datamaskinen er online);

·     bruk nettleseren for å navigere til URL'en http://www.evol.no/hanno/11/spredng.rtx og lagre filen til maskinen din; skriv så load("...") i R-vinduet, der "..." angir filplasseringa [f.eks. load("c:/aliens/spredng.rtx") e.l.; dette krever bare at datamaskinen er online ved den første nedlastingen, etterpå kan scriptet lastes fra sin plassering på maskinen].

·    Nå kan scriptet kjøres ved å skrive spredning(...), der "..." representerer parameterne, som forklares i detalj under.

Merk at programmet ikke er del av noen R-pakke. Det fins derfor ingen R-hjelp for funksjonen.

 

Programmet krever et datasett som inneholder informasjonen om spredning i tid og rom. Datasettet spesifiseres gjennom parameteren data. Programmet kan dermed oppropes ved å skrive spredning(data=...), der "..." kan være ett av de følgende tre objektene:

(1) en tekststreng som angir filplasseringen til en datafil;

(2) en datablokk (data.frame);

(3) en matrise.

De to siste løsningene forutsetter at dataene allerede er lest inn i R på annen måte (og er derfor kanskje forbeholdt viderekomne R-brukere). Formateringen av datafila (løsning 1) forklares under. Felles for alle tre løsningene er at dataene må være organisert i kolonner, og at kolonnene må ha navn som er spesifisert i de følgende avsnittene.

·    Én kolonne må inneholde årstall og ha navnet t. Årstall må være angitt som heltall.

·    Plasseringen til observasjonene må angis i én til seks kolonner, avhengig av koordinatsystemet som brukes:

 

Koordinatsystemer

Plasseringen til observasjonene kan angis på ti måter, fordelt på fire ulike koordinatsystemer:

·    geografisk lengde og bredde

                    (1)      bg   OG lg   ELLER

                    (2)      bg   OG bm   OG bs   OG lg   OG lm   OG ls

·    MGRS-koordinater (Military Grid Reference System)

                    (3)      mgrs   ELLER

                    (4)      zone   OG band   OG id   OG east   OG north   ELLER

                    (5)      id   OG east   OG north   OG fylke   ELLER

                    (6)      id   OG east   OG north   OG kommune   ELLER

                    (7)      id   OG east   OG north   OG knr  

·    UTM-koordinater (Universal Transverse Mercator)

                    (8)      zone   OG east   OG north  

·    kommunemidtpunkt

                    (9)      kommune   ELLER

                (10)      knr

der variabelnavnene har følgende betydning og formatering:

bg Breddegrader. Angis som heltall eller desimalbrøk mellom –90 (= 90°S) og +90 (= 90°N).
bm Geografisk bredde i minutter. Angis som heltall eller desimalbrøk mellom 0 og 60.
bs Geografisk bredde i sekunder. Angis som heltall eller desimalbrøk mellom 0 og 60.
lg Lengdegrader. Angis som heltall eller desimalbrøk mellom –180 (= 180°V) og +180 (= 180°Ø).
lm Geografisk lengde i minutter. Angis som heltall eller desimalbrøk mellom 0 og 60.
ls Geografisk lengde i sekunder. Angis som heltall eller desimalbrøk mellom 0 og 60.
mgrs MGRS-koordinater. Angis som tekststreng.
zone UTM-sonen. Angis som heltall mellom 1 og 60. (Norge vest for 12°Ø ligger f.eks. i sone 32.)
band MGRS-belte. Angis som bokstav mellom "C" og "X". (Norge nord for 64°N ligger f.eks. i belte W, Norge sør for 64°N i belte V.)
id MGRS-identifikator for en 100 km-rute. Angis som to bokstaver mellom "AA" og "ZV".
east "Easting" (østlig posisjon). Angis som tall, men kan formateres som tekststreng. Betydning og tillate verdier er noe ulik i UTM og MGRS.
north "Northing" (nordlig posisjon). Angis som tall, men kan formateres som tekststreng. Betydning og tillate verdier er noe ulik i UTM og MGRS.
fylke Fylke. Angis som tekststreng. Kan bare brukes for data fra Norge.
kommune Kommunenavn. Angis som tekststreng. Kan bare brukes for data fra Norge. Hvis kommune er angitt uten andre koordinater, bruker estimeringen koordinatene til kommunenes geografiske midtpunkt. Dette er en nødløsning med stor feilmargin som bare anbefales hvis (a) mer nøyaktige posisjonsdata ikke foreligger, (b) datasettet inneholder mange kommuner og (c) kommunene ikke er altfor store.
knr Kommunenummer. Angis som heltall mellom 101 og 2030. Se ellers kommune.

 

Eksempel

Koordinatene til Tromsø (69°39'5"N 18°57'19"Ø) kan dermed angis på følgende måter:

        (1)      {bg=69.65139; lg=18.95528}

        (2)      {bg=69; bm=39; bs=5; lg=18; lm=57; ls=19}

        (3)      {mgrs="34WDC2058828390"}

        (4)      {zone=34; band="W"; id="DC"; east=20588; north=28390}

        (5)      {id="DC"; east=20588; north=28390; fylke="Troms"}

        (6)      {id="DC"; east=20588; north=28390; kommune="Tromsø"}

        (7)      {id="DC"; east=20588; north=28390; knr=1902}

        (8)      {zone=34; east=420588; north=7728390}

        (9)      {kommune="Tromsø"} [noe som i dette eksemplet bommer med 5,3 kilometer]

    (10)      {knr=1902}

 

NB

·    Merk at MGRS-systemet ofte feilaktig refereres til som UTM-system (som det førstnevnte bygger på). Tromsøs UTM-koordinater er 34 420588 7728390. Tromsøs MGRS-koordinater er 34WDC2058828390. For å skille mellom nordlig og sørlig halvkule, brukes fortegn i UTM-koordinatens "northing" (positivt på nordhalvkula og negativt på sørhalvkula; positivt fortegn kan sløyfes).

·    Standardene for UTM eller MGRS må følges. (Selv om programmet vil oppdage enkelte åpenbare feil, vil ikke alle tenkelige inkonsistenser siles ut.)

·    Variabelnavnene må være nøyaktig som angitt over.

·    Ledende nuller kan skape problemer for "easting" og "northing" i MGRS-systemet, siden de kan falle bort. For å unngå det, bør east og north lagres som tekststreng heller enn tall.

·    Presisjonen av posisjonsbestemmelsen spiller ingen rolle (vel, kanskje for resultatene, men ikke for tolkningen av koordinatene).

·    Observasjonene i datasettet kan bruke ulike koordinatsystemer.

·    Hvis flere koordinatsystemer er angitt, ignoreres kommunenavn såfremt kommunenummer er angitt, kommunenummer såfremt UTM er angitt, UTM såfremt MGRS er angitt, og MGRS såfremt bredde- og lengdegrader er angitt.

·    Observasjonenes rekkefølge er uten betydning.

·    Kolonnenes rekkefølge er uten betydning.

·    Ytterligere kolonner ignoreres.

 

Formatering av datafil

Leses dataene inn fra en ekstern fil, gjelder følgende:

·    Dataene må være organisert kolonnevis, dvs. fila må bestå av én kolonne per variabel (år og f.eks. geografisk bredde og lengde) og én rad per observasjon.

·    Den første raden må inneholde variabelnavnene (se over for påkrevde variabelnavn).

·    Alle radene må ha like mange skilletegn.

·    Manglende verdier tolereres. De angis ved utelatelse (""), evt. som mellomrom (" "). (Andre tegn, slik som "?" eller "NA" genererer feilmeldinger.)

·    Som skilletegnet mellom kolonnene (dvs. mellom elementene i en rad) må semikolon (;) eller komma (,) brukes. Slike filer kan lages i alle regnearkprogrammer ved å velge "lagre som" ("save as") og så angi "semikolondelt" (evt. "kommadelt", "comma delimited") som "filtype". (Betegnelsen kan variere avhengig av programmet og innstillingene. Slike filer har vanligvis endelsen ".CSV" eller ".SDV".)

·    Symbolet som brukes som skilletegn, må ikke forekomme i andre sammenhenger. Det samme gjelder apostrof ('). Forekommer slike tegn f.eks. i en tekstkolonne, må tegnene enten erstattes eller kolonnen fjernes før innlesing.

·    Parameteren data må være en tekststreng som angir datafilas navn og plassering. Filplasseringen angis som en komplett bane i anførselstegn, f.eks. spredning(data="c:/aliens/data/art12.sdv"). Merk bruk av skråstrek (/) istedenfor omvendt skråstrek (\).

·    Som desimalindikator aksepteres punktum (.). Hvis semikolon (;) brukes som kolonneskilletegn, aksepteres også komma (,) som desimalindikator.

·    Mellomrom tolereres mellom (utenfor) cellene og anførselstegn rundt (på begge sider av) cellene.

 

Eksempel:

t;bg;lg

2006;60.00;12,00

2006;60.54;12.26

2006;60.24;12.76

2007;61.94;11.74

2007;   61.53;   11.36

2008;62.75;10.18

2008;62.84;10.92

2009;63.81;11.43

2010;64.97;12.64

2010;64.15;12,1

2010;64.84;"12.15"

 

Parameterne

Parameteren data er forklart i detalj over. Alle resterende parametere er valgfrie og kan vanligvis ignoreres. Her følger likevel en kort oversikt:

·    kart (sannhetsverdi som angir om et kart over observasjonene skal vises; standard er kart=TRUE; skriv kart=FALSE for å slå av visningen),

·    rmax (største mulige spredningsdistanse; for data i Norge vil den settes automatisk slik at spredningsdistanser ikke kan krysse landegrensene; for data i andre land er standarden at rmax settes til uendelig; ved behov kan andre verdier angis som tall i kilometer),

·    hold.munn (slår av beskjeder og advarsler hvis den settes lik TRUE),

·    front (heltall som angir måten som fronten blir estimert på; de tilgjengelige alternativene omfatter så langt front=0, som estimerer spredningen ut fra populasjonens gjennomsnittlige distanse fra første observasjon til enhver tid; front=1, som definerer spredningsfronten som gjennomsnittet av distansene som er minst like stor som forrige års spredningsfront; front=2, som definerer spredningsfronten som gjennomsnitt av distansene som er minst like stor som forrige års største observerte enkeltdistanse; front=3, som definerer spredningsfronten som den største observerte distansen som er minst like stor forrige års største observerte enkeltdistanse; standardinnstillingen er front=2, som er en nokså robust definisjon under mange betingelser),

·    ny.obs (sannhetsverdi som angir om bare nye observasjoner er angitt, dvs. at de ikke er ført opp på nytt i senere år; parameteren ignoreres hvis front > 0; standard er ny.obs=TRUE),

·    typ (heltall eller vektor av heltall mellom 0 og 3 som angir formen på modellen som tilpasses dataene; typ=0 tilpasser en lineær modell, typ=1 en avkappet modell, typ=2 en asymptotisk modell og typ=3 en sigmoid modell; hvis typ er en vektor, testes alle de angitte modellene, og resultatene for den av modellene som oppnår lavest AIC, blir vist; standardinnstillingen er typ=0),

·    utmat (sannhetsverdi som angir om en liste over modellestimatene skal produseres som utmating; standard er utmat=FALSE),

·    utdata (sannhetsverdi som angir om en datablokk, der alle funnstedene er transformert til azimuthalprojiserte x- og y-koordinater, skal produseres som utmating; standard er utdata=FALSE),

·    lagre (sannhetsverdi eller tekststreng som angir om dataene skal lagres etter å ha blitt transformert til bredde- og lengdegrader; tekststrengen må i så fall angi filnavnet; dermed slipper man å transformere dataene ved hver kjøring av programmet; standard er lagre=FALSE),

·    det (sannhetsverdi som angir om detaljene fra samtlige modeller skal vises; parameteren ignoreres hvis typ bare er ett tall; standard er det=FALSE),

·    de resterende parameterne tillater overstyringen av noen standardinnstillinger (xy: sannhetsverdi som angir om dataene allerede er transformert til en azimutalprojeksjon og angitt som kilometer i x- og y-retning; phi0: breddegraden for azimutalprojeksjonens sentrum; lambda0: lengdegraden for azimutalprojeksjonens sentrum; spraak: tekststreng som tillater å skifte fra norsk til engelsk utmating), bestemmer utformingen til grafen over spredningsforøpet (alpha: andelen av observasjonene utenfor de estimerte konfidensintervallene, standard er 0,05; tittel: tittelen for grafen; xlab: legenden for x-aksen; ylab: legenden for y-aksen; ylim: faktor som y-aksen strekkes med, standard er 1,5; hmax: antall år som skal vises utover de med data, standard er 20; ...: eventuelle flere grafiske parametere), eller tillater en parameterisering på engelsk (der map = kart, quiet = hold.munn, header = tittel, new.obs = ny.obs, type = typ, output = utmat, outdata = utdata, save = lagre, and language = spraak).

 

Utmating (output)

Funksjonen produserer output direkte på skjermen (uten å anta noen funksjonsverdi). Ved siden av en kort oppsummering av datagrunnlaget (som kan slås av ved hjelp av parameteren hold.munn) består utmatingen av

·    estimater for spredningshastigheten (v ± 95 %-konfidensintervaller) og for spredningsdistansens standardavvik s, basert på antagelsen om ingen observasjonsfeil (dvs. at all observert variasjonen skyldes prosess-støy);

·    estimater (± 95 %-konfidensintervaller) basert på antagelsen om fravær av prosess-støy (dvs. at all observert variasjonen skyldes observasjonsfeil). Avhengig av den valgte modellen estimeres (noen av) de følgende parameterne:

·     spredningshastigheten v i kilometer per år,

·     tidspunktet for introduksjonen t0 som årstall,

·     den maksimale distansen K som arten vil spre seg i kilometer,

·     tidspunkt tx for den sigmoide kurvens vendepunkt,

·     standardavviket s for spredningsdistansen,

·     parameteren b, som beskriver hvor fort variansen i de observerte distansene øker med tiden,

·     Akaikes informasjonskriterium AIC (av to modeller bygget på samme datasett foretrekkes det med lavest AIC).

NB: Utmatingen bruker komma som desimaltegn og ingen tusenskilletegn.

 

Dokumentasjon og definisjoner

Programmet er en implementering av modellene som er beskrevet i Forslag til et kvantitativt klassifiseringssystem for risikovurdering av fremmede arter (Sæther mfl., 2010, s. 59–61). Dokumentasjonen av modellene kan slås opp i denne rapporten.

Med spredning i kriteriesettets og programmets betydning menes en fremmed arts romlige forflytning uansett måte, årsak og vektor. Spredning innbefatter dermed både aktive, passive og antropogene prosesser (f.eks. aktiv bevegelse; vind, vann, dyr; tilsiktet eller utilsiktet transport og sekundære innførsler). Se for øvrig Fremmede arter i Norge – med norsk svarteliste 2012 (Gederaas mfl. 2012) for en anvendelse av denne definisjonen (og herværende program).

Merk at risikovurderingen av fremmede arter i 2017 bruker en ny definisjon (ekspansjon). Scriptet har derfor blitt erstattet av en ny versjon.

 

Om programmet

Programmet SPREDNING er skrevet av Hanno Sandvik med bidrag fra Jarle Tufto, Senter for biodiversitetsdynamikk ved NTNU.

Det foreligger i versjon 1.4 (juli 2012). Fra versjon 2.0 skiftet programmet navn til EKSPANSJON.

Takk til Ivar Herfindal for hjelp med kommunedataene.