CAA-SE om arkeologiska data

Posted on feb 2, 2011 in Digitala museer, Okategoriserade | 2 Comments

I början av veckan var jag med på ett möte om data från arkeologiska  undersökningar. Mötet anordnades av CAA-SE (den svenska underavdelningen av Computer Applications and Quantitative Methods in Archaeology) under förtjänstfull ledning av Daniel Löwenborg, Uppsala universitet. Deltagare var bl a undersökare (UV, SAU, Kulturmiljö Mälardalen, Arkeologikonsult), RAÄ,  museer (SHM och Upplandsmuseet) och några forskare. Mötet är resultatet av en spännande och ganska splittrad diskussion i CAA-SE:s grupp på LinkedIn om just hur digitala arkeologiska primärdata (dokumentation i form av inmätningar och databaser skapade vid arkeologiska undersökningar) ska tas hand om och användas. Jag har i några tidigare blogginlägg fört fram att det behövs en ny och modern teknisk infrastruktur för fältarkeologin som inbegriper ett översiktligt undersökningsregister och ett gemensamt datalager för arkeologiska undersökningsdata. Efter workshopen är det tydligt att det finns fler som delar dessa tankar. Frågan är nu hur detta kan åstadkommas och om vi egentligen har samma visioner, ambitioner och inriktning.

Mötets diskussioner snuddade vid ämnesområden som  målgrupper, information som ska hanteras, hur informationen ska användas, roller, ansvar och hur processen ska gå vidare. Jag ska här inte referera till mötets innehåll, en sådan kommer nog att presenteras av CAA-SE, utan ge några reflektioner från min utgångspunkt och sammanfatta vad jag försökte föra fram och visa några av mina bilder. En hel del är sig likt sedan tidigare inlägg kring ämnet i denna blogg.

Även SAU och Magnus Reuterdahl har bloggat om mötet.

Målgrupp och användning

Fornlämningar och föremål hanteras i dagens infrastrukturer, men det saknas information om undersökningen och dess kontextuella data. En av det viktigaste sakerna är att lösa är att ge objekt unika permanenta identiteter så att de kan refereras till i olika sammanhang

Jag tycker att frågan om digital arkeologisk dokumentation rimligen bör kopplas ihop med frågan om ett undersökningsregister – en plattform som bör innehålla översiktig information om var och när det har grävts och vilka resultat som framkommit. Löser vi den ena plattformen bör vi på samma gång lösa den andra, trots att ett undersökningsregister har en stor målgrupp, kan förväntas användas av både yrkesfolk (som handläggare, forskare och studenter, museer, media etc) och en bredare målgrupp av de som är intresserade av arkeologi och historia. Rätt utformat blir ett undersökningsregister en relativt dynamisk och levande plattform där undersökningarna får en egen webbsida  där det finns möjligheter att dela information och resultat (som nyheter, spännande fynd, visningar, rapporter, undersökningsplaner, analyser mm) och länkar. Genom enkel etablerad internetteknologi (RSS-flöden) skulle användare kunna följa externa gräv- och rapportbloggar och tweets från undersökningen på undersökningens sida tillsammans med information från undersökningen. Undersökningen skulle genom webbplatsen ges en unik permanent identitet (URI) som gör att undersökningen kan refereras från andra webbplatser, andra datamängder och i löpande text. Undersökningens information publiceras som länkade data med öppen licensiering (LOD) och är tillgänglig för maskiner (andra system och plattformar) via ett API. Data görs även tillgängliga via GIS-dataset i vanligt använda format som kan laddas ner och användas lokalt. Ett undersökningsregister bör indexeras av K-samsök. En viktig kravställare på en gemensam plattform för arkeologiska data är de stadsGIS som nu växer fram som handläggningsstöd. Här finns också en värdefull drivkraft att sammanställa äldre undersökningar.

Om undersökningen är modern och digitalt dokumenterad skulle dess digitala dokumentation kunna laddas upp i form av en eller flera XML-filer (RDF) som utgör undersökningens innehåll. Också dokumentationen bör utgöra länkade data (varje ”informationsatom” på en undersökning – kontext – objekt, fynd eller prov – får en egen webbsida med en unik adress) tillgängliga via ett API. Målgruppen för arkeologisk primärdata är betydligt mer snäv och forsknings- eller yrkesinriktad. Ett datalager med digital dokumentation är lika mycket ett digitalt arkiv som ett levande informationssystem. Här handlar det om att bevara och använda data och samtidigt kunna tillföra ny kunskap. Några framgångsfaktorer för ett väl implementerat undersökningsregister och datalager:

  • Det ska till en början bygga på frivillighet, delaktighet och öppenhet. Gamla undersökningar ska kunna samsas med nya. Forskare ska kunna lägga in gamla undersökningar. Krav ska läggas på moderna undersökningar i undersökarnas regelverken.
  • Datafångsten ska vara decentraliserad – undersökaren uppdaterar själv den gemensamma plattformen.
  • Undersökarens kostnader för dataleveranser måste kunna finansieras inom det uppdragsarkeologiska systemet.
  • Kvalitet är viktigt men får inte ta överhanden – det bästa får inte bli det godas fiende. Det är m a o viktigare att det finns en enkel kartmarkering i form av en punkt som signalerar förekomst än att alla schakt och undersökningsområden finns inlagda med hög precision, transformationer och kvalitet.
  • Det är viktigt med en unik undersökningsidentitet som tydligt märker upp all information från en undersökning och unika identiteter för alla typer av undersökningdata. Det är förutsättningen för att kunna referera och nya data ska kunna läggas till systematiskt eller hanteras i andra plattformar.
  • Data ska vara öppna för alla och inte belagda med upphovsrätt eller andra användarrestriktioner. Data som man vill skydda ska inte laddas upp i gemensamma datalager (förrän de är fria). Vem som äger och kan licensiera ut undersökningsdata (inklusive dokument och fotografier) efter avslutad undersökning måste redas ut.  Open Access borde gälla för rapportmaterial och annat publicerat material som finansierats inom uppdragsarkeologin.
  • Forskarens egna data och resultat ska kunna komplettera primärinformationen. Alternativa tolkningar bör kunna hanteras.

Hanterad information

När det gäller information som ska hanteras är jag mycket optimistisk att det går att enas om en enkel grov datastruktur, men helt uppgiven att strukturer och termanvändning som helhet ska kunna synkroniseras i en gemensam plattform. Jag är inte ens säker på att det främjar forskningen att alla måste använda samma termer eller strutkur, även om det skulle gå lättare att söka. Sakordsträsket bör kanske lämnas för kommande generationer att lösa.

Trots att det finns stora skillnader mellan en stenåldersundersökning och en stadsgrävning utgår jag från att ett fåtal gemensamma typer av entiteter (informationstyper eller klasser) kan skapa en gemensam enkel struktur att utgå från:

Enkla bastyper som alla kan mappa sina undersökningsdata mot och leverera upp till ett gemensamt datalager. Innehållet som beskriver bastyperna definieras av gemensamma eller egna metadataresurser.

Inom varje entitetstyp väljer vi ut ett antal obligatoriska attribut som måste finnas med vid leverans, men det finns möjlighet att leverera upp metadataelement som är bara gemensamma inom ett systemet/institutionen eller  som är specifika för en viss speciell undersökning. Vi kanske bör överväga att introducera ett litet antal nya gemensamma attribut för att underlätta samsökning. Själva undersökningen bör ha ett antal egenskaper som är till för att förmedla ett aggregerad bild av undersökningen, översiktliga resultat, texter, kvantifieringar och kanske underlag för statistik. I möjligaste mån ska den gemensamma metadatastrukturer bygga på etablerade standarder och ontologier och vara möjlig att mappa mot internationella metadataresurser för arkeologi.

Hur går vi vidare?

När det gäller en fortsättning på arbetet med att förverkliga dessa idéer (och även för den tekniska plattformen) framförde jag likheten mellan vårt arbete med arkeologiska data och arbetet bakom kulturarvsdataplattformen K-samsök som bedrevs under 2008 och 2009. Även där samlades mer eller mindre disparata data från flera aktörer in till en gemensam struktur som kan användas för att söka och distribuera data. K-samsök visade att det på en relativt kort period (några månader) går att skapa gemensamma modeller, leveransformat och protokoll. K-samsök visade också att det ganska snabbt och till en rimlig peng går att utveckla en plattform som sedan fungerar i praktiken om det finns rätt mandat, fast övertygelse och rimliga resurser.

En naturlig fortsättning på vårt arbete blir därmed att först enas om en gemensam vision och målbild kring hanteringen av arkeologiska primärdata, marknadsföra den visionen till ansvariga myndigheter och aktörer och gå vidare i arbetsgrupper med bred förankring för att arbeta fram koncept för användning, gränssnitt, datamodeller och teknisk infrastruktur. En andra möte i denna riktning planeras av CAA-SE. Kolla in gruppen på LinkedIn för mer information om när och var det inträffar.

Vad tycker du är viktigt för att komma vidare i frågan?

2 Comments

  1. Några ord om CAA-SE work-shopen om GIS-data 2011-01-31 « Testimony of the spade
    4 februari, 2011

    […] om workshopen finns hos Digitala museer och SAU. CAA-SE hittar du på […]

    Reply
  2. A few words on the CAA-Sweden work-shop on GIS-data 2011-01-31 « Testimony of the spade
    4 februari, 2011

    […] on the work shop can be found at Digitala museer and SAU, both posts are in Swedish. Link to CAA’s webpage, CAA-SE is up at […]

    Reply

Leave a Reply

Follow

Get every new post on this blog delivered to your Inbox.

Join other followers: