Grävlagret
Detta inlägg är den tredje delen i en serie av visionära förslag kring förbättringar av det uppdragsarkeologiska systemet. Läs del 1: System Error? och del 2: Nya informationsflöden för arkeologiska undersökningar?
Idag används datorer vid de flesta arkeologiska undersökningar. Nästan all information som genereras vid en undersökning hanteras digitalt. Fynd registreras i databaser tillsamman med metadata om fyndens sammanhang (gravar, gropar och sånt). Arkeologer kallar dessa sammanhang kontext. Planerna skapas med hjälp av inmätningar av totalstationer eller GPS. Foto sker med digitala kameror. Allt hanteras och analyseras i olika former av geografiska informationssystem och allt lagras i databaser. Så har det varit i mer än tio år. Några få system dominerar marknaden. Svensk arkeologi ligger långt framme.
Men det finns ett stort problem (se en bakgrund i del 1). Ingen institution eller antikvariskt system tar hand om den digitala primärinformationen – undersökningarnas databaser – på ett systematiskt sätt för arkivering och förvaring. Data som är undersökningarnas primära dokumentation riskerar därmed att förloras. Endast rapporter och planer (som är mer presentation än dokumentation) som skrivs ut på papper och några fotografier är resultat som arkiveras systematiskt från undersökningen tillsammans med fynden och deras metadata i museernas magasin. Tredimensionella GIS-data omvandlas till tvådimensionella ritningar. Just nu håller undersökarna (förhoppningsvis) liv i sina gamla avrapporterade undersökningar i databaser på egna servrar. Men det är nu hög tid att fundera på om det inte är läge att ta ett nytt grepp om frågan för att se till att undersökningarna kan sparas och arkiveras och göras åtkomliga centralt.
En förslag till överbyggnad för detta – ett digitalt undersökningsregister – har också presenterats i ett tidigare inlägg (del 2). Det borde inte vara så svårt att lösa central lagring av undersökningsdata ur en teknisk synvinkel. Det som är svårt och som har hindrat frågan från att lösas tidigare är vem som har ansvaret för detta: är det länsstyrelserna, museerna, Riksantikvarieämbetet eller arkiven? Eller kombinationer av dessa?
Den som läser denna blogg börjar kanske bli trött på visioner om mer eller mindre realistiska system som borde finnas och som vi borde utveckla gemensamt, men där det sällan finns någon som vill eller kan ta operativt ansvar. Så är det i detta fallet också. Men när det gäller denna fråga så är det faktiskt så att den måste lösas på något sätt. Att inte ta ett beslut alls är just nu ett beslut om att låta data gå förlorade. Då kommer tiden och glömskan att automatiskt sköta arkivfrågan då slutförvaringen kommer att ske i det lilla runda arkivet (papperskorgen) och alla data på sikt går förlorade. Jag tror inte vi som arbetar med kulturarvsfrågor vill det. Vi vill lösa problemet. Så här kommer ännu ett förslag.
Grävlagret
Vi borde skapa ett centralt datalager ”grävlager” som tar hand om och förvaltar digitala primärdata efter det att undersökningen avslutats. Att tanka upp data kanske ska vara frivilligt och vi bör möjliggöra att även gamla undersökningar kan tas om hand i efterhand. Upptankningen – exporten- sker genom att de dominerande undersökningssystemen (Intrasis, Sitworks mfl) på marknaden utvecklar exportfilter som plockar ut data ur den lokala undersökningsdatabasen och läser upp den i en generell modell som är anpassad att kunna svälja data från olika system och dokumentationsprinciper. Ett enkelt och mer generellt exportfilter tas också fram för att möjliggöra att alla andra undersökningar kan tas tillvara. Både nya och gamla grävningar, stora eller små grävningar och fullständiga eller deldigitaliserade bör vara möjliga att tanka upp. Exportfilter omvandlar grävdatabaser till generell XML och läser upp och lagrar undersökningarnas data i ett centralt, sökbart XML-datalager. Precis samma teknik, protokollgrunder, arbetssätt och möjligheter som används i K-samsök. Varje fynd, kontext, bild, plan etc får en egen unik global identitet (URI; genererad från en undersökningsidentitet).
Modellen för ett centralt grävlager är faktiskt ganska enkel. Variationen hur en undersökare lagrar data kanske är stor men den kan kokas ihop till en enkel gemensam generell modell, som nedan visas lätt förenklad och skissat:
Undersökningen skapar egentligen fyra olika entitetstyper som vi måste spara och hålla reda på metadata om. Entiteterna relaterar till varandra och bygger tillsamman upp en datamängd som kan användas för att söka i, få information om, förstå, visualisera, analysera och tolka undersökningen. Det är helt enkelt sorts digital representation av undersökningen.
- I centrum för en museiman som jag står fynden. Fynden påträffas i en kontext, läget beskrivs av geodata (eller kontextens geodata) och övriga beskrivningar lagras som metadata om fynden eller media och dokument
- Kontext är undersökningen sammanhang och beskriver allt från den minsta gropen till den största konstruktionen. Kontext kan bestå av kontext: stolphål bygger upp husen. Kontext är antingen primära administrativa entiteter som inte kan tolkas om (de är huggna av sten av den som undersökte) eller tolkade kontext där de primära enheternas ”atomer” pusslas ihop till kulturhistoriska ”molekyler”; stolphålen tolkas som hörande till huset. Det är trevligt att spara tolkningarna som grävaren gjort även om en annan arkeolog kanske kan bygga en annan ”molekyl”. Form, utbredning, volym och läge beskrivs av geodata. Övriga beskrivningar lagras som metadata eller media och dokument
- Geodata är undersökningens digitala planer, ritningar och kartor som ger andra undersökningsentiteter ett läge på jordklotet. Dessa består av lägen (koordinater i tre dimensioner) som kan visas som punkter eller pusslas ihop till linjer eller ytor (polygoner eller andra mer avancerade grafiska element) i kartprogram
- Media och dokument ger tilläggsbeskrivningar extrainformation till de andra entiteterna. Här finns bilder, film, ljud, anteckningar, rapporter, analyser och sånt
Att lagra denna information som entiteter i XML-dokument sammanlänkade av RDF-relationer är inte så svårt och utrymmeskrävande och kan göras teknisk väldigt ”tidlöst” och underhållsfritt. Varje fynd, grop eller bild lagras som ett eget XML-dokument. Det finns en ändlig mängd typer av entiteter och relationer och det mesta rör sig om textdata som är lätta att lagra i element. Undersökningspaketet hålls samman av metadata om undersökningen som finns i ett undersökningsregister. Undersökningen identitet finns på samtliga entiteter som genererats vid undersökningen.
Efter undersökningen är avslutad och data är exporterade till grävlagret behöver inte data ändras eller uppdateras (om vi inte vill lagra förslag till omtolkningar i form av alternativa ”molekyler”, men det är väl en senare fråga). Den stora frågan som söker lösning är hur vi hanterar media (framförallt högupplösta bilder men i framtiden kanske även video) och dokument. Dessa tar mycket utrymme och behöver förvaltas över tid i ett långtidsperspektiv. I denna fråga är Grävlagret troligen beroende av andra lösningar för långtidslagring framtagna av minnesinstitutionerna.
Fördelarna med ett centralt grävlager är många och förutom att vi löser den digitala uppdragsarkeologins dilemma med central lagring och arkivering så innebär lösningen bland annat:
- Förenklad accession för museerna. Museerna kan importera data om föremål till sina egna samlingssystem på ett systematiskt sätt direkt från grävlagret. Alla råd och anvisningar till undersökaren om leveransformat av filer, disketter mm kan ersättas med ett exportfilter och allmänna innehållsmässiga rekommendationer. Föremål, bilder och planer kan redan i fält märkas upp med unika identifierare och etiketter på föremål kan produceras av grävaren så att de inte behöver bytas ut inne på museerna (som Historiska museet gör för att få in moderna streckkoder på föremålen).
- Föremålen i museerna får en kontextkoppling. De föremål som lagras i museernas databaser är ofta relativt kontextlösa (även om det finns referenser till sammanhang i databaserna) och ses mer som individuella museiföremål än som en del av ett kulturhistoriska sammanhang och ett undersökningskontext (du kan exempelvis inte söka efter svärd från vikingatida högar i våra databaser). Jag tror att många, inklusive de som bara söker efter kulturarvsinformation är lika intresserade av sammanhangen, platser, gravar och fyndögonblick som själva föremålen. Med grävlagret kan museet med en enkel länk peka på kontextinformation. Sökindex som K-samsök kan indexera och öppna upp sökmöjligheter för användare att leta efter gravar, hus, lager och konstruktioner vid sidan om sökning efter rena föremålsfakta.
- Arkeologiska undersökningar blir lätt tillgängliga för forskning och samhällssplanering. Undersökningarna och dess entiteter kan sökas, visas och vid behov laddas ner och analyseras. Det blir helt enkelt mycket lättare att forska på uppdragsarkeologiska material och enklare att använda dessa data och resultat i planeringsprocesser.
- Arkeologiska undersökningar får en tydligare roll i det digitala KML-systemet. KML-systemet blir komplett i informationskedjan från fornlämning över till undersökning till undersökta kontext och slutligen hittade föremål på museet och undersökningsdata inlemmas i en nationell infrastruktur för kulturarvsdata.
Vad behöver vi då göra för att kunna gå vidare? Jag tror det räcker med att samla några få nyckelpersoner från uppdragsarkeologin med några få nyckelpersoner från kulturarvsdataförvaltning och museerna för att beskriva den gemensamma modellen, skapa ett (eller låna ett befintligt) leveransprotokoll för data och prospektera strukturen på ett gemensamt datalager. Sedan måste vi ragga pengar, teknikkonsult och hitta en driftspartner och reda ut ansvaret för teknisk förvaltning.
Processen liknar mycket arbetet bakom K-samsöks protokoll och koncept, men är betydligt mindre komplext och det är färre intressenter inblandade. Arbetet med K-samsöks grundförutsättningar tog ca ett halvår i kalendertid. Vad som skulle behövas för att underlätta processen är ett lika tydligt mandat som i fallet med K-samsök och en påse med pengar…
16 Comments
ArchAsa
23 september, 2010Precis som du säger är detta ett problem som skriker efter en lösning, så snart som möjligt. Och precis som övrig digital lagring så är bakåt-kompatibiliteten ett problem som kommer uppstå vad vi än gör. Jag tycker verkligen att arkiv som ATA borde visa ett större intresse av att stå i spetsen och driva denna fråga – det handlar om deras existensberättigande i grunden.
I Storbritannien har man ju dragit igång ett Geodata-system för att spara utgrävningar – frivilligt om jag förstått saken rätt. Jag har inte kompetens nog att avgöra hur detta skulle kunna lösas i Sverige, men det du målar upp här ser ut som en god start. Till skillnad från satsningen på sociala medier inom museibranschen så är det tydligt att det kommer krävas påtagliga investeringar i både hårdvara och anställda för att sköta något dylikt. Om vi ska kunna berättiga den kostnaden är det viktigt med två saker:
1. Att datan som matas in även kan matas ut och komma till användning
2. Att forskare, studenter och yrkesverksamma inom många olika områden (arkeologi, kulturgeografi, historia, naturgeografi, agronomi mm) uppmuntras och ges möjlighet att komma åt och ta del av informationen. Att det inte bara blir en form av ”slutförvaring”.
3. Att resultaten för detta kommer allmänheten till del.
Ulf Bodin
23 september, 2010En av anledningarna att skapa en ny teknisk lösning och inte ”gömma” undersökningsinformationen i ett traditionellt arkiv är, som du skriver, att informationen ska vara möjlig att söka, komma åt och referera på ett enkelt sätt. Det blir den i ovan skissade lösning genom att informationen exempelvis indexeras av K-samsök och att alla data ligger öppet exponerad som Länkade Data på nätet.
Att skissa på verktyg för forskare och studenter där de kan hitta, bearbeta, ladda ner, förädla och ladda upp är också en angelägen fråga (SHMM har faktiskt den frågan uppe också). Problemet är bara att målgruppen för uppdragsarkeologiska primärdata är så försvinnande liten i jämförelse med andra kulturarvsdata. En nyttoanalys ger snabbt att det är bättre för många institutioner som är berörda att lägga pengarna på andra system och projekt (bred förmedling och tillgänglighet, massdigitalisering, sociala medier etc). Så har nog RAÄ med flera resonerat i många år.
Frågan om bevarandet av digitala uppdragsarkeologiska primärdata kommer alltid att ha karaktären av en samvetsfråga som måste lösas från en annan synvinkel än ren nytta. Annars kommer vi alla att börja ifrågasätta varför så stora resurser läggs på att dokumentera undersökningar när så lite tas tillvara.
Lars L
23 september, 2010Märkligt, det här inlägget dyker upp samtidigt som jag och en kollega diskuterade just frågan om hur pass stor sekundäranvändningen är av arkeologisk fältdata.
Jag vill gärna hoppas på att det finns en efterfrågan på fältmaterial från arkeologiska undersökningar. Men det är svårt att bygga system på förhoppningen om att de ska användas… Man kanske skulle titta närmare på det, hur pass mycket av analogt resp digitalt material ”återanvänds” för nya uppdrag och forskning, för sekundär analys och bearbetning. (Och är man redigt djärv kollar man även hur pass stor del av insamlade fynd som åter-analyseras…).
Är det nån som vågar sia om detta?
Lars L
23 september, 2010Oj, moderator…
ArchAsa
23 september, 2010Det är lätt att man hamnar i ett cirkelresonemang – svårigheten att komma åt data gör att få använder det gör att nyttan ifrågasätts eftersom få använder det… Skapa bättre förutsättningar och det kommer bli mer använt. Grundforskning är vad universiteten delvis ska syssla med och det tar ett tag innan nyttan blir uppenbar för en bredare publik. Det gäller fysik så väl som arkeologi.
Sen är det ett annat problem att arkeologi räknas som humaniora och därmed inte ges ersättning för mer lärarintensiv undervisning som krävs om vi ska börja arbeta mer som samhällsvetare och naturvetare. Fornsaksundervisning och datorlaborationer är extremt kostsamma och enligt schablonen ska vi humanister bara undervisa i form av föreläsningar och enstaka seminarier. Jag vet att Uppsala-institutionen vid flera tillfällen sökte dispans utan att lyckas få upp ersättningen, nu får de det delvis tack vare GIS. Studenter och forskare behöver kunna lära sig hur man hanterar stora databaser o dyl.
Ulf Bodin
23 september, 2010Lars: Den efterfrågeanalysen kommer nog aldrig att göra det värt att investera i att bevara undersökningsdata för framtiden, tippar jag. Det måste ligga andra drivkrafter bakom detta. Samma krafter som sparar föremål på museum som troligen aldrig någon kommer att titta på eller spara arkivhandlingar bara för att de speglar en verksamhet en viss tid. En bredare syn på kulturarv. Pusselbitar i ett pussel som vi håller på att lägga hela tiden, men där vi inte vet vilka bitar som behövs i framtiden.
(Första inlägget från en besökare modereras som standard i museets bloggar. Nu har du skrivit ett och får dina kommentarer direktpublicerade.)
Åsa: Visst måste vi även arbeta med hur data kan användas i forskningen. Den diskussionen vore intressant att ta tag i. SHMM har sökt pengar bl annat för detta i Riksbankens Jubileumsfond…
Lars L
23 september, 2010Det skulle vara intressant att ha ett seminarium/workshop och samla grävfirmor och forskare/studenter inom facket och rodda kring detta.
Nuläget – sia om framtiden.
Åsa: Är detta ämnet för vår session på Nordic TAG? Behöver arkeologin sätta in en utbildningsstöt för att peka på de nya möjligheter som elektronisk dokumentation öppnar? (Återkommer om Forskarråds-frågan, sitter fats i en massa byråkrati…)
ArchAsa
26 september, 2010Lars – det är definitivt något jag skulle vilja se hos bidragen till sessionen. Lite visioner och konkreta förslag om vartannat.
Nils W
27 september, 2010Länkarna ”del 1: System Error? och del 2: Nya informationsflöden för arkeologiska undersökningar?” är döda, fel adresser?
Ulf Bodin
27 september, 2010Tack Nils! Jag hoppas att länkarna funkar nu.
Daniel Löwenborg
4 oktober, 2010Hej, jätteintressant detta! Jag håller med om att det är angeläget att göra något åt denna katastrofala situation så snart som möjligt. Apropå worskhop så tänkte vi ta upp lite om dessa frågor vid uppstartsmötet till CAA-SE som vara i Göteborg nu på fredag 8 okt. Bland annat kommer (förhoppningsvis) några från SND (http://www.snd.gu.se/) vara med, och eventuellt skulle SND kunna vara del i en dellösning av detta problem, kanske i ett uppstartsskede i alla fall, och de har mycket kompetens på området. Mötet på fredag är öppet för alla, så vill ni veta med så kontakta mig så kan jag vidarebefordra info – daniel.lowenborg@arkeologi.uu.se.
Ulf Bodin
6 oktober, 2010Spännande att ni tar upp frågan. Återkom gärna här med information om hur diskussionen gick.
Två viktiga startfrågor för mig är det första vägvalet: Är Grävlagret en frivillig, gemensam Open Contentlösning där man ser de grävare, forskare, museer, LST och RAÄ som en community som gemensamt och inte så formellt sköter sitt uppgrävda kulturarv eller är det en mer formell arkivfråga där vi förlitar oss på att våra befintliga strukturer kan anpassas för uppkomna nya behov. Jag tror att detta vägval påverkar utvecklingstakt och själva processen ganska mycket.
Ulf Bodin
16 oktober, 2010Nu finns det en diskussion på CAA-SE på LinkedIn som diskuterar frågan om undersökningsdata. Om ni är på LinkedIn så kan ni väl ansluter er till CAA-SE och gå in på: http://www.linkedin.com/groups?gid=3441065
Phil Buckland
15 december, 2010Hej!
Intressant och lovande, MEN att lösa hela miljöarkeologi datalagringen med en ”Ekofakt” låda är en enorm föränkling av denna typ av datas komplexitet. På Miljöarkeologiska laboratoriet håller vi på att utveckla en databas med över 120 (högt normaliserade) tabeller, för att täcka in komplexiteten och variationen. Fynden av pollenkorn, fröer, insekter, ben o.s.v. har väldigt lite gemensam med arkeologiska fynd egentligen.
Har du möjligheten att dela med dina funderingarna kring detta?
Mvh
Phil
Ulf Bodin
15 december, 2010Jo, data är lite mer komplexa än dessa rutor. Det gäller ju samtliga rutor. Men den modell som ligger nära att använda för ett grävlager, dvs ett XML-repository (RDF) där varje ”post” lagras som en ”sida” uppbyggd av dataelement (i stället för ”fält”) i gemensamma och egna namespaces, så är det fullt möjligt att hantera mycket komplexa och variationsrika data och damtidigt behålla generell samstämmighet och gemensamma klasser. Med en sådan lösning får man en flexibel lagringsmiljö och full sökbarhet och en god förutsättning att göra utleveranser av mer rad- och kolumnorienterade dataset med önskade element i ett antal standardformat som användarna kan bruka.
Det komplexa och svåra att hantera är inte variationen och det individuella. Det svåra är att hitta det som ska vara gemensamma informationshorisonter i en så stor och variationsrik datamängd där många arbetar på olika sätt och med olika termer.
Sedan är det väl så att det i första hand är ett grävlager för primära undersökningsdata och deras tolkningar. Data om funna entiteter kan leva vidare och lagras även i andra system, som exempelvis beskriver miljöarkeologiska data. Exempelvis kommer massor med föremålsinformation fortfarande lagras och hanteras i museisystem. Det fina i kråksången är att data med hjälp av RDF kan knytas ihop från olika system i ett gemensamt länkad dataset (Linked Data). Grävlaget ger då globala identiteter (URI:s) till entiteter på undersökningarna som vi som hanterar kringinformation använder när vi tillför info.
CAA-SE om arkeologiska data at Digitala museer
2 februari, 2011[…] för fältarkeologin som inbegriper ett översiktligt undersökningsregister och ett gemensamt datalager för arkeologiska undersökningsdata. Efter workshopen är det tydligt att det finns fler som delar […]