Vårblommorna har slagit ut och nästan som allt surrande som hörs från alla nyvakna insekter hör vi AI, AI, AI i alla debatter inom digitalt kulturarv. Även i månadens artiklar spelar tekniken en dominerande roll, från att vara ett verktyg till problemen AI skapar i tillämpning på kulturarvsdata.
Aron är också intervjuad om digitala museisamlingar i Svenska Fotografers förbunds artikelserie om fotografiet 200 år. Den artikeln heter Tillgång före perfektion.
Månadens artiklar
Morgonen den 15 oktober ifjol stod plötsligt Stockholmskällan utan sin bild- och ljuddatabas. En AI-skanning på andra sidan Atlanten räckte för att slå ut tillgången till historiskt material, och blottlade hur sårbara museer är när kontrollen över digitalt innehåll ligger hos externa teknikleverantörer. Samuel Branting på Stockholmskällan berättar om vad som egentligen hände.
I det nordiska forskningsprojektet CODICOM utforskas medeltida fragment som finns fördelat över hela Norden. Med nya forskningsmetoder från både naturvetenskapen och digitala humaniora vill man kartlägga hittills okända aspekter om kulturen mellan 1000- och 1500-talet. Albin Larsson från Riksarkivet beskriver hur de extraherar information från inskannade katalogkort med hjälp av AI.
🔗 Digitalt Museum har lanserat version 5.0, som förutom en visuell uppfräschning även innehåller ett AI-baserat sökverktyg. Den senaste större utseendesförändringen, version 4, släpptes i november 2016, alltså för tio år sedan.
Är du sugen att skriva en recension av den nya versionen? Hör gärna av dig!
🔗 I projektet SMK Data Visualized utforskar och visualiserar masterstudenten Victor Nordquist samlingsdata från Statens Museum for Kunst (SMK) i Köpenhamn. Webbplatsen bygger på innehåll skördat från SMKs API och gjordes inom ramen för kursen Digital konstvetenskap II på Masterprogrammet i digital konstvetenskap vid Uppsala universitet.
🔗 Riksantikvarieämbetet har nu öppnat upp e-kurserna i Digitala museilyftet så att vem som helst kan genomföra dem. Utbildningsprogrammet består av åtta e-kurser som ur olika perspektiv beskriver digitalisering av kulturarv och digital omställning av verksamheter.
Lunds universitet söker en mjukvaruutvecklare inom forskningsinfrastruktur med AI-inriktning till ett forskningsprojekt som syftar till att transkribera och sammanlänka historiska individdata för hela Sveriges befolkning från år 1800 och till (cirka) 1950. 100%, tillsvidare. Sista ansökningsdag 24 maj.
Morgonen den 15 oktober ifjol stod plötsligt Stockholmskällan utan sin bild- och ljuddatabas. ”Stockholms historia i ord, ljud och bild” var tömd på både ljud och bild. En AI-skanning på andra sidan Atlanten räckte för att slå ut tillgången till historiskt material – och blottlade hur sårbara museer är när kontrollen över digitalt innehåll ligger hos externa teknikleverantörer. Händelsen påminner om varför institutioner måste ha koll på ägande och backup av sina digitala samlingar.
Skärmbild av Stockholmskällan efter att alla bilder raderats från den bakomliggande molntjänsten.
För användarna framstod det som om sajten hade tömts – som om historien raderats på innehåll. En AI-baserad skanning, utförd i Kanada, hade flaggat ett fotografi som potentiellt olagligt. Rapporten gick vidare till Microsoft, den globala molntjänstleverantör som tillhandahåller Stockholmskällans innehåll, som enligt sina rutiner stängde ner hela mediadatabasen helt utan förvarning.
I efterhand blev det tydligt att det handlade om en klassisk krock mellan kulturarv och automatiserade regelverk. Material som i ett historiskt sammanhang är fullt legitimt – exempelvis äldre fotografier med nakenhet – kan av algoritmer feltolkas som olagligt innehåll. Och när systemen är kopplade till globala regelverk kring exempelvis CSAM finns liten marginal för nyanser.
Tack vare backuper återpublicerades de allra flesta material inom loppet av några timmar, och genom dialog med Microsofts företrädare i Norden kunde hela webbplatsen rulla som tidigare efter en vecka. Men händelsen aktualiserade en rad frågor: Vem äger egentligen det digitala materialet? Vem har makt att stänga ner det? Och vilka konsekvenser får det för det fria kunskapsutbytet?
Det är lätt att tänka på digitalisering som en garanti för tillgänglighet. Men i praktiken innebär det ofta ett ökat beroende av externa infrastrukturer – ofta ägda av multinationella techbolag. När lagringen sker i molntjänster där juridik, teknik och policy styrs från andra länder, kan lokala aktörer hamna i ett underläge.
Samtidigt är det viktigt att understryka att problemet inte bara är tekniskt. Det är också publicistiskt. Stockholmskällans uppdrag är att visa historien i sin fulla komplexitet – även det som kan uppfattas som obekvämt. Material som berör rasism, stereotypa framställningar eller nakenhet kan vara centralt för att förstå det förflutna. Så hur gör vi det utan att självcensurera oss av rädsla för att förlora tillgången till det digitala kulturarvet. Hur går vi vidare?
Erfarenheterna från Stockholmskällan pekar på två huvudspår. För det första krävs redaktionella åtgärder i form av utbildning och tydliga riktlinjer för publicering. För det andra krävs tekniska åtgärder, där robusta backuplösningar är avgörande.
En central lärdom är behovet av att ha flera olika typer av backup. Lokala kopior, alternativa servrar och redundanta lagringslösningar kan göra skillnaden mellan ett tillfälligt avbrott och en total förlust av data. Att förlita sig på en enda leverantör innebär en risk.
Händelsen med Stockholmskällan visar att digitalisering inte bara handlar om att göra material tillgängligt. Det handlar också om kontroll, ansvar och beredskap. Frågan är inte bara vad som finns i samlingarna – utan vem som har makten över dem.
Därför är budskapet lika enkelt som avgörande: Ha koll på vem som kontrollerar era digitala filer – och se till att alltid ha fungerande backuper.
Har ni inskannade katalogkort? Eller inskannade tabeller? Att extrahera texten med OCR eller HTR har länge varit ett mål för många. Extraherar man bara texten ur katalogkort och tabeller för att göra sådan information sökbar förlorar vi ju fortsatt information. Katalogkort och tabeller har ju namngivna fält som man vill kunna använda för att filtrera, validera och få statistik om innehållet. Hur gör man då?
Projektet CODICUM utforskar betydelsen av de cirka 50 000 medeltida manuskriptfragment som finns i Norden och de böcker de en gång utgjorde. Med naturvetenskapliga metoder såväl som med data driven humaniora hoppas forskare hitta nya kopplingar mellan verk och författare. Datan om fragmenten är i Norden är lika fragmenterad som fragmenten själva och i några fall måste man utgå ifrån kataloger skrivna på maskin. I denna artikel tar vi upp hur vi i ett fall gick ifrån inskannade kataloger till strukturerade data med hjälp av multimodala språkmodeller.
Utmaningen
Inom CODICUM-projektet har vi forskare som vill forska på de medeltida handskriftsfragment som finns i Danmark, men en stor del av fragmenten finns bara beskrivna i inskannade kataloger. Vi behövde inte bara få ut texten ur dessa dokument utan vi behövde göra dessa bildfiler till riktiga kalkylark som forskarna kunde använda för att bygga vidare på.
Utsnitt ur en inskannad katalogtabell.
Lösningen
Det är här multimodala AI modeller kommer in. Multimodala AI modeller är inte tränade att bara förstå text eller bild utan kan förstå flera typer av media, samtidigt. Idag kan majoriteten av flaggskeppsmodellerna ifrån teknikjättarna förstå flera typer av media. I vårt fall landade vi på Googles modell Nano Banana (Gemini 2.5 Flash Image), trots att modellen främst är avsedd att användas för bildgenerering och -redigering.
För att få ut strukturerade data, klara att importeras till Excel, gav vi Nano Banana-modellen en av bilderna som vi ville ha processade tillsammans med vår instruktion/prompt:
”Följande bild innehåller en tabell, ignorera allt utanför tabellen. Tabellen har fyra kolumner: fragment_nummer, datering, innehåll(kodex), och proveniens.
Konvertera allt i tabellen till CSV, använd , för att separera värden och “ för att avgränsa värden oavsett om det behövs eller ej.
Tabelltexten är på danska, ignorera eventuella helradsrubriker.”
Låt mig bryta ner instruktionen i dess beståndsdelar.
”Följande bild innehåller en tabell, ignorera allt utanför tabellen.”
Vi gav modellen skannade sidor som kunde innehålla kommentarer, fotnoter med mera. För att slippa beskära bilderna manuellt så fick vi skriva ut detta explicit.
”Tabellen har fyra kolumner: fragment_nummer, datering, innehåll(kodex), och proveniens.”
Endast den första sidan innehöll tabellens rubriker. För att modellen alltid skulle tolka kolumnerna likadant även när den inte sett rubrikerna fick vi skriva ut även detta explicit.
”Konvertera allt i tabellen till CSV, använd , för att separera värden och ” för att avgränsa värden oavsett om det behövs eller ej.”
Formatet CSV som vi valde kan skrivas på lite olika vis och detta ser till att det görs konsekvent så att det blev enkelt för oss att slå ihop resultatet till ett dokument.
”Tabelltexten är på danska, ignorera eventuella helradsrubriker”
Ibland noterade modellen att texten var på danska. Genom att skriva ut det explicit så hade varje körning samma information. Ibland förekom helradsrubriker i tabellen; dessa ville vi exkludera.
Har man inte så mycket innehåll hade man kunnat komma undan med en kortare instruktion, men vi hade hundratals bilder och kunde inte låta modellen hålla alla bilder samt in- och ut-data i minnet/kontexten. Hade vi kunnat låta den ha allt i minnet hade vi till exempel inte behövt ange kolumnerna explicit, den hade helt enkelt sett rubrikerna en gång och haft de i åtanke gång på gång.
Resultatet
Ifrån avsnittet ovan så ser CSV resultatet ut på följande vis:
Trots det goda resultatet finns det fallgropar att se upp för.
Tips
Testa er fram med olika modeller. Marknaden ändras hela tiden och de presterar olika i olika sammanhang. Den modell som vi använde för bara några månader sedan finns inte längre tillgänglig.
Kom ihåg att denna typ av modeller kan hallucinera och regelbundet kommer att rätta stavfel och gammalt språk. Om syftet är bevarande ska man kanske använda annan teknik.
Inte alla hallucinationer är “positiva”, i vårt fall hade modellen ibland svårt att upptäcka brott i löpnummerserier och dylikt där innehållet gick på tvärs med ett regelbundet mönster.
Dela inte känsliga eller skyddade data med externa tjänster.
Tjänster såsom Google AI Studio, Claude.ai, etc är bra för att testa men de erbjuder också lösningar som gör att utvecklare kan automatisera sådana här arbetsflöden.
Vi konverterade till CSV för att vi ville ha kalkylark, men inget hindrar en att välja andra format. Kanske ett format som gör det möjligt att importera till ett specifikt system eller en tjänst är mer lämpligt för er?
En ny månad, ett nytt KOD-brev! Utvilade efter en långhelg dyker vi in i de senaste nyheterna och tips från vår omvärldsbevakning inom digital utveckling i kulturarvssektorn.
Månadens artikel
Larissa har sammanställt fem rekommendationer hur man kan arbeta med skärmar i kulturorganisationer, från enkla digitala informationsskyltar till mer avancerade interaktionsgränssnitt. Vägledningen innehåller praktiska råd och övningar för hur man kan utvärdera och analysera skärmar och deras gestaltning och placering.
🔗 I boken Negotiating Digital Heritage Infrastructures undersöker Quoc-Tan Tran några svenska kulturarvsinstitutioners digitala infrastruktur, däribland Alvinkonsortiet och Riksantikvarieämbetet.
🔗 I den norska museivärlden pågår en debatt om (norska) Kulturrådets projektfinansiering, där samlingsförvaltningsbolaget KulturIT tar emot en stor del av de utdelade medlen. För den som vill läsa: For få midlar til digital utvikling (Tidsskriftet Museum).
🔗 I Tyskland har projektet DigiCulture tagit fram en digitaliseringsvägledning med fokus på små till mellanstora institutioner. Man har kunnat konstatera att de stora institutionerna oftast får mest uppmärksamhet, men är oftast ingen användbar förebild för mindre organisationer, i och med att utgångsläget ser så olikt ut.
Uppsala universitetsbibliotek söker en bibliotekarie till avdelningen för lärande och forskningsstöd. 100%, tidsbegränsad anställning. Sista ansökningsdag 22 april.
Riksantikvarieämbetet har annonserat olika tjänster inom bibliotek och arkiv: en bibliotekarie med fokus på digitala tjänster och erbjudanden (100%, tillsvidare) och en arkivarie (100%, vikariat).
Inom forsknings- och digitaliseringsprojektet om ”Riksantikvarieämbetets- och Vitterhetsakademiens äldsta historia” mellan KB, RAÄ och Vitterhetsakademin har olika tjänster utlysts som har digital fokus:
Järnvägsmuseet i Gävle söker en museiassistent med uppgifter inom digitalisering och magasinsarbete. 100%, visstidsanställning. Sista ansökningsdag 26 april.
Københavns Stadsarkiv söker en datamanager. Visstidsanställning, 100%. Dessutom söks en digital arkivarie, tillsvidareanställning, 100%. Sista ansökningsdag 12 april.
Kalender
🗓️ 21–23 april: Sveriges museers vårmöte (Uppsala). Sista anmälningsdag 20 mars för att delta på plats, 10 april för att delta digitalt.
🗓️ 19–21 maj: Publik och Praktik. Riksantikvarieämbetet ordnar workshop och seminarium om att använda AI i publika miljöer. Intresseanmälan senast 31 mars.
Om digital informationsförmedling i det fysiska rummet
Hur förmedlar vi relevant information med hjälp av skärmar till den fysiska besökaren? När jag mötte Stockholms stadsbibliotek i deras EU-finansierade projekt Digitalt kompetenslyft hade jag anledning till att fördjupa mig i ämnet. Här kommer mina tips om hur skärmar kan användas till deras fulla potential.
Skärmar gör vissa saker enklare – och andra svårare
Jag har jobbat i ett antal år med ämnet som ibland kallas för digital skyltning (från engelska digital signage) eller mer specifikt utställningsskärmar. Till följd av det innehåller min kamerarulle en hel del skärmar i offentliga miljöer och i kulturinstitutioners korridorer. Museibranschen använder skärmar mycket i utställningar, bibliotekssektorn i entréer och i receptioner har skärmar en självklar plats i många branscher med publikkontakt. En aspekt som förenar de olika branscherna är att det finns väldigt lite referensmaterial och upparbetade standarder. Det beror delvis på att de skiljer sig i interaktionsnivån från en ren informationsskylt (envägskommunikation) över en pekskärm till en hel installation som styrs t.ex. via sensorer.
Ofta är uppstartskostnaden jämförelsevis hög (i många fall krävs det en nyinköpt mjukvara för att smidigt styra innehåll på skärmarna samt skärmar som finns i många olika kvalitéer) och arbetssätten är inte alltid upparbetade när skärmen skruvas fast och kablarna monteras fast. I en tidigare artikel har jag redan skrivit om digitala skärmar i utställningar och vilka grundläggande utmaningar som finns med skärmar som informations- och interaktionsytor. Artikeln fick ett utmärkt svar av Wilhelm Lagercrantz som underströk att skärmar som förmedlingskanal inte har fått den uppmärksamheten som de kanske förtjänar.
Därför vill jag gärna lyfta blicken från just utställningsskärmar och närmar mig skärmen som kontaktyta till publiken mer grundläggande.
En kommentar direkt här i början: Jag har letat i flera omgångar, men inte hittat en enda resurs som närmar sig just skärmar som medium i offentliga inomhusmiljöer, men jag och alla andra nyfikna blir jätteglada om ni länkar till bra resurser i kommentarerna!
Låt oss börja med mina fem huvudregler för hur vi skapar bättre skärmar för besökarna på bibliotek, museum och arkiv!
1. Välj rätt format
First things first: Skärmar behöver inte alltid vara rätt svar på frågan: Hur når vi fram med innehållet? Det kan i många fall vara mer effektiv med en plottertext, en affisch eller en annan grafisk form för att att få fram relevant information till besökaren. Detta gäller särskilt i utrymmen där det redan finns en hel del rörelse, ljud och intryck som tar upp besökarens uppmärksamhet.
När är en skärm en bra kommunikationskanal?
Om ni har en begränsad yta på väggen, men behöver få fram olika informationsbitar (t.ex. i receptionen: öppettider, entréavgift, dagens program och kanske menyn i restaurangen). Här gäller det att vara selektivt. För många olika typer av information eller roterande slides kan skapa problem, t.ex. när besökaren inte vet vilken information hen kan förvänta sig från att vänta på nästa slide, eller när det tar mycket tid till samma slide upprepas.
Om ni vill skapa interaktion. Här har andra kanaler i fysisk format ofta begränsningar.
Om ni vill ge möjlighet till fördjupning, men där utrymmet är begränsat, t.ex. i utställningar.
I alla dessa fall krävs det dock en hel del om man vill uppnå målet: att besökaren stannar till och tar in informationen på skärmen eller interagerar till och med med innehållet.
Om ni har efter en avvägning mellan en skärm och andra kommunikationssätt kommit fram till att det ska bli en skärm, tänk på följande aspekter:
Rätt storlek Beroende på var besökaren står när hen kommer in i det fysiska rummet måste inte bara skärmen, utan även informationen på skärmen synas bra.
Skärmens tillgänglighet Tänk på möjligt blänk (särskilt om den står i ett rum med dagsljusinfall eller med placering bakom glas), kontrast, typsnitt och -storlek. Det finns inga standarder just för skärmar i offentliga miljöer, men utifrån definitionen för tillgängliga medier ska de vara möjliga att uppfatta, hanterbara, begripliga och robusta. Bra utgångspunkter för detta kan vara WCAG-standarden, DIGG-webbriktlinjerna och lagen om tillgänglighet till digital offentlig service (DOS-lagen). Använd verktyg som accessible-colors.com eller contrastchecker.com för att testa hur bra kontrasten mellan text- och bakgrundsfärgen är.
Skärmens roll i kommunikationen med besökaren Alla element på en skärm kommunicerar något, alla ord, all formgivning, alla bilder (avsiktligt eller oavsiktligt). Det kanske bästa exemplet är vad en trasig skärm kommunicerar: att en process inom organisationen inte fungerar som den ska. Om det bara finns en låg sannolikhet att besökaren inte vet hur hen ska ta till sig informationen på skärmen eller hur hen ska interagera med den kommer hen inte vänta och experimentera i många fall, utan hen kommer ge upp eller, om informationsbehovet är tillräckligt stort, fråga personalen. Förklara alltså ditt budskap och besökarens förväntade interaktion så tydligt som möjligt. Se skärmen som ett samtal mellan institutionen och besökaren och forma orden på samma sätt som du skulle prata med en besökare.
2. Välj rätt plats
Förbudsskylt på dörr på Kilsgatan 14, 1982. Okänd fotograf, Örebro stadsarkiv, CC BY.
Alldeles för många skärmar gestaltas vid skrivbordet, utan att ta hänsyn till om informationen placeras rätt i förhållande till besökarens användarresa. Jag vill verkligen uppmana att ta sig till det fysiska utrymmet och analysera på plats vart besökaren kommer titta, vilka frågor hen har just precis där den står när den ska titta på din skärm och vilka andra element som lockar fokuset till andra stimulanser.
Jag brukar fota utrymmet exakt från punkten där besökaren står och går för att verkligen kunna fånga upp alla element som spelar roll för hur stor sannolikheten är att skylten och besökarens intresse och uppmärksamhet möts.
Om du kan ställa eller sätta ner dig i utrymmet där du vill ha din skärm kan följande frågor vara hjälpsamma för analysen:
Hur rör sig människorna genom utrymmet?
Var stannar de?
Vart tittar de?
Hur väl är deras rörelser och uppmärksamhet synkade med befintliga skyltar?
Om ni ser någon som faktiskt tar till sig information på en skylt, en väggtext eller en skärm, hur länge stannar de vid?
Vilka distraktioner finns i närheten i form av ljud, rörelse, färger eller aktiviteter?
Kan du identifiera ytor i rummet som är lugnare eller mer utsatta för rörelser och ljud?
Om du kan hitta svar på dessa frågor (och be gärna en kollega och en extern person att bolla tankar om utrymmet) kan du lättare hitta den perfekta placeringen för en förmedlande skärm. Gå gärna till utrymmet under olika delar av dagen, på veckodagar och helgen.
Oavsett om du vill att skärmen förmedlar information som envägskommunikation eller om du vill skapa en mer interaktiv skärm: tänk på att besökaren ska kunna stanna till och ta till sig information. Skärmen ska inte störa besökarflödet genom utrymmet, till och med när flera personer tittar på skärmen (särskilt vid längre videoformat eller många roterande slides). Om besökaren faktiskt ska interagera, t.ex. via en pekskärm, gör det attraktivt att stanna till genom att skapa en möjlighet att sitta ner. Tänk också på att inte placera skärmen för högt, det kan antingen bli obekvämt om man behöver titta eller läsa längre och kan bli otillgängligt för människor i rullstol och barn.
3. Känn din målgrupp
Beroende på vilket utrymme du väljer kan denna aspekt vara klurig. Om det är en allmän entré till ett kulturhus med många olika organisationer och målgrupper kan detta bli mycket klurigare än ett rum i en utställning med en prioriterad målgrupp. Oavsett kan det vara bra att reflektera över hur relevant ditt innehåll är för besökaren. Ett av de större misstagen som man kan göra när man gestaltar innehållet till en skärm är att bli glad över att det inte längre finns några begränsningar i hur mycket information man kan stoppa ner i en skärm, alltså t.ex. all text som inte fick plats bland väggtexterna, men som kollegorna ändå vill få med någonstans. Helst ska en skärm alltid ha ett tydligt syfte och då begränsas till ett ämne, en interaktion eller ett användarfall.
Fundera därför på:
Hur viktig är den information som ni vill nå ut med för din målgrupp? Är det frågor som verkliga besökare har ställt i samma eller liknande situationer? (Det här är ett av många tillfällen där man med fördel kan bolla tankar med kollegorna i receptionen.)
Hur väl känner ni målgruppens intressen, behov och förutsättningarna? Finns de där skylten står?
Nischade målgrupper är bara en del av alla som rör i ett offentligt utrymme. Hur ser ni till att de känner sig adresserade? Särskilt om skylten inte kan direkt interageras med via en pekskärm är detta viktigt med tanke på vilka språk som används på skärmen.
Hur ofta dyker besökarna upp själva, hur ofta i grupp? Detta har stor påverkan på hur benägen besökaren är för att spendera tid ensam vid en som bara tillåter interaktion med en person och där besökaren förväntas spendera en till flera minuter för att ta till sig text, bild, video eller liknande.
De flesta av oss som jobbar i kultursektorn är på ett eller annat sätt yrkesskadade. Så oftast är man själv inget bra genomsnittsexemplar på en biblioteks- eller museibesökare. Men försök att observera dig själv i situationer där du passerar information i skylt- eller skärmformat, hur länge stannar du och hur länge försöker du att bara ta till dig information med hjälp av en skärm om du inte direkt får det svaret du letade efter?
Detta kan du sedan också använda när själva innehållet till skärmen ska tas fram. För skärmar gäller mycket av det som rekommenderas för tillgängliga webbsidor eller appar, men några grundläggande regler tål att upprepas:
Skriv det viktigaste eller huvudaspekten först och presentera ditt innehåll i en meningsfull ordning.
Markera rubriker tydligt och avgränsa dem från löptext.
Testa om innehållet kan läsas inom 10 till 15 sekunder (om det tar längre tid att läsa allt på en sida, eller när besökaren själv ska scrolla igenom en text, tänk på att du måste få hen att verkligen lägga sin tid på denna interaktion på mycket kortare tid, direkt i början).
Använd inga facktermer eller jargong.
Placera text helst inte framför en bild för läsbarhetens skull. Detta är särskilt viktigt om skärmen gestaltas på en annan skärm. Där kan sidoförhållandet vara annorlunda, och på en större skärm kan texten plötsligen hamna i en annan sektion av bilden.
Välj ett lättläst typsnitt.
Använd inte enbart färg för att förmedla information. Grön, röd och brun eller blått och lila kan vara svårt att särskilja för människor med nedsatt synförmåga eller färgblindhet.
Om det finns video med tal eller ljud, använd undertexter. Särskilt relevant om ljudet inte spelas upp automatiskt, utan att besökaren behöver använda hörlurar eller liknande. Om alla är upptagna kommer det inte finnas något bra sätt att ta till sig informationen i videon överhuvudtaget.
Undvik snabba växlingar och flimmer.
Be olika människor att läsa innehållet per bild om du använder roterande slides (t.ex. barn, äldre människor, människor med svenska som andra språk). Se till att den varken roterar för snabbt eller långsamt.
Om det finns många delar i ett och samma skärm eller moment, visa upp förloppet (t.ex. slide 1 av 20, grafiska element som visar hur många procentdelar av videon som har visats).
Om du vill locka besökarens uppmärksamhet till skärmen kan det vara bra att använda animationer eller rörligt innehåll. Men var försiktigt med för mycket rörligt innehåll i ett och samma utrymme, det kan snabbt uppfattas som rörigt eller omöjligt att välja mellan alla stimulanser.
Jag kan varmt rekommendera att göra en övning tillsammans med kollegor där alla tar med sig ett foto på en skärm eller en skylt som ni har träffat på i ett offentligt utrymme. Diskutera tillsammans:
Hur effektivt kommunicerar skylten det bakomliggande budskapet?
Finns det element som distraherar från detta budskap? Hur hade det kunnat undvikas?
Hur väl är den anpassat för den faktiska målgruppen?
Hur väl funkar skylten i sin omgivning?
4. Var realistisk angående din organisations resurser
En av de bästa aspekterna med skärmar jämfört med andra format för informationsförmedling är att de kan anpassas med tiden.
Det är också en av deras sämsta aspekterna.
När en affisch tas fram säger ingen ”Det där kan vi förbättra med tiden!” eller ”Det där saknas fortfarande, men det fixar vi efter invigningen”. Ja, skärmar kan anpassas och förbättras, men det krävs att vi avsätter realistiska resurser i form av arbetstid, regelbundet och vid incidenter. Inget är så tråkigt som en svart skärm med en skylt ”Ur funktion”.
Involvera alla berörda medarbetare när ni väljer mjukvara för skärmarnas innehåll och styrning. Alla som behöver anpassa innehåll behöver få en introduktion. Kolla med kollegor på andra organisationer vilken mjukvara de har, hur de upplever supporttjänsten, vilken användarstatistik tjänsten producerar, hur stabilt tekniken fungerar och hur ofta tekniker behöver rycka in för att lösa problem.
Oavsett hur många skärmar det ska finnas från början och hur många som kommer till, välj tidigt ut en medarbetare som objektspecialist som håller koll på uppdateringar, som kan utbilda fler och som kan lyfta delar av produkten som ni inte använder än. Om det kommer fram att dessa resurser inte finns internt kan det vara bra att överväga om ni ska installera fasta skärmar.
Planera också in hur ofta informationen ska anpassas och förändras och vem som ska göra det. Dessutom kan det vara bra att ha en rutin på plats vem som ska hålla koll på skärmarna (vakt eller receptionspersonal?) och vad som är plan B om de en morgon bara inte vill vakna till. För den dagen kommer alltid.
Att utvärdera känns som en självklar del av många arbetsprocesser, men den verkar också vara just den som prioriteras ned när tidsbrist uppstår. Det är dock nästan en av de viktigaste, för att kunna utvecklas och förbättras, både som medarbetare och för arbetsprocesser.
Oavsett om det är en temporär installation eller en skärm som ska tillsvidare står på samma ställe: planera in utvärderingar efter fasta tidsintervaller (t.ex. efter fyra veckor, tre månader, ett år). Bjud in alla berörda kollegor, särskilt i yrkesgrupper med mycket publikkontakt. Gör utvärderingar som korta intervjuer med besökarna. Metoder som deltagande observation kombinerad med fotodokumentation kan vara ett bra tillägg till användarutvärderingar.
Som vanligt brukar en blandning av kvantitativ data i form av statistik och kvalitativa analyser som intervjuer och deltagande observation blir mest användbar.
Nu är jag nyfiken: Vad är dina lärdomar från att arbeta med skärmar i utställningar, på bibliotek och arkiv?
Vårdagsjämningen närmar sig och den värsta vinterkylan kanske är förbi. I månadens nyhetsbrev blickar vi framåt mot våren men också mot höstterminen – kanske dags att fortbilda sig om digitalt kulturarv på något svenskt universitet? Vi blickar också tillbaka på Wikimedias digitala statistik från 2025 och hur den används av svenska museer.
Månadens länktips
🔗 Riksantikvarieämbetets museiavdelning har satt samman ett stöd till god AI-implementering på museiområdet. Dokumentet går igenom ett antal användningsområden där AI kan användas av museer och museipersonal (men missar den kanske vanligaste användningen: maskinöversättning) och tar upp möjligheter, risker och juridiska och etiska aspekter att ta hänsyn till.
🔗 Är du nyfiken på vad museer laddar upp för kod till Github? Calle Stenfelt är interaktionsdesigner på Bazooka och skickar varje vecka ut det AI-genererade nyhetsbrevet AmuseAlot.
För dig som längtar tillbaka till skolbänken har Aron tittat igenom universitetens kursutbud inom digitalt kulturarv. Förutom några intressanta distanskurser går det även att fortbilda sig inom digitalt kulturarv i Lund, Umeå, Göteborg och Kalmar. Universiteten öppnar antagningen för hösten 2026 den 16 mars och sista anmälningsdag är den 15 april.
I Sveriges museers rapport Museerna tappar marginellt – men når rekordpublik digitalt rapporterade 29 museer att de hade sammanlagt 376 miljoner visningar under 2025 på Wikimediaplattformarna, nästan en fördubbling av siffrorna ifrån 2024. Hur uppstår dessa siffror och kan de verkligen stämma? Albin Larsson redogör för hur statistiken samlas in och önskar sig att museerna visar mer aktivt engagemang för gemenskapen som hanterar deras filer.
Wikimedia Sverige söker en projektledare för utbildning och lärande. Projektanställning på 100 % i 18–24 månader med möjlighet till förlängning. Sista ansökningsdag 15 mars.
Statens museer för för maritim-, transport- och försvarshistoria söker en digital strateg. Tillsvidareanställning, 100%. Sista ansökningsdag 22 mars.
Östergötlands museum söker en arkivarie. Tillsvidareanställning, 80%. Sista ansökningsdag 23 mars.
Göteborgs naturhistoriska museum söker en intendent för att tillgängliggöra samlingsdata kopplade till museets prioriterade samlingar av spindlar, insekter och mollusker. Projektanställning fram till årsslutet. Sista ansökningsdag 8 mars.
Göteborgs stad söker sommarpraktikanter som arkivassistenter för arbetsuppgifter inom digital arkivering mellan 8 juni till den 31 juli. Sista ansökningsdag 9 mars.
Bane NOR söker en arkivrådgivare för historiska arkiv i Hamar. Tillsvidareanställning. Sista ansökningsdag 2 mars.
🗓️ 21–23 april: Sveriges museers vårmöte (Uppsala). Sista anmälningsdag 20 mars för att delta på plats, 10 april för att delta digitalt.
Månadens bild
Vi vill också tipsa om en lyckad digital interaktiv station! Aron har passat på att besöka Nordiska museets nya fotoutställning Nordiska ögonblick, där tre av sju rum vigs åt digitiserat foto medan de återstående fyra är storutskrifter av vattenskadade negativ från vattenläckan i museet vintern 2021. Finast var de digitala fotoalbumen med dubbla inbyggda skärmar. På den högra skärmen/”sidan” visas tumnagelbilder/miniatyrbilder, på den vänsta en uppförstorad bild med kort bildtext. Snyggt, intuitivt och inbjudande!
Hur lär vi oss arbeta med digitalt kulturarv egentligen? Vi som jobbar med digitala metoder och verktyg inom kulturarvssektorn har ofta kombinerat en ”vanlig” humaniorautbildning med självstudier och arbetslivserfarenhet – och de senaste åren även med kurser i digital humaniora.
För dig som längtar tillbaka till skolbänken har jag tittat igenom universitetens kursutbud inom digitalt kulturarv. Universiteten öppnar antagningen för hösten 2026 den 16 mars och sista anmälningsdag är den 15 april.
På plats
I Lund ges kursen Digital historia (7,5 HP) med följande beskrivning: ”Hur påverkar digitala källor, digitalisering av kulturarv och digitala arbetssätt vårt förhållande till historisk kunskap? I kursen diskuterar vi detta utifrån både historiska undersökningar och förmedlingen av historia till en bredare publik.”
I Umeå ger Institutionen för kultur- och medievetenskaper (där museologi ingår) kursen Digitala metoder inom humaniora och samhällsvetenskap (7,5 HP), som ”ger en orientering i digitala metoder och forskning inom digital humaniora och samhällsvetenskap. I fokus ligger digitala forskningsmetoder och deras användningsområden i relation till samhällets, kulturens och kulturarvets digitalisering.”
Kursen Från kod till kritiskt tänkande: Problem i digital forskning och design (7,5 HP) på Göteborgs universitet förstår jag knappt ens själv vad den handlar om, men det låter onekligen intressant! ”Hur påverkar digitala metoder egentligen forskning, design och kunskapsproduktion – och vilka utmaningar följer med dem? I den här kursen får du fördjupa dig i de kritiska frågor som uppstår när digitala verktyg används inom humaniora, samhällsvetenskap och kulturarvsinstitutioner. Kursen följer hela projektprocessen: från hur data skapas och samlas in, till hur den analyseras och presenteras. Särskild vikt läggs vid frågor om teknologisk hållbarhet, komplexitet och tillförlitlighet, inte minst i relation till generativ AI och andra snabbt växande teknologier.”
Linnéuniversitet (campus Kalmar) ger kursen Teoretiska perspektiv på arkeologins och museernas digitalisering (7,5 HP). ”Efter avslutad kurs är du som student väl rustad att förstå och kommunicera kring hur digitaliseringen påverkar alla led av den arkeologisk praktiken, från fältarbete och dokumentation, via forskning och tolkning till kommunikation och förmedling genom exempelvis museer och olika digitala plattformar.”
På distans
Linnéuniversitet erbjuder flera kurser inom digital historia och digital humaniora. Digital historia: metoder, resurser och ontologier (7,5 HP) är en distanskurs på halvfart. ”Kursen tar upp frågan om vad digitalhistoria egentligen är samt ger en introduktion till ett urval av de olika digitala metoder som kan användas inom historieämnet för förmedling, forskning och analys både från ett digitalt och traditionellt perspektiv.”
Även Programmering för Digital Humaniora (som erbjuds i två versioner, 7,5 HP eller 15 HP) innehåller en hel del relevanta moment för den som vill laborera med digitalt kulturarv. ”Syftet med kursen är att introducera och diskutera grundläggande begrepp och tekniker för programmering inom området för digital humaniora.”
För den som arbetar med audiovisuellt arkivmaterial kanske Film, arkiv och digital kultur (7,5 HP) kan vara något? ”Kursen handlar om arkivfrågor och om digitalisering. […] Vad är viktigast: att se till att filmer bevaras och skyddas så att de kan överleva så länge som möjligt eller att tillgängliggöra dem och visa dem? Och vad innebär digitaliseringen för våra möjligheter att i framtiden uppleva och forska om äldre tiders film?”
Har jag missat någon relevant kurs? Hör gärna av dig, så kan jag komplettera innan det är för sent!
29 museer rapporterar via Sveriges museer att de hade sammanlagt 376 miljoner visningar under 2025 på Wikimediaplattformarna, nästan en fördubbling av siffrorna ifrån 2024.1 Samtidigt rapporterar Wikimedia Foundation, stiftelsen som driver Wikipedia och dess systerprojekt, att antalet läsare gått ner under samma period.2 Hur uppstår dessa siffror och kan de verkligen stämma?
Låt oss titta på vad Wikimedia Foundation faktiskt mäter, speciellt två värden är viktiga för att förstå denna statistik:
Antalet hämtningar av en mediafil
Antalet sidvisningar av en artikel eller en annan innehållssida
Den första siffran låter till en början hyfsat relevant. Antalet hämtningar av en mediafil bör vara en ganska bra indikator på hur mycket en bild eller fil faktiskt syns för en läsare, till exempel när någon läser en artikel på Wikipedia. Problemet med detta värde är tyvärr att den slutgiltiga siffran inkluderar automatiserad trafik, till exempel sökmotorers eller AI-verktygens skrapning av webben. Detta påverkar siffrorna i sådan grad att Wikimedia Foundation själva avråder ifrån att använda detta värde som en indikation på antalet visningar.3
Antalet sidvisningar av en artikel har ett ännu mer uppenbart problem. Denna indikator antar att en bild visas när en artikel visats som innehåller denna bild. Detta innebär att filen får en visning, även om läsaren kanske bara läste en rad eller två, eller så var artikeln väldigt lång och läsaren kanske aldrig såg bilden.
Museernas beroende av tillgängliga statistikverktyg
När museerna samlar in statistik om användning av mediefiler på Wikimedia-plattformar används främst tjänsterna GLAM Wiki Dashboard, Wikimedia Commons inbäddade statistik och BaGLAMa2. Dessa tre verktyg använder två helt olika metoder för att räkna ut antalet “visningar”.
GLAM Wiki Dashboard utgår ifrån den statistiken som Wikimedia Foundation publicerar på dumps.wikimedia.org. Under rubriken “Analytics Datasets: Mediacounts” finns statistik om hur ofta mediefiler som bilder, audiofiler eller videon har hämtats från Wikimedias servrar detta är samma siffror som Wikimedia avråder att man använder.
Båda Wikimedia Commons inbäddade statistik och BaGLAMa 2 använder sig av en och samma metodik. De kollar på alla sidor och artiklar där en fil används och räknar sedan ihop antalet sidvisningar för dessa sidor. Den ger en viktig indikation på hur ens media sprids och används, tyvärr så har den väldigt lite med faktiska “visningar” av mediafiler att göra.
Det blir uppenbart när man tittar på verkliga siffror från verktygen och jämför dem.
Enligt GLAM Wiki Dashboard visades Nordiska museets bilder 1,1 miljoner gånger under januari 2026. Enligt Wikimedia Commons inbäddade statistik visades samma bilder hela 2,4 miljoner gånger.
Men om GLAM Wiki Dashboard utgår ifrån antalet hämtningar, hur kan bilderna ha visats mer än dubbelt så många gånger i artiklar utan att ha hämtats?
När någon läser en Wikipedia-artikel så laddas bara bilderna in som syns på skärmen. Först när man läser vidare så laddas successivt fler bilder in. Majoriteten av sidvisningarna kommer ifrån ett fåtal mycket populära artiklar som då också tenderar att vara mycket längre, vilket i sin tur betyder att dessa bilder syns få gånger, samtidigt som de bidrar mycket mer till statistiken. Detta kan också vara en strategi för en GLAM-institution som vill rapportera höga siffror i sin statistik, att lägga till egna bilder i artiklar på olika språkversioner som får många visningar. Ett exempel från Nordiska museet finns bland deras mediefiler mest flest visningar, ett foto på björnjägare som dyker upp i olika språkversioners översiktsartiklar om just björnar, till exempel på engelskspråkiga Wikipedia (ni kommer behöva skrolla ner en bit). Artikeln visas helt enkelt väldigt mycket men få läsare ser någonsin bilden.
Den verkliga siffran är svår att uppskatta men om ungefär en tredjedel av alla filhämtningar leder till en visning så skulle Wikimedia plattformarna ändå resultera i dubbelt så många visningar som på Instagram och sju gånger så många visningar som i museernas egna digitala samlingar, enligt Sveriges museers statistik.
Kvalitet före kvantitet
Det som återstår att reflektera över är vilken roll vi vill att kulturarvsinstitutioner spelar som kunskapsaktörer och vilken betydelse vi ger kvantitativa mätningar. Om vi vill se museer, arkiv och bibliotek som kunskapsinstitutioner borde vi lägga vikt på att statistiken de redovisar är signifikant för det som de vill mäta. Samtidigt så borde organisationerna möjligtvis visa mer aktivt engagemang för gemenskapen som hanterar deras filer och mäta värdet av denna interaktion och intresset för deras samlingar. Vet man vilket av ens material som redigeras mest av Wikimediaanvändare eller om något specifikt material har visat sig vara speciellt intressant för en viss grupp?
Välkommen tillbaka till ett nytt år med KOD! Nu har vi funnits i exakt ett år och vilket underbart år det har varit, tack vare er som läser och bidrar med frågor och svar. Lite oväntat blev det en utgåva som handlar mycket om AI från träningsdata till användning.
Månadens artiklar
I ett gästinlägg reflekterar Alexandra Stiernspetz Nylén (Kulturparken Småland), Katarina Ellborg och Marina Jogmark (Linnéuniversitetet) över bristen på en nationell strategi inom storskalig digitisering av arkivmaterial och hur det präglar både användning och relevansen av AI-tjänster.
Larissa funderar på om det faktiskt finns så stora skillnader i hur vi historiskt sett har visualiserat historiska händelser och personer i förmedlingssyfte och dagens första utställningar med AI-genererade bilder. Spoiler: de finns, men det handlar kanske mer om oss som sitter vid pennan respektive datorn och de som ser på bilden.
Arkiv-IT söker en en arkivkonsult. Intervjuer sker löpande.
Nasjonalarkivet söker en analytiker inom storskalig digitisering i Trondheim, en systemadministratör i Oslo och en produktionsmedarbetare inom digitisering i Tynset. Sista ansökningsdag: 27 januari, 12 februari respektive 8 februari. De har även en annons ute för spontanansökningar för sökande med olika kompetensprofiler.
Kalender
🗓️ 27 januari: Förintelsens minnesdag. Arolsen Archives startar en ny delkampanj kring tillgängliggörandet av namn till människor som mördades eller fängslades under Förintelsen. Som en del av kampanjen #EveryNameCounts släpps 58 000 dokument som nyss digitiserats och som hör till belgiska Nationalarkivets samling av kort som dokumenterar livsöden av de som deporterades från Belgien och Frankrike till förintelselägret i Auschwitz. Målet är att transkribera alla namn inom en vecka med hjälp av internationella volontärer.
🗓️ 4–7 februari: Folk och Kultur, Eskilstuna. Ett urval av programpunker:
🗓️ 12 februari kl 10–11.30 (digitalt, gratis): Bästa möjligheterna för framtidssäker lagring. Cecilia Boström, arkivarie och bevarandestrateg på Regionarkivet Stockholm berättar om digitalt och långsiktigt bevarande av bildmaterial i våra arkiv. Hur ska man tänka kring filformat, metadata, migration, lagring och andra faktorer?
🗓️ 14 februari: Fotografiet som sanningsvittne. Stadsmuseet i Stockholm och Svenska Fotografers förbund samordnar ett öppet seminarium där ”vi belyser och diskuterar frågor som berör den fotografiska bildens relation till verkligheten och hur ny teknik påverkar oss som fotografer, betraktare, brukare och forskare”. Aron medverkar under rubriken ”AI-bilder, fotografiska samlingar och museernas förtroendekapital”.
Digitaliserade historiska arkiv och kulturarvsmuseers AI-användning tillgängliggör material som öppnar dörrar till nya perspektiv på dåtiden och förståelsen av nutid och framtid. Men trots stora möjligheter saknar Sverige en tydlig nationell strategi för att tillvarata dessa resurser.
Detta gästinlägg är skrivet av Alexandra Stiernspetz Nylén (avdelningschef Kulturmiljö och forskning, Kulturparken Småland), Katarina Ellborg och Marina Jogmark (lektorer i Företagsekonomi vid Linnéuniversitetet).
Vems stund på jorden blir ihågkommen och hur? Att sådana utmaningar är högaktuella för Sveriges museer och arkiv framkom i de debatter som fördes vid Museernas vårmöte i Jönköping april 2025. Många menade att nya frågor och perspektiv kan träda fram ur historien med AI-stöd i utforskandet av befintligt material. Samtidigt krävs då att materialet görs tillgängligt i digitalt format. På samma sätt kräver AI-modeller anpassade efter svenska förhållanden att de tränas på material som speglar detta.Vad är då lämpligare att använda än historiska arkivens enorma samlingar? I detta sammanhang skriver Faton Rekathati (KB) och Erik Lenas (Riksarkivet) på SvD Debatt om svenska arkiv som strategisk resurs för landets AI-innovation.
Utmaningen är att arkivmaterial behöver vara digitiserat för att kunna användas i detta syfte. I dagsläget finns dock ytterst lite av arkivmaterialet i digital form. Riksarkivet uppger i sin årsredovisning 2024 att 93 procent av deras material endast finns i pappersform samtidigt som forskare besöker deras läsesalar i allt mindre utsträckning. Rekathati och Lenas menar också att det saknas strukturerade satsningar för att öka graden av digitiserat arkivmaterial. Och här menar de att den svenska inställningen skiljer sig från flera andra länders, där man redan har inlett ambitiösa digitiseringsprojekt.
Från debattörernas makroperspektiv på arkivens outnyttjade roll för utveckling inom AI växlar vi här perspektiv. Vi vill spegla situationen på ett mindre regionalt arkiv i södra Sverige: Stiftelsen Svenska Emigrantinstitutet i Växjö som drivs av Kulturparken Småland. Här finns en av Nordens största samlingar av material om den svenska emigrationsepoken då närmare 20 procent av befolkningen valde ett nytt liv i Amerika.
Kulturparken Småland ingår i det Kampradfinansierade forskningsprojektet ”Det Entreprenöriella Museet” på Linnéuniversitetet där forskare och museum tillsammans undersöker och utmanar föreställningar om museers roll och arbete. Ur detta perspektiv kan vi bara bekräfta den låga graden av digitaliserat arkivmaterial. Vi delar farhågorna om hur avsaknaden av en nationell strategi för digitalisering sannolikt motverkar de fördelar vi som samhälle skulle kunna dra av utvecklade AI-modeller.
Svenska Emigrantinstitutet förvaltar unika material i form av brev, dagböcker och intervjuer från emigrationsepoken som skulle kunna göras mer tillgängligt för forskare och andra intresserade. Allmänhetens intresse för släktforskning är påtagligt, vilket bland annat syns i de många förfrågningar som kommer in till arkivet. Vi ser också intresset för emigrationen speglat i konst, litteratur och till och med i underhållningsprogram så som SVT:s Allt för Sverige. Arkivmaterialet är intressant ur flera perspektiv inte minst migrationshistoriskt, etnologiskt och språkligt. Kopplingarna till samtida migration och allmänmänskliga erfarenheter är uppenbar. Ytterst lite av institutets arkiv är digitiserat. Arkivförteckningar finns tillgängliga digitalt och uppdateras kontinuerligt i Nationell Arkivdatabas, men enskilda dokument finns endast fysiskt. Institutets litteratur finns inlagd i Libris, men stora delar av bibliotekskatalogen är ännu inte sökbar i digital form.
Just nu arbetar dock arkivet med att rädda ett unikt intervjumaterial med svenska emigranter i USA som spelats in från tidigt 1960-tal och framåt. Det rör sig om närmare 3 500 timslånga intervjuer på kassettband. Materialet är en av de mest omfattande källorna om emigration från ett enskilt nationellt sammanhang som vi känner till. Kassettbanden har delvis förts över till ett digitalt format och lagts ut på museernas gemensamma plattform Digitalt Museum där vem som helst kan lyssna på dem. Hittills har hälften av materialet digitiserats, alltså cirka 1 700 intervjuer. Den efterföljande registreringen till Primus släpar dock efter och därmed även tillgängliggörandet via Digitalt Museum. I dagsläget finns endast 175 av intervjuerna tillgängliga där. Personella och ekonomiska resurser är anledningen både till graden av digitisering samt registreringsläget i Primus.
Men även om alla intervjuer skulle finnas tillgängliga, vem kan lyssna igenom 3 500 timmar? Här ser vi möjligheterna att transkribera, sortera och strukturera det stora materialet med hjälp av AI. För att få hjälp med det har arkivet kontaktat allt från Riksarkivet och Kungliga biblioteket (KB) till universitet och enskilda företag. Alla har på olika sätt varit behjälpliga med att testköra AI-modeller på intervjumaterialet. Det har dock visat sig att det inte finns ett enkelt sätt att få det att fungera tillräckligt bra. Anledningen är att de intervjuade talar dialekt, har ett gammalmodigt språk och att de växlar mellan svenska och engelska, alternativt pratar svengelska. Språkväxlingen är det som varit svårast att parera.
Illustration 1: Till vänster syns ”ground truth”, det vill säga transkribering av människa. Den övre bilden till höger syns resultatet av det som en av våra samarbetsparter vid Linnéuniversitetet har transkriberat med en egen modell (xscribe) som har Deepgram som underliggande modell. Nedre bilden till höger är transkriberat med en av KB-labbs modeller. Ground truth-transkriberingen är markerad utifrån transkriberingen till höger.
Färgerna läses på följande sätt:
GRÖN: modellen hörde ordet korrekt och har transkriberat ordet likadant/rätt GUL: modellen hörde ett ord men transkriberade inkorrekt (till exempel skrev ”6” istället för ”sex”) RÖD: modellen missade ordet eller hela meningen BLÅ: modellen har ”hallucinerat”, alltså lagt till ett ord som faktiskt inte ska vara där
I samarbete med forskare och studenter från datavetenskap och medieteknik har en rad modeller för taldetektering och transkribering använts och kombinerats för att nå fram till en tolerabel nivå. Kombinationer av API:n från olika större aktörer har i andra försök också integrerats, till exempel från Open AI:s Whisper, Deepgram, Google Cloud Speech och NVIDIA memo. Modellerna tycks dock vara tränade på tal där inspelningsljudet är optimalt. I det här fallet brister ljudkvaliteten på olika sätt och där har även försök gjorts med att använda funktioner hos KB:s variant av Whisper eftersom modellen är bättre fungerande för arkiverat material.
En grupp på Linnéuniversitetet arbetar nu vidare med ett gränssnitt för sökningar i materialet. Tillsammans med arkivet diskuteras och testas bredare möjligheter än enkla ordsök med hänvisning till tidsangivna träffar. Strävan är genererade sammanfattningar, möjlighet att läsa och lyssna simultant samt till redigering av transkriberingarna. I dagsläget finns en testversion av sökverktyget där ljudfiler laddas upp, transkriberas och bearbetas.
I ett arbete med arkivmaterial och AI finns naturligtvis många källkritiska, säkerhetsmässiga och etiska överväganden att ta in i arbetet. En självklar utgångspunkt är att allt material som AI presenterar behöver gås igenom och därmed är alltid forskarens eller arkivhållarens roll fortsatt helt avgörande. Vad AI kan göra är att ge ingångar till ett tidigare ogenomträngligt material vad gäller sortering, systematisering och sökning.
För Svenska Emigrantinstitutet saknas som tidigare nämnts medel att handla upp tjänster för att förverkliga AI-projekt som det här. Arbetssättet blir att försöka intressera andra för materialet inom ramen för diverse projekt. I kontakterna fastnar parterna för olika delar eller aspekter av AI:s möjligheter för materialet. Arbetssättet innebär en utveckling som tar oförutsedda vägar och som är beroende av vad samarbetspartners finner intressant att utveckla. Arkivets egen styrning minskar delvis, men arbetssättet rymmer också ett viktigt lärande. Nya utvecklingsspår uppstår som arkivet själva inte hade förutsett. Genom entreprenöriella samverkansprocesser kan delar av materialet digitiseras och användas. Samtidigt sker detta ur många aspekter på samverkansparters villkor vilket utmanar gemensamma frågor om inkludering, prioritering och demokratisering.
I förlängningen blir digitalisering av arkiv även en kulturell beredskapsfråga. Det handlar om att på ett medvetet och strategiskt sätt bevara och utveckla kunskap utifrån det rika material som skapats av människor genom tiderna.
De sökningar som görs i arkiv som har delar av materialet digitaliserat är betydligt fler än de fysiska besöken i arkiven. Här varnar Sebastian Eriksson (2025) för att forskningen blir smal om den bedrivs på de cirka 5 procent av materialet i svenska historiska arkiv som finns digitiserat. I sin uppsats Digitaliserade historiska arkiv–förflackande forskning och annalkande arkivdödskriverEriksson:
”Sålunda delar fler och fler på ett förhållandevis väldigt litet digitalt arkivmaterial, medan en stor mängd arkivinformation förblir obeforskad” (2025, s. 58).
Vi kan därmed konstatera att en avsmalnad forskning inte bara handlar om teknisk tillgång, utan om makten över historieskrivningen och om vilka röster som ges möjlighet att bli hörda i samtidens kunskapsproduktion.
Alexandra Stiernspetz Nylén, Katarina Ellborg och Marina Jogmark