21.10.2021 - 12:10

Ny databas med miljontals tidningstexter från Finland och Sverige ger svar på hur informationen flödat över Östersjön

En forskargrupp finansierad av Svenska litteratursällskapet i Finland har lanserat en databas som jämför 17 miljoner texter och textfragment publicerade i tidningar och tidskrifter i Finland och Sverige under åren 1771–1918. Programvaran som används är ursprungligen skapad för att identifiera dna- och proteinsekvenser.

Databasen har skapats som en del av forskningsprojektet Informationsflöden över Östersjön: Svenskspråkig press som kulturförmedlare 1771–1918. Projektet studerar hur nyheter, annonser och andra texter spreds geografiskt över Sverige och Finland och hur de kunde återanvändas långt efter att de ursprungligen publicerats. Projektet är förlagt till Åbo universitet, dessutom medverkar forskare från Helsingfors universitet, Umeå universitet och Örebro universitet.

Databasen bygger på de digitaliserade tidningarna och tidskrifterna i Nationalbiblioteket i Finland och Kungliga biblioteket och Språkbanken i Sverige. Sammanlagt är det fråga om ca två miljoner tidningssidor från Finland och ca tre miljoner sidor från Sverige. Det är första gången som tidningsmaterial från två länder sammanförs på det här sättet. En superdator har jämfört tidningssidorna med varandra för att identifiera textstycken som återfinns i två eller flera tidningar och samlat dem till textkluster som sedan kan analyseras. Programvaran som används är ursprungligen skapad för att identifiera dna- och proteinsekvenser, men datavetaren och forskaren Aleksi Vesanto vid Åbo universitet har modifierat den till att känna igen textsekvenser i stället.

Öppen för allmänheten

Databasen är nu öppet tillgänglig för både forskare och allmänhet på adressen textreuse.sls.fi. Projektledaren Hannu Salmi, kulturhistoriker och akademiprofessor vid Åbo universitet, berättar att användaren både kan filtrera materialet och göra ordsökningar i databasen.

– Vi har försökt sortera och bearbeta materialet så att det kan användas så mångsidigt som möjligt. Via användargränssnittet ska det gå att göra sökningar på till exempel material som startat i Åbo, vilka annonser eller nyheter som har sitt ursprung i Vasa, eller vilka nyheter från andra städer som återgetts i tidningar i Kalmar och så vidare.

 

Databasen lanserades under ett evenemang på Svenska litteratursällskapet den 7 oktober. Projektets forskare Patrik Lundell (Örebro universitet), Jani Marjanen (Helsingfors universitet) samt Petri Paju, Heli Rantala och Hannu Salmi (Åbo universitet) presenterade både databasens användningsmöjligheter och de första resultaten från forskningsprojektet. I projektgruppen ingår dessutom Erik Edoff och Johan Jarlbrink (Umeå universitet). Du kan se en inspelning av evenemanget här.

Mer information ges av

Hannu Salmi
unafnyzv@hgh.svif.utu@imlasnah
+358 50 329 0276

Pressbilder:

1. Forskargrupp för Informationsflöden över Östersjön. Uppifrån vänster: Patrik Lundell, Hannu Salmi och Jani Marjanen (också längst ner), Petri Paju och Heli Rantala. Liggande bild. Foto: Janne Rentola/SLS

2.  Forskargrupp för Informationsflöden över Östersjön. Uppifrån vänster: Patrik Lundell, Hannu Salmi och Jani Marjanen (också längst ner), Petri Paju och Heli Rantala. Stående bild. Foto: Janne Rentola/SLS

3. Hannu Salmi presenterar databas. Foto: Janne Rentola/SLS

4. Hannu Salmi presenterar forskningsprojekt. Foto: Janne Rentola/SLS

5.  Liggande porträtt av Hannu Salmi. Foto: Janne Rentola/SLS

6.  Stående porträtt av Hannu Salmi. Foto: Janne Rentola/SLS