Korpusen består av artiklar insamlade från fem morgontidningar år 1965,
nämligen :
Göteborgs Handels- och Sjöfartstidning | (GHT) |
Svenska Dagbladet | (SvD) |
Stockholmstidningen | (ST) |
Dagens Nyheter | (DN) |
Sydsvenska Dagbladet - Snällposten | (SDS) |
Materialet omfattar något över en miljon ord. Syftet med insamlingen var främst att utföra kvantitativa undersökningar av svenskans vokabulär. Resultaten av undersökningarna finns redovisade i detalj i Nusvensk frekvensordbok (NFO) 1 - 4 (1970 - 1980), av vilka delarna 1 och 2 ägnas åt orden, del 3 åt ordförbindelser (flerordsuttryck) och del 4 åt ordleden (morfemen).
Materialet insamlades under fem fjortondagarsperioder per tidning och inskränktes till sådana artiklar som fanns tillgängliga på hålremsa och därmed var maskinläsbara i 1960-talets teknik. Därvid uteslöts på förhand anonyma artiklar, artiklar från nyhetsbyråer, artiklar från sportsidorna, kåserier, insändare och annonser. I efterhand uteslöts även artiklar med metaspråkligt innehåll, artiklar med utländsk författare samt artiklar innehållande längre citat. Syftet med uteslutningarna var att göra materialet mer homogent. Det slutliga urvalet omfattade noga räknat 1 000 669 löpande ord i 1 387 artiklar av 569 författare. En fullständig förteckning över författare och artiklar, med angivande av publiceringsdatum, internt författarnummer m.m., finns i appendix till NFO 4.
Materialet indelades med avseende på typ av källa i tre s.k. genrer:
U | utrikeskorrespondenters rapporter |
K | kulturartiklar jämte recensioner |
A | allmänt reportage |
Med avseende på innehåll indelades materialet även i sex ämnesområden, nämligen :
Na | (naturvetenskap etc.) |
Ku | (kulturvetenskap etc.) |
Po | (politik och samhälle) |
Nä | (näringsliv och samfärdsel) |
Mä | (människa och miljö) |
Ko | (konstnärlig verksamhet). |
Materialets fördelning över tidningar, genrer och ämnen finns beskriven i inledningen till NFO 1.
I konkordansen identifieras raderna med en kombination av
förkortningarna för Tidning och Ämne, enligt mönstren SvDKu eller DN_Mä.
OBS att meningsgränser är särskilt markerade genom tillägg av plustecken "+"
efter s.k. stort skiljetecken.
Jerker Järborg