Nedladdningsformat
Flertalet av Språkbankens resurser är tillgängliga för sökning genom våra sökgränssnitt. Dessa är Korp för korpusar och Karp för lexikon.
Dessutom finns många av resurserna för nedladdning i olika format. Dessa förklaras kort nedan. Vissa av filerna är mycket stora, och det kan därför vara bäst att spara ner dem på din dator i stället för att visa dem direkt i webbläsaren. Detta gör man enklast genom att högerklicka på önskad länk och sen välja att spara länken.
- XML: XML är ett standardiserat märkspråk för att hantera data.
- LMF: LMF är ett standardiserat sätt att hantera data i elektroniska lexikon. Språkbankens lexikon distribueras som LMF i XML-format.
- Omkastad XML: Flera av texterna i Språkbankens korpusar är skyddade av upphovsrätt. Dessa distribueras som så kallade meningsmängder. Meningarna i texterna har kastats om av upphovsrättsliga skäl. Det betyder att meningarna har en slumpmässig ordning för att originaltexterna inte ska gå att återskapa.
- Statistik: För de flesta av Språkbankens korpusar finns en fil med statistik. Den innehåller en frekvenssorterad lista över ord och deras ordklass, lemgram om sådant hittats, +/- som indikerar om en sammansättningsanalys har kunnat göras, samt rå frekvens (totalt antal förekomster) och relativ frekvens (antal förekomster per en miljon ord).
Se även information om annoteringen av korpusar.