Slavistische Textkorpora und Textsammlungen im Internet

Altkirchenslavisch

Westslavische Sprachen

  • Niedersorbisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Sorbisches Institut, Cottbus
    Dolnoserbski tekstowy korpus
    http://www.dolnoserbski.de/korpus/
  • Obersorbisch
    Korpus, nur mit Anmeldung, Text nicht zugänglich, Suchverfahren
    Sorbisches Institut, Bautzen
    Hornjoserbski tekstowy korpus
    zugänglich unter https://www.korpus.cz/
  • Polnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Narodowy Korpus Języka Polskiego 

    http://nkjp.pl/

  • Polnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Wydawnictwo Naukowe PWN
    Korpus Języka Polskiego Wydawnictwa Naukowego PWN
    http://korpus.pwn.pl/szukaj.php
  • Polnisch
    Marek Adamiec
    Textsammlung, reiner Text
    Wirtualna biblioteka literatury polskiej
    http://literat.ug.edu.pl/books.htm
  • Polnisch
    Textsammlung, reiner Text
    Instytut Filologii Polskiej, Wydział Filologiczno-Historyczny (Uniwersytet Gdański)
    Biblioteka literatuy polskiej w internecie
    http://literat.ug.edu.pl/
  • Altpolnisch
    Textsammlung, reiner Text
    Staropolska on-line
    http://staropolska.pl/
  • Slovakisch
    Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
    Slovenský národný korpus
    http://korpus.juls.savba.sk/
  • Tschechisch
    Korpus, mit oder ohne Anmeldung, Text nicht zugänglich, Suchverfahren
    Český národní korpus
    https://www.korpus.cz/

Südslavische Sprachen

  • Bosnisch
    Korpus, Suchverfahren, Anmeldung erforderlich
    Tekstlaboratoriet, Universitetet i Oslo
    The Oslo Corpus of Bosnian Texts
    http://www.tekstlab.uio.no/Bosnian/Corpus.html
    - Zugang: Mit Onlineabfrage und vielen interessanten Möglichkeiten, jedoch Anmeldung erforderlich
    - Umfang: ca. 1,5 Mio. Wörter
  • Kroatisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Institut za hrvatski jezik i jezikoslovlje
    Hrvatska jezična riznica 
    http://riznica.ihjj.hr/
  • Kroatisch
    Sammlung von kroatischen literarischen Texten verschiedener Epochen
    betrieben von Kroatistik-Student/innen aus Zagreb
    Književnost
    http://www.hrvatskijezik.eu/?q=knjizevnost
  • Mazedonisch
    Textsammlung
    Истражувачки центар за ареална лингвистика (ИЦАЛ)
    Дигитален архив на македонскиот јазик
    http://damj.manu.edu.mk/
    - Enthält ältere Texte zur Geschichte der mazedonische Sprache in Form von durchsuchbaren PDF-Dateien
  • Serbisch
    Korpus savremenog srpskog jezika na Matematičkom fakultetu Univerziteta u Beogradu (Anmeldung nötig)
    http://korpus.matf.bg.ac.rs/prezentacija/korpus.html
  • Serbisch
    Korpus
    Institute for Experimental Phonetics and Speech Pathology, Belgrade; Laboratory for Experimental Psychology, University of Belgrade
    Corpus of Serbian Language by Đorđe Kostić
    http://www.serbian-corpus.edu.rs/ie/menu/emenu.html
    - (noch?) nicht online abfragbar, auch Anfrage werden jedoch die gewünschten Belege per Email zugesandt
    - Umfang: noch nicht sehr weit
  • Serbisch
    Textsammlung, reiner Text

    Projekat Rastko, Biblioteka srpske kulture

    http://www.rastko.rs/
  • Serbisch/Kroatisch/Bosnisch
    Info
    Marko Tadić
    Artikel “Natural Language Processing of Croatian and the Croatian National Corpus”
    http://www.hnk.ffzg.hr/txts/mt4hnk_e.pdf
    http://www.hnk.ffzg.hr/mt/ (Homepage von Marko Tadić)
  • Serbisch/Kroatisch/Bosnisch
    Korpus
    Danko Sipka, Katedra za Slavistiku Univerziteta Adama Mickjevića u Poznanju
    Srpskohrvatski tekstualni korpusi
    http://www.staff.amu.edu.pl/~sipkadan/korpus.html
    - Inhalt: Links zu serbischen/kroatisch/bosnischen Korpora, leider recht veraltet
  • Serbisch/Kroatisch/Bosnisch
    Korpus, Text nicht zugänglich, Suchverfahren
    SFB 441, Projekt B8, Universität Tübingen
    Tübinger BKS-Korpus - Bosnisch/Kroatisch/Serbisches Korpus - TUSNELDA electronic version
    http://tusnelda.sfb.uni-tuebingen.de/TUSNELDA/b8/b8header.html (Projektbeschreibung), http://tusnelda.sfb.uni-tuebingen.de/tusnelda-query.html#b8 (Onlineabrage)
  • Serbisch/Kroatisch/Bosnisch
    Textsammlung, reiner Text
    Borut Maričić
    South Slavic Literature Library
    http://www.borut.com/library/index.htm
    - Linksammlung
  • Slovenisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Fran Ramovš Institute of Slovenian Language ZRC-SAZU Corpus Laboratory
    nova beseda
    http://bos.zrc-sazu.si/a_beseda.html
    - Inhalt: verschiedene Textsorten
  • Slovenisch
    Korpus, reiner Text
    Miran Hladnik
    Zbirka slovenskih leposlovnih besedil
    http://www.ijs.si/lit/leposl.html
  • Slovenisch
    Korpus, Text nicht zugänglich, Suchverfahren
    Philosophische Fakultät der Universität Ljubljana und Jožef-Stefan-Institut
    Korpus slovenskega jezika FIDA
    http://www.fidaplus.net/

Ostslavische Sprachen

Mehrsprachige Korpora 

  • Korpus 
    ParaSol: A Parallel Corpus of Slavic and other languages 
    http://parasol.unibe.ch
    – Slavische, deutsche und englische Originaltexte mit verschiedenen slavischen und deutschen Übersetzungen, teilweise getaggt 
  • Korpus, reiner Text 
    Multext-East “1984” Corpus 
    http://nl.ijs.si/ME/CD/docs/1984.html 
    - Inhalt: George Orwells „1984“ in Englisch und einigen osteuropäischen Sprachen 
  • Korpus 
    Linguistisches Laboratorium (LiLab), Seminar für Slavistik, Universität Bochum 
    Akustische Datenbanken u.a.m. 
    http://www.ruhr-uni-bochum.de/lilab/ > Dokumentation ... > ..., > Landeskunde ... > ... 
  • Korpus 
    SFB 441, Universität Tübingen 
    Korpora, Sammlung von Internetadressen 
    http://www.sfb441.uni-tuebingen.de/c1/corpora.html

Linksammlungen
(nicht nur zu slavistischen Korpora)

Informationen zur Korpuslinguistik