Leipzig Corpora Collection

Search in 1042 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Bulgarian Newscrawl 2011

Search suggestions: вина · изпълнява · основен · предложението · гостите

More information about: Bulgarian Newscrawl 2011 Change corpus

The corpus bul_newscrawl_2011 is a Bulgarian news corpus based on material crawled in 2011. It contains 6,170,388 sentences and 104,958,221 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Further services:

Description

Bulgarian news corpus based on material crawled in 2011

Details

Name	bul_newscrawl_2011	Sentences	6,170,388
Language	Bulgarian ()	Types	1,285,435
Genre	Newscrawl	Tokens	104,958,221
Year	2011

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=bul_newscrawl_2011

Annotations

coocSim
GDEX
wordsLevenshteinSim

Cite this corpus

Leipzig Corpora Collection: Bulgarian news corpus based on material crawled in 2011. Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=bul_newscrawl_2011. BibTeX

@misc{bul_newscrawl_2011,
    author = {Leipzig Corpora Collection},
    title = {Bulgarian news corpus based on material crawled in 2011},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=bul_newscrawl_2011},
    note = {Accessed: 2025-03-11}
}