Leipzig Corpora Collection

Search in 1018 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Czech News 2012

Search suggestions: sami · zasedání · diváků · škoda · místopředseda

More information about: Czech News 2012 Change corpus

The corpus ces_news_2012_1M is a Czech news subcorpus based on material from 2012 (1,000,000 sentences). It contains 1,000,000 sentences and 14,752,849 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Further services:

Description

Czech news subcorpus based on material from 2012 (1,000,000 sentences)

Details

Name	ces_news_2012_1M	Sentences	1,000,000
Language	Czech ()	Types	516,915
Genre	News	Tokens	14,752,849
Year	2012

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=ces_news_2012_1M

Annotations

wordsLevenshteinSim

Cite this corpus

Leipzig Corpora Collection: Czech news subcorpus based on material from 2012 (1,000,000 sentences). Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=ces_news_2012_1M. BibTeX

@misc{ces_news_2012_1M,
    author = {Leipzig Corpora Collection},
    title = {Czech news subcorpus based on material from 2012 (1,000,000 sentences)},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=ces_news_2012_1M},
    note = {Accessed: 2024-07-27}
}