Leipzig Corpora Collection

Search in 1042 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Spanish Newscrawl 2011

Search suggestions: inauguración · necesitan · próximos · lucha · Municipalidad

More information about: Spanish Newscrawl 2011 Change corpus

The corpus spa_newscrawl_2011 is a Spanish news corpus based on material crawled in 2011. It contains 16,899,636 sentences and 391,044,224 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Further services:

Description

Spanish news corpus based on material crawled in 2011

Details

Name	spa_newscrawl_2011	Sentences	16,899,636
Language	Spanish ()	Types	1,913,986
Genre	Newscrawl	Tokens	391,044,224
Year	2011

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=spa_newscrawl_2011

Annotations

coocSim
GDEX
wordsLevenshteinSim

Cite this corpus

Leipzig Corpora Collection: Spanish news corpus based on material crawled in 2011. Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=spa_newscrawl_2011. BibTeX

@misc{spa_newscrawl_2011,
    author = {Leipzig Corpora Collection},
    title = {Spanish news corpus based on material crawled in 2011},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=spa_newscrawl_2011},
    note = {Accessed: 2025-03-13}
}