Leipzig Corpora Collection

Search in 1018 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Italian News 2012

Search suggestions: siti · migliori · faccia · ripresa · fratello

More information about: Italian News 2012 Change corpus

The corpus ita_news_2012_1M is a Italian news subcorpus based on material from 2012 (1,000,000 sentences). It contains 1,000,000 sentences and 19,895,912 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Further services:

Description

Italian news subcorpus based on material from 2012 (1,000,000 sentences)

Details

Name	ita_news_2012_1M	Sentences	1,000,000
Language	Italian ()	Types	436,007
Genre	News	Tokens	19,895,912
Year	2012

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=ita_news_2012_1M

Annotations

wordsLevenshteinSim

Cite this corpus

Leipzig Corpora Collection: Italian news subcorpus based on material from 2012 (1,000,000 sentences). Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=ita_news_2012_1M. BibTeX

@misc{ita_news_2012_1M,
    author = {Leipzig Corpora Collection},
    title = {Italian news subcorpus based on material from 2012 (1,000,000 sentences)},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=ita_news_2012_1M},
    note = {Accessed: 2024-07-27}
}