Leipzig Corpora Collection

Search in 1018 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Persian Newscrawl 2015

Search suggestions: قطع · آباد · فعلی · گفت‌و‌گو · صدام

More information about: Persian Newscrawl 2015 Change corpus

The corpus fas_newscrawl_2015 is a Persian news corpus based on material crawled in 2015. It contains 7,329,457 sentences and 193,305,456 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Description

Persian news corpus based on material crawled in 2015

Details

Name	fas_newscrawl_2015	Sentences	7,329,457
Language	Persian ()	Types	1,777,976
Genre	Newscrawl	Tokens	193,305,456
Year	2015

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=fas_newscrawl_2015

Annotations

coocSim
GDEX

Cite this corpus

Leipzig Corpora Collection: Persian news corpus based on material crawled in 2015. Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=fas_newscrawl_2015. BibTeX

@misc{fas_newscrawl_2015,
    author = {Leipzig Corpora Collection},
    title = {Persian news corpus based on material crawled in 2015},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=fas_newscrawl_2015},
    note = {Accessed: 2024-07-27}
}