Leipzig Corpora Collection

Search in 1019 Corpus-Based Monolingual Dictionaries for 291 Languages.

Selected language: Turkish Newscrawl 2013

Search suggestions: uzak · eğer · Sen · söylüyor · giderken

More information about: Turkish Newscrawl 2013 Change corpus

The corpus tur_newscrawl_2013_1M is a Turkish news subcorpus based on material crawled in 2013 (1,000,000 sentences). It contains 1,000,000 sentences and 13,564,944 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Description

Turkish news subcorpus based on material crawled in 2013 (1,000,000 sentences)

Details

Name	tur_newscrawl_2013_1M	Sentences	1,000,000
Language	Turkish ()	Types	743,893
Genre	Newscrawl	Tokens	13,564,944
Year	2013

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=tur_newscrawl_2013_1M

Cite this corpus

Leipzig Corpora Collection: Turkish news subcorpus based on material crawled in 2013 (1,000,000 sentences). Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=tur_newscrawl_2013_1M. BibTeX

@misc{tur_newscrawl_2013_1M,
    author = {Leipzig Corpora Collection},
    title = {Turkish news subcorpus based on material crawled in 2013 (1,000,000 sentences)},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=tur_newscrawl_2013_1M},
    note = {Accessed: 2024-04-19}
}