Leipzig Corpora Collection

Search in 1018 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Hungarian Newscrawl 2013

Search suggestions: Sok · szeretnénk · Idén · folyamán · gyermek

More information about: Hungarian Newscrawl 2013 Change corpus

The corpus hun_newscrawl_2013_1M is a Hungarian news subcorpus based on material crawled in 2013 (1,000,000 sentences). It contains 1,000,000 sentences and 15,723,178 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Description

Hungarian news subcorpus based on material crawled in 2013 (1,000,000 sentences)

Details

Name	hun_newscrawl_2013_1M	Sentences	1,000,000
Language	Hungarian ()	Types	1,009,949
Genre	Newscrawl	Tokens	15,723,178
Year	2013

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=hun_newscrawl_2013_1M

Cite this corpus

Leipzig Corpora Collection: Hungarian news subcorpus based on material crawled in 2013 (1,000,000 sentences). Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=hun_newscrawl_2013_1M. BibTeX

@misc{hun_newscrawl_2013_1M,
    author = {Leipzig Corpora Collection},
    title = {Hungarian news subcorpus based on material crawled in 2013 (1,000,000 sentences)},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=hun_newscrawl_2013_1M},
    note = {Accessed: 2024-07-27}
}