Leipzig Corpora Collection - Mandarin Chinese

Search in 1019 Corpus-Based Monolingual Dictionaries for 291 Languages.

Selected language: Mandarin Chinese Web 2019 (China)

Search suggestions: 坚持 · 少 · 角色 · 中山 · 送

More information about: Mandarin Chinese Web 2019 (China) Change corpus

The corpus cmn-cn_web_2019 is a Mandarin Chinese Web text corpus (People’s Republic of China) based on material from 2019. It contains 2,547,177 sentences and 61,340,150 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Description

Mandarin Chinese Web text corpus (People’s Republic of China) based on material from 2019

Details

Name	cmn-cn_web_2019	Sentences	2,547,177
Language	Mandarin Chinese ()	Types	585,271
Genre	Web	Tokens	61,340,150
Year	2019
Location	China

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=cmn-cn_web_2019

Annotations

coocSim
GDEX

Cite this corpus

Leipzig Corpora Collection: Mandarin Chinese Web text corpus (People’s Republic of China) based on material from 2019. Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=cmn-cn_web_2019. BibTeX

@misc{cmn-cn_web_2019,
    author = {Leipzig Corpora Collection},
    title = {Mandarin Chinese Web text corpus (People’s Republic of China) based on material from 2019},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=cmn-cn_web_2019},
    note = {Accessed: 2024-04-20}
}