Leipzig Corpora Collection

Search in 1018 Corpus-Based Monolingual Dictionaries for 290 Languages.

Selected language: Bengali Web 2019 (India)

Search suggestions: বোর্ডের · যুদ্ধের · কুমার · দেওয়ার · আপনাদের

More information about: Bengali Web 2019 (India) Change corpus

The corpus ben-in_web_2019 is a Bengali Web text corpus (India) based on material from 2019. It contains 1,523,444 sentences and 17,407,831 tokens. Details

DOWNLOADS

Download parts of this corpus.

STATISTICS

More details about this corpus on our corpus and language statistics page.

Further services:

Description

Bengali Web text corpus (India) based on material from 2019

Details

Name	ben-in_web_2019	Sentences	1,523,444
Language	Bengali ()	Types	737,652
Genre	Web	Tokens	17,407,831
Year	2019
Location	India

Link to the corpus

https://corpora.uni-leipzig.de?corpusId=ben-in_web_2019

Annotations

coocSim
GDEX

Cite this corpus

Leipzig Corpora Collection: Bengali Web text corpus (India) based on material from 2019. Leipzig Corpora Collection. Dataset. https://corpora.uni-leipzig.de?corpusId=ben-in_web_2019. BibTeX

@misc{ben-in_web_2019,
    author = {Leipzig Corpora Collection},
    title = {Bengali Web text corpus (India) based on material from 2019},
    howpublished = {https://corpora.uni-leipzig.de?corpusId=ben-in_web_2019},
    note = {Accessed: 2024-07-27}
}