1018 málheilda byggir eintyngd orðabækur fyrir 290 tungumálum.

The corpus tha_newscrawl_2018 is a Thai news corpus based on material crawled in 2018. Það inniheldur 2.304.757 setningar og 62.025.783 lesmálsorð. Upplýsingar


Sæktu hluta af þessum hópi.
Nánari upplýsingar um þetta corpus á síðunni Corpus og tungumálatölfræði.