1018 málheilda byggir eintyngd orðabækur fyrir 290 tungumálum.

The corpus uzn-cyr_newscrawl_2011 is a Northern Uzbek (Cyrillic script) news corpus based on material crawled in 2011. Það inniheldur 134.076 setningar og 1.842.697 lesmálsorð. Upplýsingar


Sæktu hluta af þessum hópi.
Nánari upplýsingar um þetta corpus á síðunni Corpus og tungumálatölfræði.