1018 málheilda byggir eintyngd orðabækur fyrir 290 tungumálum.

The corpus tam_newscrawl_2011 is a Tamil news corpus based on material crawled in 2011. Það inniheldur 1.341.954 setningar og 14.581.452 lesmálsorð. Upplýsingar


Sæktu hluta af þessum hópi.
Nánari upplýsingar um þetta corpus á síðunni Corpus og tungumálatölfræði.