1043 málheilda byggir eintyngd orðabækur fyrir 290 tungumálum.

The corpus ukr_newscrawl_2011_1M is a Ukrainian news subcorpus based on material crawled in 2011 (1,000,000 sentences). Það inniheldur 1.000.000 setningar og 15.785.757 lesmálsorð. Upplýsingar


Sæktu hluta af þessum hópi.
Nánari upplýsingar um þetta corpus á síðunni Corpus og tungumálatölfræði.