Корпус БрУК - 600К

Обговорення локалізацій програм, та ПЗ пов’язаних з мовною тематикою

Модератор: Анатолій

Відповісти
Andriy
Адміністратор сайту
Повідомлень: 3831
З нами з: Сер травня 27, 2009 8:23 pm

Корпус БрУК - 600К

Повідомлення Andriy »

У корпусі БрУК вже 600 тис. українських слів зі знятою омонімією!

600130 Ukrainian tokens
746845 total tokens
608782 word/number tokens
601970 alpha word tokens
103781 unique Ukrainian words
95534 unique Ukrainian words (case-insensitive)
44179 unique lemmas
Відповісти

Повернутись до “Локалізація та програмні засоби”