ВЕСУМ 4.0.0
Додано: Сер грудня 20, 2017 10:42 pm
Вийшла версія 4.0.0 Великого електронного словника української мови (ВЕСУМ).
Ця версія містить:
* понад 327 тис. лем, з яких генеруються понад 5,096 млн словоформ (з них понад 2,909 млн унікальних)
* синхронізовані з КОАТУУ назви нас. пунктів (зокрема декомунізованих)
* варіанти заміни для майже 4000 покручів і небажаних слів
* інформація про керування відмінками
* інформація про абревіатури, сленгові та рідковживані слова, а також слова, написані не за чинним правописом
Починаючи з цієї версії також слова зі словника можна шукати через веб-інтерфейс: http://r2u.org.ua/vesum
Наразі веб-сторінка показує результати у «сирому» форматі, з тегами, але сподіваємося згодом додати також «ушляхетнений» вигляд з гарною табличкою.
Високоякісний, спрямований на практичне застосування український словник такого обсягу у вільному доступі є результатом довгої праці багатьох людей. Користуючись нагодою хотілося б подякувати зокрема Vasyl Starko, Mariana Romanyshyn, Olga Havura, Khrystyna Skopyk, Nastia Osidach, Nataliia Cheilytko, Oksana Kunikevych, Oksana Tkach, Богдан Москалевський, Natalia Kotsyba, Dmitry Chaplinsky та іншим учасникам команди БрУК
Сторінка проекту: https://github.com/brown-uk/dict_uk
Додаток перевірки орфографії для Firefox: https://addons.mozilla.org/uk/firefox/a ... ictionary/
Додаток перевірки орфографії для LibreOffice.org: https://extensions.libreoffice.org/exte ... -4.0.0.oxt
Також на цьому словнику базується українські модулі правописника LanguageTool, і пошукових систем Lucene/ElasticSearch, що у свою чергу використовуються в українській Вікіпедії.
Словник призначений насамперед для застосування в програмних засобах (зокрема для NLP, перевірки орфографії, граматики, повнотекстового пошуку тощо), але оскільки проект розповсюджується за умов відкритої ліцензії, сфера його вжитку практично необмежена. І оскільки проект є вільним і відкритим будь-хто може долучитися до його розвитку, або звітувати про помічену помилку.
Ця версія містить:
* понад 327 тис. лем, з яких генеруються понад 5,096 млн словоформ (з них понад 2,909 млн унікальних)
* синхронізовані з КОАТУУ назви нас. пунктів (зокрема декомунізованих)
* варіанти заміни для майже 4000 покручів і небажаних слів
* інформація про керування відмінками
* інформація про абревіатури, сленгові та рідковживані слова, а також слова, написані не за чинним правописом
Починаючи з цієї версії також слова зі словника можна шукати через веб-інтерфейс: http://r2u.org.ua/vesum
Наразі веб-сторінка показує результати у «сирому» форматі, з тегами, але сподіваємося згодом додати також «ушляхетнений» вигляд з гарною табличкою.
Високоякісний, спрямований на практичне застосування український словник такого обсягу у вільному доступі є результатом довгої праці багатьох людей. Користуючись нагодою хотілося б подякувати зокрема Vasyl Starko, Mariana Romanyshyn, Olga Havura, Khrystyna Skopyk, Nastia Osidach, Nataliia Cheilytko, Oksana Kunikevych, Oksana Tkach, Богдан Москалевський, Natalia Kotsyba, Dmitry Chaplinsky та іншим учасникам команди БрУК
Сторінка проекту: https://github.com/brown-uk/dict_uk
Додаток перевірки орфографії для Firefox: https://addons.mozilla.org/uk/firefox/a ... ictionary/
Додаток перевірки орфографії для LibreOffice.org: https://extensions.libreoffice.org/exte ... -4.0.0.oxt
Також на цьому словнику базується українські модулі правописника LanguageTool, і пошукових систем Lucene/ElasticSearch, що у свою чергу використовуються в українській Вікіпедії.
Словник призначений насамперед для застосування в програмних засобах (зокрема для NLP, перевірки орфографії, граматики, повнотекстового пошуку тощо), але оскільки проект розповсюджується за умов відкритої ліцензії, сфера його вжитку практично необмежена. І оскільки проект є вільним і відкритим будь-хто може долучитися до його розвитку, або звітувати про помічену помилку.