ЛТ 2013
Модератор: Анатолій
Re: ЛТ 2013
Спробую трішки докладніше про це:
Нарешті вдалося допиляти підтримку української в двигуні перевірки граматики LanguageTool (http://languagetool.org/)
Поки що це лише основа: є словник частин мови на ~1млн словоформ, хоч і ще не зовсім дороблений, є базовий код на Java для підтримки української мови, і є пару десятків простих правил граматики: трішки пунктуації, трішки милозвучності (із-з, у-в), трішки кальок: «приймати участь» тощо, трішки узгодження: не дозволено мати прийменник перед дієсловом тощо. Також на деякі кальки (напр. активні дієприкметники) даються альтернативні варіанти.
Також я пройшовся по парі сайтів з мовними рекомендаціями (http://mova.kreschatic.kiev.ua, книжці Курило тощо) і спробував додати найпростіші для реалізації правила.
Зі мною раніше контактувало декілька людей, зацікавлених в роботі над цим проектом, але без словника частин мови мало що можна було зробити, тепер база є і можна залучати більше людей. Цей двигун може працювати в LibreOffice/OpenOffice (є додаток), також є додаток для Firefox, і він може працювати окремою програмою або на веб-сторінці.
Щоб зацікавити ширше коло людей я виставив поточну версію на нашому сайті http://r2u.org.ua/check, тож кожен може перевірити свій текст і помацати двигун.
Я проганяв двигун на текстах ДТ і він дещо показує (особливо на ранніх статтях 3 2000-х років), також виловлює деякі речі в статтях з тієї ж вікіпедії
Прохання до всіх згодувати йому 5-10 сторінок тексту і написати мені про свої враження. Зокрема:
* неправильні спрацьовування (фальшиві помилки)
* які правила конче треба додати (деякі правила реалізувати простіше ніж інші, напр. сталі сполуки найпростіше, щось де треба вважати на рід/відмінок трішки складніше, семантичні відмінності уловлювати взагалі поки не візьмусь — може колись потім)
* мовні помилки в повідомленнях
* інші зауваги
До речі робота на таким проектом могла б стати непоганою курсовою або навіть дипломною, тож якщо маєте вихід на потенційно зацікавлених студентів — пишіть.
Трішки докладніше українською про LanguageTool (і саме підтримку української в ньому) можна знайти, як вказано в попередньому повідомленні
Нарешті вдалося допиляти підтримку української в двигуні перевірки граматики LanguageTool (http://languagetool.org/)
Поки що це лише основа: є словник частин мови на ~1млн словоформ, хоч і ще не зовсім дороблений, є базовий код на Java для підтримки української мови, і є пару десятків простих правил граматики: трішки пунктуації, трішки милозвучності (із-з, у-в), трішки кальок: «приймати участь» тощо, трішки узгодження: не дозволено мати прийменник перед дієсловом тощо. Також на деякі кальки (напр. активні дієприкметники) даються альтернативні варіанти.
Також я пройшовся по парі сайтів з мовними рекомендаціями (http://mova.kreschatic.kiev.ua, книжці Курило тощо) і спробував додати найпростіші для реалізації правила.
Зі мною раніше контактувало декілька людей, зацікавлених в роботі над цим проектом, але без словника частин мови мало що можна було зробити, тепер база є і можна залучати більше людей. Цей двигун може працювати в LibreOffice/OpenOffice (є додаток), також є додаток для Firefox, і він може працювати окремою програмою або на веб-сторінці.
Щоб зацікавити ширше коло людей я виставив поточну версію на нашому сайті http://r2u.org.ua/check, тож кожен може перевірити свій текст і помацати двигун.
Я проганяв двигун на текстах ДТ і він дещо показує (особливо на ранніх статтях 3 2000-х років), також виловлює деякі речі в статтях з тієї ж вікіпедії
Прохання до всіх згодувати йому 5-10 сторінок тексту і написати мені про свої враження. Зокрема:
* неправильні спрацьовування (фальшиві помилки)
* які правила конче треба додати (деякі правила реалізувати простіше ніж інші, напр. сталі сполуки найпростіше, щось де треба вважати на рід/відмінок трішки складніше, семантичні відмінності уловлювати взагалі поки не візьмусь — може колись потім)
* мовні помилки в повідомленнях
* інші зауваги
До речі робота на таким проектом могла б стати непоганою курсовою або навіть дипломною, тож якщо маєте вихід на потенційно зацікавлених студентів — пишіть.
Трішки докладніше українською про LanguageTool (і саме підтримку української в ньому) можна знайти, як вказано в попередньому повідомленні
Re: ЛТ 2013
Сьогодні на завершення першої фази вдосконалення словника було додано пару десятків правил неправильного вживання прийменника «по», буду вдячний за тестування та відгуки.