Сторінка 1 з 2

LanguageTool

Додано: Пон січня 16, 2012 5:27 pm
Maksym
Чи хтось знає про підтримку української мови у проекті LanguageTool? Чи цей проект набув розвитку?

Re: LanguageTool

Додано: Пон січня 16, 2012 5:47 pm
Andriy
Я колись додав початкову підтримку української в LanguageTool, і додав декілька простеньких правил пунктуації, але далі забракло часу.
Насправді реальна користь від підтримки з’явиться лише якщо створити словник класифікацією і відмінюванням слів, тоді можна буде знаходити граматичні (і можливо навіть дещо стильові) помилки. Я колись почав це робити на базі словника spell-uk, і це досить реально, але страшенно мало часу. Якщо б хтось взявся з це, я міг би допомогти.
Насправді, додавання ґрунтовної підтримки української в languagetool була б хороша робота для бакалаврської а то і магістерської, але в мене бракує контактів, щоб знайти людину, яку б це зацікавило.

Re: LanguageTool

Додано: Сер лютого 01, 2012 6:51 pm
Maksym
Я маю талановиту аcпірантку, яка хотіла би займатися вдосконаленням LanguageTools.
Чи остання версія української частини міститься на https://languagetool.svn.sourceforge.ne ... nguageTool ?
Чи після цього Ви робили інші модифікації?

Re: LanguageTool

Додано: Сер лютого 01, 2012 7:58 pm
Andriy
Так це остання версія. Але було б добре, якщо б вона зі мною зв’язалася і ми обговорили плани, бо там не зовсім тривіально: тре зробити серйозну роботу зі створення словника, щоб була база, на якій вже будувати правила. Якщо хтось на LT буде працювати, то я напевне міг би знайти час довести якісь речі там до ладу.

Re: LanguageTool

Додано: П'ят лютого 03, 2012 1:10 pm
Re.
Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?

Re: LanguageTool

Додано: П'ят лютого 03, 2012 6:19 pm
Andriy
Re. писав:Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?
Чесно кажучи, я поки не бачу що ця нова система вміє (LT вміє багато, якщо є словникова підтримка). Думаю, варто почати з покращення підтримки української в LT, і потім, якщо дійсно цей новий проект буде кращим, можна буде перенести напрацьо́вання під нього.

Re: LanguageTool

Додано: П'ят лютого 03, 2012 7:15 pm
Maksym
Так виглядає, що LightProof, запропонований для LibreOffice, не має морфологічного та граматичного розбору речення. Зате LightProof має прості правила, схожі на regexp. Якщо до LightProof додати розбір та стиснення словника, то зробити на ньому розбір буде досить просто

Re: LanguageTool

Додано: Пон лютого 06, 2012 10:05 pm
Re.
Якщо LanguageTool буде брати участь у цьогорічному Google Summer of Code, можна запропонувати долучення української як завдання. Винагорода — 5000 доларів студенту + 500 ментору доволі приваблива.

Андрію, ви цілком підходите на роль ментора. Спитайте в розробників LT, що вони планують цього року. Якщо проект додадуть, то можна пошукати студентів. Як гадаєте?

Re: LanguageTool

Додано: Вів лютого 07, 2012 5:10 pm
Maksym
Я виправив хибні повідомлення про те, що речення починається з малої літери (виникає, коли перше слово речення знайдене у словнику).
Яким чином можна додавати зміни до проекту? Хто може їх перевіряти?
Чи є десь спеціалізований форум щодо змін у LanguageTool, чи можна писати тут?

diff --git "a/UkrainianMyspellTagger-HEAD-left.java" "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
index 90f00a1..204f9d2 100644
--- "a/UkrainianMyspellTagger-HEAD-left.java"
+++ "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
@@ -125,7 +125,7 @@ public class UkrainianMyspellTagger implements Tagger {
lowerPosTags = wordsToPos.get(lowerWord);
if (lowerPosTags != null) {
for (String lowerPosTag : lowerPosTags)
- analyzedTokens.add(new AnalyzedToken(lowerWord, lowerPosTag,
+ analyzedTokens.add(new AnalyzedToken(word, lowerPosTag,
lowerWord));
}
}

Re: LanguageTool

Додано: Вів лютого 07, 2012 11:54 pm
Andriy
Максиме, там є лист розсилки, напевне, найкраще латки слати туди, альтернативно я можу закинути латку напряму (щоправда мені доведеться налаштувати unit tests — я їх давно не проганяв). Форум є, але він, напевне, не для латок.