LanguageTool
Модератор: Анатолій
LanguageTool
Чи хтось знає про підтримку української мови у проекті LanguageTool? Чи цей проект набув розвитку?
Re: LanguageTool
Я колись додав початкову підтримку української в LanguageTool, і додав декілька простеньких правил пунктуації, але далі забракло часу.
Насправді реальна користь від підтримки з’явиться лише якщо створити словник класифікацією і відмінюванням слів, тоді можна буде знаходити граматичні (і можливо навіть дещо стильові) помилки. Я колись почав це робити на базі словника spell-uk, і це досить реально, але страшенно мало часу. Якщо б хтось взявся з це, я міг би допомогти.
Насправді, додавання ґрунтовної підтримки української в languagetool була б хороша робота для бакалаврської а то і магістерської, але в мене бракує контактів, щоб знайти людину, яку б це зацікавило.
Насправді реальна користь від підтримки з’явиться лише якщо створити словник класифікацією і відмінюванням слів, тоді можна буде знаходити граматичні (і можливо навіть дещо стильові) помилки. Я колись почав це робити на базі словника spell-uk, і це досить реально, але страшенно мало часу. Якщо б хтось взявся з це, я міг би допомогти.
Насправді, додавання ґрунтовної підтримки української в languagetool була б хороша робота для бакалаврської а то і магістерської, але в мене бракує контактів, щоб знайти людину, яку б це зацікавило.
Re: LanguageTool
Я маю талановиту аcпірантку, яка хотіла би займатися вдосконаленням LanguageTools.
Чи остання версія української частини міститься на https://languagetool.svn.sourceforge.ne ... nguageTool ?
Чи після цього Ви робили інші модифікації?
Чи остання версія української частини міститься на https://languagetool.svn.sourceforge.ne ... nguageTool ?
Чи після цього Ви робили інші модифікації?
Re: LanguageTool
Так це остання версія. Але було б добре, якщо б вона зі мною зв’язалася і ми обговорили плани, бо там не зовсім тривіально: тре зробити серйозну роботу зі створення словника, щоб була база, на якій вже будувати правила. Якщо хтось на LT буде працювати, то я напевне міг би знайти час довести якісь речі там до ладу.
Re: LanguageTool
Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?
Re: LanguageTool
Чесно кажучи, я поки не бачу що ця нова система вміє (LT вміє багато, якщо є словникова підтримка). Думаю, варто почати з покращення підтримки української в LT, і потім, якщо дійсно цей новий проект буде кращим, можна буде перенести напрацьо́вання під нього.Re. писав:Між іншим, нещодавно з'явилась нова система для LibreOffice написана на пайтоні. Може, перспективніше вже з неї починати?
Re: LanguageTool
Так виглядає, що LightProof, запропонований для LibreOffice, не має морфологічного та граматичного розбору речення. Зате LightProof має прості правила, схожі на regexp. Якщо до LightProof додати розбір та стиснення словника, то зробити на ньому розбір буде досить просто
Re: LanguageTool
Якщо LanguageTool буде брати участь у цьогорічному Google Summer of Code, можна запропонувати долучення української як завдання. Винагорода — 5000 доларів студенту + 500 ментору доволі приваблива.
Андрію, ви цілком підходите на роль ментора. Спитайте в розробників LT, що вони планують цього року. Якщо проект додадуть, то можна пошукати студентів. Як гадаєте?
Андрію, ви цілком підходите на роль ментора. Спитайте в розробників LT, що вони планують цього року. Якщо проект додадуть, то можна пошукати студентів. Як гадаєте?
Re: LanguageTool
Я виправив хибні повідомлення про те, що речення починається з малої літери (виникає, коли перше слово речення знайдене у словнику).
Яким чином можна додавати зміни до проекту? Хто може їх перевіряти?
Чи є десь спеціалізований форум щодо змін у LanguageTool, чи можна писати тут?
diff --git "a/UkrainianMyspellTagger-HEAD-left.java" "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
index 90f00a1..204f9d2 100644
--- "a/UkrainianMyspellTagger-HEAD-left.java"
+++ "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
@@ -125,7 +125,7 @@ public class UkrainianMyspellTagger implements Tagger {
lowerPosTags = wordsToPos.get(lowerWord);
if (lowerPosTags != null) {
for (String lowerPosTag : lowerPosTags)
- analyzedTokens.add(new AnalyzedToken(lowerWord, lowerPosTag,
+ analyzedTokens.add(new AnalyzedToken(word, lowerPosTag,
lowerWord));
}
}
Яким чином можна додавати зміни до проекту? Хто може їх перевіряти?
Чи є десь спеціалізований форум щодо змін у LanguageTool, чи можна писати тут?
diff --git "a/UkrainianMyspellTagger-HEAD-left.java" "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
index 90f00a1..204f9d2 100644
--- "a/UkrainianMyspellTagger-HEAD-left.java"
+++ "b/JLanguageTool\\src\\java\\org\\languagetool\\tagging\\uk\\UkrainianMyspellTagger.java"
@@ -125,7 +125,7 @@ public class UkrainianMyspellTagger implements Tagger {
lowerPosTags = wordsToPos.get(lowerWord);
if (lowerPosTags != null) {
for (String lowerPosTag : lowerPosTags)
- analyzedTokens.add(new AnalyzedToken(lowerWord, lowerPosTag,
+ analyzedTokens.add(new AnalyzedToken(word, lowerPosTag,
lowerWord));
}
}
Re: LanguageTool
Максиме, там є лист розсилки, напевне, найкраще латки слати туди, альтернативно я можу закинути латку напряму (щоправда мені доведеться налаштувати unit tests — я їх давно не проганяв). Форум є, але він, напевне, не для латок.