Українській аналізатор в українській вікіпедії
Додано: Пон червня 19, 2017 9:12 pm
Декілька днів тому переіндексували базу пошуку української вікіпедії за допомогою нового українського аналізатора, що з'явився в пошуковій системі Lucene 6.2/ElasticSearch 5.1.2. До цього моменту для пошуку використовувався дещо адаптований російський аналізатор з відповідними проблемами пошуку. Тим часом український аналізатор в альфа-версія Lucene 7/ElasticSearch 6 отримав вдосконалення пошуку власних назв та покращену логіку для спецсимволів (різних видів апострофа, знаку м'якого перенесення тощо).
Для прикладу: тепер на фразу «кота Шредінгера» будуть шукатися, як «кіт Шредінгера» так і «котом Шредінгера», раніше такі чергування в корені слова не шукалися.
Для прикладу: тепер на фразу «кота Шредінгера» будуть шукатися, як «кіт Шредінгера» так і «котом Шредінгера», раніше такі чергування в корені слова не шукалися.