Задача дизамбигуации является частью проблемы лингвистической обработки языка во многих сферах. В поисковой оптимизации разрешение многозначности необходимо для повышения релевантности поисковой выдачи.
Принципы семантической дескрипции
Каждое значение слова представляет собой набор семантических ярлыков, которые свидетельствуют о том, к какому классу принадлежит лексема.
К примеру, семантические ярлыки для слова «парк» следующие:
- предметное имя, объект в пространстве (гулять по парку);
- предметное имя, организация (троллейбусный парк);
- предметное имя, совокупность (парк автомобилей).
Для слова «валяться»:
- некаузативный глагол, движение субъекта (валяться в грязи);
- некаузативный глагол, местонахождение (документы валяются на полу).
Программа семантической разметки на первом этапе переносит в текст описывающие все имеющиеся значения слова наборы признаков. Последующие фильтры выбирают корректный признак, а остальные удаляют. Если двум словарным значениям одного слова соответствует одинаковый набор семантических пометок, то никакой неоднозначности, с точки зрения семантической разметки, на этом этапе различения многозначности не возникает.
Понятие многозначности
Многозначность имеет место, если слово описывается двумя и более наборами семантических признаков или входит в различные лексические классы, относящиеся к одному типу.
С такой точки зрения дизамбигуации полисемичных слов не требуется. К примеру, все значения слова «институт» (ВУЗ, научно-исследовательское учреждение и закрытый женский пансион для детей дворян) описываются одинаковыми признаками: «организация», «предметное имя».
Все термины SEO-Википедии