Дизамбигуация

Дизамбигуация (дословно от англ. disambiguation) — это разрешение лексической многозначности, способ выбора точного значения слова из имеющихся омонимов с учетом окружающего контекста. Термин, в частности, применяется для описания работы алгоритмов поисковых роботов.

Задача дизамбигуации является частью проблемы лингвистической обработки языка во многих сферах. В поисковой оптимизации разрешение многозначности необходимо для повышения релевантности поисковой выдачи.

Принципы семантической дескрипции

Каждое значение слова представляет собой набор семантических ярлыков, которые свидетельствуют о том, к какому классу принадлежит лексема.

К примеру, семантические ярлыки для слова «парк» следующие:

  • предметное имя, объект в пространстве (гулять по парку);
  • предметное имя, организация (троллейбусный парк);
  • предметное имя, совокупность (парк автомобилей).

Для слова «валяться»:

  • некаузативный глагол, движение субъекта (валяться в грязи);
  • некаузативный глагол, местонахождение (документы валяются на полу).

Программа семантической разметки на первом этапе переносит в текст описывающие все имеющиеся значения слова наборы признаков. Последующие фильтры выбирают корректный признак, а остальные удаляют. Если двум словарным значениям одного слова соответствует одинаковый набор семантических пометок, то никакой неоднозначности, с точки зрения семантической разметки, на этом этапе различения многозначности не возникает.

Понятие многозначности

Многозначность имеет место, если слово описывается двумя и более наборами семантических признаков или входит в различные лексические классы, относящиеся к одному типу.

С такой точки зрения дизамбигуации полисемичных слов не требуется. К примеру, все значения слова «институт» (ВУЗ, научно-исследовательское учреждение и закрытый женский пансион для детей дворян) описываются одинаковыми признаками: «организация», «предметное имя».

Все термины SEO-Википедии
Теги термина

(Рейтинг: 5, Голосов: 5)