• Научная статья
  • 16 октября 2012
  • Открытый доступ

АПРИОРНАЯ ИНФОРМАЦИЯ КАК СПОСОБ РАЗРЕШЕНИЯ ОНТОЛОГИЧЕСКОЙ И ЯЗЫКОВОЙ ОМОНИМИИ

Аннотация

В статье рассматривается целесообразность использования априорной информации для разрешения языковой и онтологической омонимии именованных сущностей. На материале размеченного корпуса из 1700 англо-язычных новостных статей опробована стратегия выбора наиболее вероятного объекта с двумя настраиваемыми параметрами (минимальная вероятность соответствия, минимальное количество упоминаний в корпусе). Подобная стратегия позволяет достигнуть большой точности разрешения омонимии, однако ее применение не имеет смысла при большом количестве объектов онтологии из-за низкой полноты.

Источники

  1. Антонов Е. С. Как найти миллион // RSDN Magazine. СПб.: K-Press, 2011. № 1. С. 60-68.
  2. Cucerzan S. Large Scale Named Entity Disambiguation Based on Wikipedia Data // Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. Stroudsburg, PA: Association for Computational Linguistics, 2007. P. 708-716.
  3. Fader A., Soderland S., Etzioni O. Scaling Wikipedia-Based Named Entity Disambiguation to Arbitrary Web Text // Proceedings of the WikiAI 09 - IJCAI Workshop: User Contributed Knowledge and Artificial Intelligence: an Evolving Synergy. Pasadena, CA: IJCAI Organization, 2009. P. 21-28.
  4. Hoffart J., Yosef M. A., Bordino I., Fürstenau H., Pinkal M., Spaniol M., Taneva B., Thater S., Weikum G. Robust Disambiguation of Named Entities in Text // Proceedings of Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL, 2011. P. 782-792.
  5. http://wiki.freebase.com/wiki/Main_Page
  6. http://www.wikipedia.org

Информация об авторах

Антонов Егор Сергеевич

Московский государственный университет им. М. В. Ломоносова

Информация о статье

История публикации

  • Опубликована: 16 октября 2012.

Ключевые слова

  • распознавание именованных сущностей
  • разрешение омонимии именованных сущностей
  • онтология
  • априорная информация
  • географические объекты
  • новостные тексты
  • named entities recognition
  • disambiguation of named entities homonymy
  • ontology
  • a priory information
  • geographic objects
  • news texts

Copyright

© 2012 Автор(ы)
© 2012 ООО Издательство «Грамота»

Лицензионное соглашение

Creative Commons Attribution 4.0 International (CC BY 4.0)