Skip to main content
Article

Semantic structuring of text documents based on patterns of natural language entities

Nikolay Ignatevиерархическая агломеративная группировка, онтология, общий словарь, контентнаяUlugbek Yuldashevich TulievNational university of Uzbekistan, Tashkent, Uzbekistan
ABI

Abstract

Рассматривается технология создания паттернов из слов (понятий) естественного языка по текстовым данным в модели «мешок слов». Паттерны применяются для снижения размерности исходного пространства в описании документов и поиска семантически связанных слов по темам. Процесс снижения размерности реализуется через формирование по паттернам латентных признаков. Исследуется многообразие структур отношений документов для разбиения их на темы в латентном пространстве.

Topics

Identifiers

Citations and references