Способ содержательного анализа текстовой информации

Описание
Изобретение относится к области вычислительной техники. Технический результат заключается в повышении достоверности определения авторства текстовой информации. Технический результат достигается за счет расчленения первого и второго анализируемых текстов на нумеруемые фрагменты, для каждого из которых рассчитывают по известным формулам числовые значения пяти психолингвистических параметров. На основании подсчитанных значений параметров первого и второго текстов вычисляют с помощью метода факторного анализа соответственно первый и второй наборы нумеруемых значений общего фактора. Используя первый и второй вычисленные наборы нумеруемых значений общего фактора, создают первую и вторую последовательности величин, каждая из которых представляет собой модуль разности между соседними числовыми элементами соответствующего набора значений общего фактора. Выделяют в первой и второй созданных числовых последовательностях соответственно первую и вторую совокупности равных чисел, при этом величину числа из первой выделенной совокупности обозначают Δ1, а величину числа из второй выделенной совокупности обозначают Δ2. Делают вывод о принадлежности первого и второго текстов одному автору, если |Δ1-Δ2|≤0.01, а в противном случае авторы различны. 11 ил.
Дата
2019-12-02
Патентообладатели
"Федеральное государственное автономное образовательное учреждение высшего образования ""Санкт-Петербургский государственный электротехнический университет ""ЛЭТИ"" им. В.И. Ульянова "" "
Авторы
Валов Александр Александрович
Номер заявки
RU 02719553 C1 20200421
Предметная область
Компьютерное оборудование
Ссылка на ФИПС