Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации

  • Авторы: Копыльцов А.А.1
  • Учреждения:
    1. Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина) (СПбГЭТУ)
  • Выпуск: № 3 (2014)
  • Страницы: 28-34
  • Раздел: Статьи
  • URL: https://vestnik.nvsu.ru/2311-1402/article/view/49326
  • ID: 49326

Цитировать

Полный текст

Аннотация

Разработан алгоритм коррекции связей между фрагментами слабо формализованной информации, поступающей от технических систем. Предполагается, что информация поступает в хранилище и характеризуется некоторым конечным набором показателей. Осуществляется свертка этих показателей, которая представляет собой взвешенную сумму с весовыми коэффициентами. Далее осуществляется сравнение полученной свертки со свертками фрагментов ранее поступивших фрагментов информации в хранилище. Если евклидово расстояние между свертками меньше некоторого заранее заданного числа ε, то считается, что эти фрагменты информации между собой связаны. В хранилище рассматриваются связи между фрагментами информации, и осуществляется их коррекция, т.е. выявление фрагментов информации, находящейся в хранилище, которые между собой связаны с точностью до ε, до 2 ε, до 3 ε и т.д. Таким образом, вводится уровень связности первого, второго, третьего и других порядков. Информация о том, что некоторые фрагменты информация между собой связаны, можно рассматривать как новую информацию, и эта новая информация определяется множеством показателей, которое представляет объединение показателей, которыми определяются первоначальные фрагменты информации. Можно в хранилище рассмотреть сети связности первого, второго, третьего и так далее порядков, т.е. сети, элементы которых между собой связаны с точностью до ε, до 2 ε, до 3ε и т.д. В некоторых случаях можно определить взаимосвязь фрагментов информации, т.е. какой фрагмент информации какому фрагменту информации предшествует или какой фрагмент из какого фрагмента следует. Это можно сделать следующим образом. Если фрагмент информации с номером I1 определяется некоторыми показателями , а фрагмент информации с номером I2 определяется другими показателями, и если все первые показатели характеризуются более ранними временными характеристиками, чем все вторые показатели , то фрагмент информация с номером I1 предшествует фрагменту информации с номером I2 . Однако это не позволяет сделать заключение о том, что информация с номером I1 следует из информации с номером I2 или наоборот. Для того, чтобы фрагмент информации с номером I2, определяемый некоторым набором показателей, следовал из фрагмента информации с номером I1 , определяемым другим набором показателей, нужно, чтобы фрагмент информации с номером I2 уже содержался в фрагменте информации с номером I1 , т.е. набор показателей определяющий I2 должен содержаться в наборе показателей определяющем I1 . Это означает, что в фрагменте информации с номером I1 уже содержится фрагмент информации с номером I2 и, поэтому, из I1 можно получить I2 , т.е. I2 следует из I1. Рассмотрен пример таких фрагментов информации. Пусть дан фрагмент информации с номером I1 , определяемый некоторым набором показателями состоящим из k элементов. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества состоящего из k показателей. Возможны следующие варианты: фрагменты информации, определяемые различными комбинациями, состоящими из (k-1) показателей, из (k-2) показателей, …, из 3 показателей, из 2 показателей, из 1 показателя. Кроме того, аналогично, из каждого фрагмента информации, определяемого (k-1) показателями, следуют фрагменты информации, определяемые наборами из (k-2) показателей, …, из 3 показателей, из 2 показателей, из 1 показателя. Аналогично для фрагментов информации, определяемых (k-2), (k-3) и меньшим количеством показателей. Если дан фрагмент информации, определяемый набором показателей, состоящим из 3 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется различными комбинациями, состоящими из 2 показателей и из 1 показателя. Если дан фрагмент информации, определяемый набором показателей, состоящим из 2 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется 1 показателем. Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.

Полный текст

В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3-11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке. Обработка информации, поступающей в хранилище. Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей (CN - результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками (C1, C2 , …, Ck) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если δNi = |CN -Ci| < ε для некоторого i {1, 2, …, k} и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером i между собой связаны. Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С1, С2, …, Сn. Рассмотрим δij = |Ci - Cj |, где i, j = 1, 2, …, n и i ≠ j. Если δij < ε для некоторого ε > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации. Коррекция связей в хранилище и генерация новой информации. Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из n элементов, i = 1, … , n. Если между информацией с номером i и информацией с номером j имеется Сij связей и Сij > C* , где C* - некоторое число, то считаем, что информация с номером i и информация с номером j связаны непосредственно (уровень связности Сij) (рис. 1). Информацию о том, что информация с номером Ii и информация с номером Ij связаны, можно рассматривать как новую информацию с номером Ik. Это означает, что если информация с номером Ii определяется показателями i1, i2, …, ii1 , а информация с номером Ij - показателями j1, j2, …, jj1 , то информация с номером Ik = Ii∪j определяется показателями i1, i2, …, ii1, j1, j2, …, jj1 , представляющими собой объединение показателей, которыми определяется информация с номерами Ii и Ij. Это означает, что свертка в дальнейшем делается по показателям i1, i2, …, ii1, j1, j2, …, jj1. X B A Рис. 1. Уровни связности между точками Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. САВ ≥ 2, пунктирная линия) В некоторых случаях можно между информацией с номером Ii и информацией с номером Ij ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует. Это можно сделать следующим образом. Если информация с номером Ii определяется показателями i1, i2, …, ii1, а информация с номером Ij - показателями j1, j2, …, jj1 , и если все показатели i1, i2, …, ii1 характеризуются более ранними временными характеристиками, чем все показатели j1, j2, …, jj1, то информация с номером Ii предшествует информации с номером Ij . Однако это не позволяет сделать заключение о том, что информация с номером Ij следует из информации с номером Ii, или наоборот. Для того, чтобы информация с номером Ii, определяемая показателями i1, i2, …, ii1, следовала из информации с номером Ij, определяемой показателями j1, j2, …, jj1, нужно, чтобы информация с номером Ii уже содержалась в информации с номером Ij , т.е. { i1, i2, …, ii1 } ⊂ {j1, j2, …, jj1}. Это означает, что в информации с номером Ij уже содержится информация с номером Ii, и поэтому из Ij можно получить Ii , т.е. Ii следует из Ij . Пусть дан фрагмент информации с номером Ij , определяемый показателями i1, i2, …, ik. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества {i1, i2, …, ik}, т.е. {i1} {i1, i2, …, ik}, {i2} {i1, i2, …, ik}, {i3} {i1, i2, …, ik}, …………………….. {i1, i2} {i1, i2, …, ik}, {i1, i3} {i1, i2, …, ik}, {i1, i4} {i1, i2, …, ik}, ……………………….. и т.д. Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда {i1} {i1, i2, i3,, i4}, или I1 I1234 , {i2} {i1, i2, i3,, i4}, или I2 I1234 , {i3} {i1, i2, i3,, i4}, или I3 I1234 , {i4} {i1, i2, i3,, i4}, или I4 I1234 , {i1, i2} {i1, i2, i3,, i4}, или I12 I1234 , {i1, i3} {i1, i2, i3,, i4}, или I13 I1234 , {i1, i4} {i1, i2, i3,, i4}, или I14 I1234 , {i2, i3} {i1, i2, i3,, i4}, или I23 I1234 , {i2, i4} {i1, i2, i3,, i4}, или I24 I1234 , {i3, i4} {i1, i2, i3,, i4}, или I34 I1234 , {i1, i2, i3} {i1, i2, i3,, i4}, или I123 I1234 , {i1, i2, i4} {i1, i2, i3,, i4}, или I124 I1234 , {i1, i3, i4} {i1, i2, i3,, i4}, или I134 I1234 , {i2, i3, i4} {i1, i2, i3,, i4}, или I234 I1234 , Аналогично можно получить для {i1, i2, i3}: {i1} {i1, i2, i3}, или I1 I123 , {i2} {i1, i2, i3}, или I2 I123 , {i3} {i1, i2, i3}, или I3 I123 , {i1, i2} {i1, i2, i3}, или I12 I123 , {i1, i3} {i1, i2, i3}, или I13 I123 , {i2, i3} {i1, i2, i3}, или I23 I123, для {i1, i2, i4}: {i1} {i1, i2, i4}, или I1 I124 , {i2} {i1, i2, i4}, или I2 I124, {i3} {i1, i2, i4}, или I3 I124 , {i1, i2} {i1, i2, i4}, или I12 I124 , {i1, i4} {i1, i2, i4}, или I14 I124 , {i2, i4} {i1, i2, i4}, или I24 I124, для {i2, i3,, i4}: {i2} {i2,, i3,, i4}, или I2 I234 , {i3} {i2,, i3,, i4}, или I3 I234 , {i4} {i2,, i3,, i4}, или I4 I234 , {i2,, i3} {i2,, i3,, i4}, или I23 I234 , {i2 , i4} {i2,, i3,, i4}, или I24 I234 , {i3,, i4} {i2,, i3,, i4}, или I34 I234, для {i1, i2}: {i1} {i1, i2}, или I1 I12 , {i2} {i1, i2}, или I2 I12 , для {i1, i3}: {i1} {i1, i3}, или I1 I13 , {i3} {i1, i3}, или I3 I13 , для {i1, i4}: {i1} {i1, i4}, или I1 I14 , {i4} {i1, i4}, или I4 I14 , для {i2, i3}: {i2} {i2,, i3}, или I2 I23 , {i3} {i2,, i3}, или I3 I23 , для {i2,, i4}: {i2} {i2,, i4}, или I2 I24 , {i4} {i2,, i4}, или I4 I24 , для {i3,, i4}: {i3} {i3,, i4}, или I3 I34 , {i4} {i3,, i4}, или I4 I34 , На рисунке 2 приведена схема сети связности для фрагментов информации с номерами i-123 (определяется показателями i1, i2, i3), i-12 (определяется показателями i1, i2), i-13 (определяется показателями i1, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем i1), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования). i-12 i-13 i-23 i-2 i-3 i-1 i-123 Рис. 2. Схема сети связности Из рисунка 2 видно, что: - из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3; - из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2; - из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3; - из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3. Заключение Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.
×

Об авторах

Антон Александрович Копыльцов

Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина) (СПбГЭТУ)

инженер-программист кафедры автоматизированных систем обработки информации и управления СПбГЭТУ

Список литературы

  1. Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
  2. Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
  3. Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
  4. Копыльцов А.А. Обработка информации в живых и технических системах // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  5. Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16-17 апреля 2014 г.). Нижневартовск, 2014.
  6. Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  7. Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23-25 октября 2013 г.). СПб., 2013.
  8. Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
  9. Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
  10. Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  11. Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы ХII Санкт-Петербургской международной конференции «Региональная информатика - 2010» (20-22 октября 2010 г.). СПб., 2010.
  12. Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3-4.
  13. Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.