Алгоритм коррекции связей между фрагментами слабо формализованной информации в хранилище и генерации новой информации
- Авторы: Копыльцов А.А.1
-
Учреждения:
- Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина) (СПбГЭТУ)
- Выпуск: № 3 (2014)
- Страницы: 28-34
- Раздел: Статьи
- URL: https://vestnik.nvsu.ru/2311-1402/article/view/49326
- ID: 49326
Цитировать
Полный текст
Аннотация
Разработан алгоритм коррекции связей между фрагментами слабо формализованной информации, поступающей от технических систем. Предполагается, что информация поступает в хранилище и характеризуется некоторым конечным набором показателей. Осуществляется свертка этих показателей, которая представляет собой взвешенную сумму с весовыми коэффициентами. Далее осуществляется сравнение полученной свертки со свертками фрагментов ранее поступивших фрагментов информации в хранилище. Если евклидово расстояние между свертками меньше некоторого заранее заданного числа ε, то считается, что эти фрагменты информации между собой связаны. В хранилище рассматриваются связи между фрагментами информации, и осуществляется их коррекция, т.е. выявление фрагментов информации, находящейся в хранилище, которые между собой связаны с точностью до ε, до 2 ε, до 3 ε и т.д. Таким образом, вводится уровень связности первого, второго, третьего и других порядков. Информация о том, что некоторые фрагменты информация между собой связаны, можно рассматривать как новую информацию, и эта новая информация определяется множеством показателей, которое представляет объединение показателей, которыми определяются первоначальные фрагменты информации. Можно в хранилище рассмотреть сети связности первого, второго, третьего и так далее порядков, т.е. сети, элементы которых между собой связаны с точностью до ε, до 2 ε, до 3ε и т.д. В некоторых случаях можно определить взаимосвязь фрагментов информации, т.е. какой фрагмент информации какому фрагменту информации предшествует или какой фрагмент из какого фрагмента следует. Это можно сделать следующим образом. Если фрагмент информации с номером I1 определяется некоторыми показателями , а фрагмент информации с номером I2 определяется другими показателями, и если все первые показатели характеризуются более ранними временными характеристиками, чем все вторые показатели , то фрагмент информация с номером I1 предшествует фрагменту информации с номером I2 . Однако это не позволяет сделать заключение о том, что информация с номером I1 следует из информации с номером I2 или наоборот. Для того, чтобы фрагмент информации с номером I2, определяемый некоторым набором показателей, следовал из фрагмента информации с номером I1 , определяемым другим набором показателей, нужно, чтобы фрагмент информации с номером I2 уже содержался в фрагменте информации с номером I1 , т.е. набор показателей определяющий I2 должен содержаться в наборе показателей определяющем I1 . Это означает, что в фрагменте информации с номером I1 уже содержится фрагмент информации с номером I2 и, поэтому, из I1 можно получить I2 , т.е. I2 следует из I1. Рассмотрен пример таких фрагментов информации. Пусть дан фрагмент информации с номером I1 , определяемый некоторым набором показателями состоящим из k элементов. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества состоящего из k показателей. Возможны следующие варианты: фрагменты информации, определяемые различными комбинациями, состоящими из (k-1) показателей, из (k-2) показателей, …, из 3 показателей, из 2 показателей, из 1 показателя. Кроме того, аналогично, из каждого фрагмента информации, определяемого (k-1) показателями, следуют фрагменты информации, определяемые наборами из (k-2) показателей, …, из 3 показателей, из 2 показателей, из 1 показателя. Аналогично для фрагментов информации, определяемых (k-2), (k-3) и меньшим количеством показателей. Если дан фрагмент информации, определяемый набором показателей, состоящим из 3 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется различными комбинациями, состоящими из 2 показателей и из 1 показателя. Если дан фрагмент информации, определяемый набором показателей, состоящим из 2 элементов, то из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется 1 показателем. Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.
Ключевые слова
Полный текст
В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3-11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке. Обработка информации, поступающей в хранилище. Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей (CN - результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками (C1, C2 , …, Ck) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если δNi = |CN -Ci| < ε для некоторого i {1, 2, …, k} и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером i между собой связаны. Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С1, С2, …, Сn. Рассмотрим δij = |Ci - Cj |, где i, j = 1, 2, …, n и i ≠ j. Если δij < ε для некоторого ε > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации. Коррекция связей в хранилище и генерация новой информации. Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из n элементов, i = 1, … , n. Если между информацией с номером i и информацией с номером j имеется Сij связей и Сij > C* , где C* - некоторое число, то считаем, что информация с номером i и информация с номером j связаны непосредственно (уровень связности Сij) (рис. 1). Информацию о том, что информация с номером Ii и информация с номером Ij связаны, можно рассматривать как новую информацию с номером Ik. Это означает, что если информация с номером Ii определяется показателями i1, i2, …, ii1 , а информация с номером Ij - показателями j1, j2, …, jj1 , то информация с номером Ik = Ii∪j определяется показателями i1, i2, …, ii1, j1, j2, …, jj1 , представляющими собой объединение показателей, которыми определяется информация с номерами Ii и Ij. Это означает, что свертка в дальнейшем делается по показателям i1, i2, …, ii1, j1, j2, …, jj1. X B A Рис. 1. Уровни связности между точками Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. САВ ≥ 2, пунктирная линия) В некоторых случаях можно между информацией с номером Ii и информацией с номером Ij ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует. Это можно сделать следующим образом. Если информация с номером Ii определяется показателями i1, i2, …, ii1, а информация с номером Ij - показателями j1, j2, …, jj1 , и если все показатели i1, i2, …, ii1 характеризуются более ранними временными характеристиками, чем все показатели j1, j2, …, jj1, то информация с номером Ii предшествует информации с номером Ij . Однако это не позволяет сделать заключение о том, что информация с номером Ij следует из информации с номером Ii, или наоборот. Для того, чтобы информация с номером Ii, определяемая показателями i1, i2, …, ii1, следовала из информации с номером Ij, определяемой показателями j1, j2, …, jj1, нужно, чтобы информация с номером Ii уже содержалась в информации с номером Ij , т.е. { i1, i2, …, ii1 } ⊂ {j1, j2, …, jj1}. Это означает, что в информации с номером Ij уже содержится информация с номером Ii, и поэтому из Ij можно получить Ii , т.е. Ii следует из Ij . Пусть дан фрагмент информации с номером Ij , определяемый показателями i1, i2, …, ik. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества {i1, i2, …, ik}, т.е. {i1} {i1, i2, …, ik}, {i2} {i1, i2, …, ik}, {i3} {i1, i2, …, ik}, …………………….. {i1, i2} {i1, i2, …, ik}, {i1, i3} {i1, i2, …, ik}, {i1, i4} {i1, i2, …, ik}, ……………………….. и т.д. Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда {i1} {i1, i2, i3,, i4}, или I1 I1234 , {i2} {i1, i2, i3,, i4}, или I2 I1234 , {i3} {i1, i2, i3,, i4}, или I3 I1234 , {i4} {i1, i2, i3,, i4}, или I4 I1234 , {i1, i2} {i1, i2, i3,, i4}, или I12 I1234 , {i1, i3} {i1, i2, i3,, i4}, или I13 I1234 , {i1, i4} {i1, i2, i3,, i4}, или I14 I1234 , {i2, i3} {i1, i2, i3,, i4}, или I23 I1234 , {i2, i4} {i1, i2, i3,, i4}, или I24 I1234 , {i3, i4} {i1, i2, i3,, i4}, или I34 I1234 , {i1, i2, i3} {i1, i2, i3,, i4}, или I123 I1234 , {i1, i2, i4} {i1, i2, i3,, i4}, или I124 I1234 , {i1, i3, i4} {i1, i2, i3,, i4}, или I134 I1234 , {i2, i3, i4} {i1, i2, i3,, i4}, или I234 I1234 , Аналогично можно получить для {i1, i2, i3}: {i1} {i1, i2, i3}, или I1 I123 , {i2} {i1, i2, i3}, или I2 I123 , {i3} {i1, i2, i3}, или I3 I123 , {i1, i2} {i1, i2, i3}, или I12 I123 , {i1, i3} {i1, i2, i3}, или I13 I123 , {i2, i3} {i1, i2, i3}, или I23 I123, для {i1, i2, i4}: {i1} {i1, i2, i4}, или I1 I124 , {i2} {i1, i2, i4}, или I2 I124, {i3} {i1, i2, i4}, или I3 I124 , {i1, i2} {i1, i2, i4}, или I12 I124 , {i1, i4} {i1, i2, i4}, или I14 I124 , {i2, i4} {i1, i2, i4}, или I24 I124, для {i2, i3,, i4}: {i2} {i2,, i3,, i4}, или I2 I234 , {i3} {i2,, i3,, i4}, или I3 I234 , {i4} {i2,, i3,, i4}, или I4 I234 , {i2,, i3} {i2,, i3,, i4}, или I23 I234 , {i2 , i4} {i2,, i3,, i4}, или I24 I234 , {i3,, i4} {i2,, i3,, i4}, или I34 I234, для {i1, i2}: {i1} {i1, i2}, или I1 I12 , {i2} {i1, i2}, или I2 I12 , для {i1, i3}: {i1} {i1, i3}, или I1 I13 , {i3} {i1, i3}, или I3 I13 , для {i1, i4}: {i1} {i1, i4}, или I1 I14 , {i4} {i1, i4}, или I4 I14 , для {i2, i3}: {i2} {i2,, i3}, или I2 I23 , {i3} {i2,, i3}, или I3 I23 , для {i2,, i4}: {i2} {i2,, i4}, или I2 I24 , {i4} {i2,, i4}, или I4 I24 , для {i3,, i4}: {i3} {i3,, i4}, или I3 I34 , {i4} {i3,, i4}, или I4 I34 , На рисунке 2 приведена схема сети связности для фрагментов информации с номерами i-123 (определяется показателями i1, i2, i3), i-12 (определяется показателями i1, i2), i-13 (определяется показателями i1, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем i1), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования). i-12 i-13 i-23 i-2 i-3 i-1 i-123 Рис. 2. Схема сети связности Из рисунка 2 видно, что: - из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3; - из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2; - из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3; - из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3. Заключение Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.×
Об авторах
Антон Александрович Копыльцов
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина) (СПбГЭТУ)инженер-программист кафедры автоматизированных систем обработки информации и управления СПбГЭТУ
Список литературы
- Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
- Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
- Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
- Копыльцов А.А. Обработка информации в живых и технических системах // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16-17 апреля 2014 г.). Нижневартовск, 2014.
- Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23-25 октября 2013 г.). СПб., 2013.
- Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
- Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
- Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
- Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы ХII Санкт-Петербургской международной конференции «Региональная информатика - 2010» (20-22 октября 2010 г.). СПб., 2010.
- Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3-4.
- Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.
Дополнительные файлы
