Algorithm of correcting connections between fragments of poorly formalized information in storage and generation of new information

Abstract

The author has developed an algorithm for correcting the connections between fragments of poorly formalized information received from technical systems. It is assumed that the information comes to storage and it is characterized by a finite set of indicators. These indicators are convoluted and the convolution is a weighted sum with weight coefficients. Further the resulting convolution is compared with convolutions of fragments previously received pieces of information in the storage. If the Euclidean distance between the convolutions is less than a predetermined value ε, it is believed that these pieces of information are interconnected. The connections between pieces of information are considered and corrected in the storage, i.e. the fragments of information in storage which are interconnected with up to ε, up to 2 ε, up to 3 ε etc. are identified. Thus the connection level of the first, second, third and other orders is introduced. The information that some fragments of information are connected to each other can be regarded as new information, and this new information is determined by a set of indicators, which represents a union of indicators determining the initial pieces of information. One may consider a connectivity network of the first, second, third, etc. orders, i.e. a network with elements which are interconnected up to ε, up to 2 ε, up to 3 ε, etc. In some cases it is possible to determine the connection of pieces of information, i.e. which piece of information precedes the other or which fragment follows the other. This can be done as follows. If a piece of information number I1 is defined by some indicators, as a piece of information number I2 is determined by other indicators, and if all of the first indicators are characterized by earlier time parameters than all the second indicators, the piece of information number I1 precedes the piece of information number I2. However, it is not possible to conclude that the information number I1 results from information number I2 or vice versa. To the piece of information number I2 , defined by some set of indicators, result from the piece of information number I1 , defined by a different set of indicators, it is necessary that the piece of information number I2 must already contain the piece of information number I1 , i.e. the set of indicators defining I2 must be contained in the set of indicators defining I1 . This means that the piece of information number I1 already contains the fragment of information number I2, and therefore I2 can be obtained from I1 , i.e. I2 results from I1. An example of such pieces of information is considered. Let there be a piece of information number I1 , defined by some set of indicators consisting of k elements. Then this piece of information results in pieces of information, each of which is defined by a subset of the set consisting of k indicators. The following options are possible: the pieces of information defined by various combinations consisting of (k-1) indicators of the (k-2) indicators, ..., of 3 indicators, of 2 indicators, of 1 indicator. Moreover, similarly, each piece of information defined by (k-1) indicators results in pieces of information defined by a set of (k-2) indicators, ..., 3 indicators, by 2 indicators, by 1 indicator. Similarly it is for the pieces of information defined by (k-2), (k-3) and fewer indicators. In case of a piece of information defined by a set of indicators, consisting of 3 elements, this piece of information is followed by pieces of information, each of which is determined by various combinations consisting of 2 indicators and 1 indicator. In case of a piece of information defined by a set of indicators, which consists of 2 elements, then this piece of information is followed by pieces of information, each of which is defined by 1 indicator. Thus, an algorithm was developed to set a degree of connection of various pieces of information in storage, and this connection can be regarded as new information which can be processed further.

Full Text

В последние годы много внимания уделяется обработке слабо формализованной информации, поступающей от технических систем [3-11]. Под слабо формализованной информацией обычно понимают информацию, которая поступает от технических систем в непрерывном или дискретном виде с видео, аудио, температурных, ионных и других датчиков. Такая разнообразная информация, поступающая в больших объемах, плохо поддается обработке. Поэтому из слабо формализованной информации стараются получить формализованную путем, например, представления непрерывной информации в дискретном виде, а дискретную информацию можно, например, записать в таблицу в определенном, заранее выбранном, формате. Однако это не всегда возможно [2]. Часто поступающие от технических систем фрагменты информации взаимосвязаны. Однако эта взаимосвязь не очевидна, и трудно определить, какая информация следует из другой информации. Поэтому предлагается алгоритм коррекции связей между фрагментами слабо формализованной информации, находящимися в хранилище, который позволяет установить степень взаимосвязи различных фрагментов информации. Эту взаимосвязь фрагментов информации можно рассматривать как новую информацию и подвергать дальнейшей обработке. Обработка информации, поступающей в хранилище. Предполагается, что информация в хранилище характеризуется некоторым конечным набором показателей. При поступлении новой информации в хранилище осуществляется свертка ее показателей (CN - результат свертки) [1; 3; 5; 12; 13] и сравнение со свертками (C1, C2 , …, Ck) ранее полученных фрагментов информации, находящихся в хранилище, следующим образом. Если δNi = |CN -Ci| < ε для некоторого i {1, 2, …, k} и некоторого >0 , то считаем, что новая информация с номером N и старая информация с номером i между собой связаны. Пусть фрагменты информации поступают в хранилище. Считаем соответствующие им свертки С1, С2, …, Сn. Рассмотрим δij = |Ci - Cj |, где i, j = 1, 2, …, n и i ≠ j. Если δij < ε для некоторого ε > 0, то считаем, что эти фрагменты информации взаимосвязаны и образуют устойчивую группу взаимосвязанных фрагментов информации. Коррекция связей в хранилище и генерация новой информации. Рассмотрим сеть связей в хранилище для устойчивой группы взаимосвязанных фрагментов информации, состоящей из n элементов, i = 1, … , n. Если между информацией с номером i и информацией с номером j имеется Сij связей и Сij > C* , где C* - некоторое число, то считаем, что информация с номером i и информация с номером j связаны непосредственно (уровень связности Сij) (рис. 1). Информацию о том, что информация с номером Ii и информация с номером Ij связаны, можно рассматривать как новую информацию с номером Ik. Это означает, что если информация с номером Ii определяется показателями i1, i2, …, ii1 , а информация с номером Ij - показателями j1, j2, …, jj1 , то информация с номером Ik = Ii∪j определяется показателями i1, i2, …, ii1, j1, j2, …, jj1 , представляющими собой объединение показателей, которыми определяется информация с номерами Ii и Ij. Это означает, что свертка в дальнейшем делается по показателям i1, i2, …, ii1, j1, j2, …, jj1. X B A Рис. 1. Уровни связности между точками Если число связей второго порядка больше или равно двум (например, между точками А и В (сплошные линии)), то считаем, что точки А и В связаны непосредственно (уровень связности между точками А и В больше или равен 2, т.е. САВ ≥ 2, пунктирная линия) В некоторых случаях можно между информацией с номером Ii и информацией с номером Ij ввести отношение порядка, т.е. определить, какая из них предшествующая, а какая последующая, или какая из какой следует. Это можно сделать следующим образом. Если информация с номером Ii определяется показателями i1, i2, …, ii1, а информация с номером Ij - показателями j1, j2, …, jj1 , и если все показатели i1, i2, …, ii1 характеризуются более ранними временными характеристиками, чем все показатели j1, j2, …, jj1, то информация с номером Ii предшествует информации с номером Ij . Однако это не позволяет сделать заключение о том, что информация с номером Ij следует из информации с номером Ii, или наоборот. Для того, чтобы информация с номером Ii, определяемая показателями i1, i2, …, ii1, следовала из информации с номером Ij, определяемой показателями j1, j2, …, jj1, нужно, чтобы информация с номером Ii уже содержалась в информации с номером Ij , т.е. { i1, i2, …, ii1 } ⊂ {j1, j2, …, jj1}. Это означает, что в информации с номером Ij уже содержится информация с номером Ii, и поэтому из Ij можно получить Ii , т.е. Ii следует из Ij . Пусть дан фрагмент информации с номером Ij , определяемый показателями i1, i2, …, ik. Тогда из этого фрагмента информации следуют фрагменты информации, каждый из которых определяется некоторым подмножеством множества {i1, i2, …, ik}, т.е. {i1} {i1, i2, …, ik}, {i2} {i1, i2, …, ik}, {i3} {i1, i2, …, ik}, …………………….. {i1, i2} {i1, i2, …, ik}, {i1, i3} {i1, i2, …, ik}, {i1, i4} {i1, i2, …, ik}, ……………………….. и т.д. Например, пусть дан фрагмент информации с номером I, определяемый показателями i1, i2, i3,, i4. Тогда {i1} {i1, i2, i3,, i4}, или I1 I1234 , {i2} {i1, i2, i3,, i4}, или I2 I1234 , {i3} {i1, i2, i3,, i4}, или I3 I1234 , {i4} {i1, i2, i3,, i4}, или I4 I1234 , {i1, i2} {i1, i2, i3,, i4}, или I12 I1234 , {i1, i3} {i1, i2, i3,, i4}, или I13 I1234 , {i1, i4} {i1, i2, i3,, i4}, или I14 I1234 , {i2, i3} {i1, i2, i3,, i4}, или I23 I1234 , {i2, i4} {i1, i2, i3,, i4}, или I24 I1234 , {i3, i4} {i1, i2, i3,, i4}, или I34 I1234 , {i1, i2, i3} {i1, i2, i3,, i4}, или I123 I1234 , {i1, i2, i4} {i1, i2, i3,, i4}, или I124 I1234 , {i1, i3, i4} {i1, i2, i3,, i4}, или I134 I1234 , {i2, i3, i4} {i1, i2, i3,, i4}, или I234 I1234 , Аналогично можно получить для {i1, i2, i3}: {i1} {i1, i2, i3}, или I1 I123 , {i2} {i1, i2, i3}, или I2 I123 , {i3} {i1, i2, i3}, или I3 I123 , {i1, i2} {i1, i2, i3}, или I12 I123 , {i1, i3} {i1, i2, i3}, или I13 I123 , {i2, i3} {i1, i2, i3}, или I23 I123, для {i1, i2, i4}: {i1} {i1, i2, i4}, или I1 I124 , {i2} {i1, i2, i4}, или I2 I124, {i3} {i1, i2, i4}, или I3 I124 , {i1, i2} {i1, i2, i4}, или I12 I124 , {i1, i4} {i1, i2, i4}, или I14 I124 , {i2, i4} {i1, i2, i4}, или I24 I124, для {i2, i3,, i4}: {i2} {i2,, i3,, i4}, или I2 I234 , {i3} {i2,, i3,, i4}, или I3 I234 , {i4} {i2,, i3,, i4}, или I4 I234 , {i2,, i3} {i2,, i3,, i4}, или I23 I234 , {i2 , i4} {i2,, i3,, i4}, или I24 I234 , {i3,, i4} {i2,, i3,, i4}, или I34 I234, для {i1, i2}: {i1} {i1, i2}, или I1 I12 , {i2} {i1, i2}, или I2 I12 , для {i1, i3}: {i1} {i1, i3}, или I1 I13 , {i3} {i1, i3}, или I3 I13 , для {i1, i4}: {i1} {i1, i4}, или I1 I14 , {i4} {i1, i4}, или I4 I14 , для {i2, i3}: {i2} {i2,, i3}, или I2 I23 , {i3} {i2,, i3}, или I3 I23 , для {i2,, i4}: {i2} {i2,, i4}, или I2 I24 , {i4} {i2,, i4}, или I4 I24 , для {i3,, i4}: {i3} {i3,, i4}, или I3 I34 , {i4} {i3,, i4}, или I4 I34 , На рисунке 2 приведена схема сети связности для фрагментов информации с номерами i-123 (определяется показателями i1, i2, i3), i-12 (определяется показателями i1, i2), i-13 (определяется показателями i1, i3), i-23 (определяется показателями i2, i3), i-1 (определяется показателем i1), i-2 (определяется показателем i2), i-3 (определяется показателем i3). Стрелками обозначены отношения порядка (следования). i-12 i-13 i-23 i-2 i-3 i-1 i-123 Рис. 2. Схема сети связности Из рисунка 2 видно, что: - из фрагмента информации с номером i-123 следуют фрагменты информации с номерами i-12, i-13, i-23, i-1, i-2, i-3; - из фрагмента информации i-12 следуют фрагменты информации с номерами i-1 и i-2; - из фрагмента информации i-13 следуют фрагменты информации с номерами i-1 и i-3; - из фрагмента информации i-23 следуют фрагменты информации с номерами i-2 и i-3. Заключение Таким образом, разработан алгоритм, который позволяет установить степень взаимосвязи различных фрагментов информации, находящихся в хранилище, и эту взаимосвязь можно рассматривать как новую информацию, которая в дальнейшем может быть подвергнута дальнейшей обработке.
×

About the authors

Anton Alexandrovich Kopyltsov

Saint Petersburg State Electrotechnical University «LETI»

Programming Engineer at the Department of Automated Information Processing Systems of Saint Petersburg State Electrotechnical University «LETI»

References

  1. Воробьев В.И., Копыльцов А.В., Пальчун Б.П., Юсупов Р.М. Методы и модели оценивания качества программного обеспечения. СПб., 1992.
  2. Воройский Ф.С. Информатика. Энциклопедический словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. М., 2011.
  3. Копыльцов А.А. Модель классификации информации и алгоритм ее предварительной обработки для статических и динамических объектов // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2013. № 6.
  4. Копыльцов А.А. Обработка информации в живых и технических системах // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  5. Копыльцов А.А. Обработка слабо формализованной информации в живых и технических системах // Материалы Всероссийской научно-практической конференции студентов, магистров, аспирантов «Современное программирование» (16-17 апреля 2014 г.). Нижневартовск, 2014.
  6. Копыльцов А.А. Обработка слабо формализованной информации при недостатке информации // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  7. Копыльцов А.А. Сохранение конфиденциальности данных при поддержке принятия решений на основе извлекаемой специальным образом информации // Материалы VIII Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России» (23-25 октября 2013 г.). СПб., 2013.
  8. Копыльцов А.А., Копыльцов А.В. Алгоритм обработки слабо формализованной информации, поступающей от технических систем // Известия СПбГЭТУ «ЛЭТИ». Серия «Информатика, управление и компьютерные технологии». 2012. № 8.
  9. Копыльцов А.А., Копыльцов А.В. Обработка слабо формализованной информации, поступающей от технических систем // Вестник Нижневартовского государственного гуманитарного университета. 2013. № 1.
  10. Копыльцов А.А., Копыльцов А.В. Технические системы и слабо формализованная информация // Материалы ХIII Санкт-Петербургской международной конференции «Региональная информатика - 2012» (24-26 октября 2012 г.). СПб., 2012.
  11. Копыльцов А.А., Нечитайленко Р.А. Кластерное атрибутирование объектов информационной обработки по понятийным частным и интегральным признакам // Материалы ХII Санкт-Петербургской международной конференции «Региональная информатика - 2010» (20-22 октября 2010 г.). СПб., 2010.
  12. Копыльцов А.В. Об оценке качества программных продуктов // Проблемы информатизации (теоретический и научно-практический журнал). 1994. Вып. 3-4.
  13. Хованов Н.В. Статистические модели теории квалиметрических шкал. Л., 1986.

Statistics

Views

Abstract: 247

PDF (Russian): 344

Article Metrics

Metrics Loading ...

Refbacks

  • There are currently no refbacks.




This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies