Identification of Anomalies in Analysis of Hydroacoustic Measurements of Unsteady Processes

封面


如何引用文章

全文:

详细

BACKGROUND: When processing hydroacoustic measurements, it is very important to identify and reject the so-called abnormal results as even one result can lead to false inference. The distinctive features of hydroacoustic measurements are, on the one hand, the high cost of errors in case of low accuracy and on the other hand, the difficulty of achieving the required accuracy due to the complexity and variability of the propagation medium and the background effect. The need to know the fine spatial and temporal structure of the measured hydroacoustic unsteady processes imposes additional strict requirements to the measurement methods and tools and their accuracy. The paper discusses and analyzes the issues related to the detection of anomalies in the analysis of hydroacoustic measurements of random non-stationary processes using the method of multiplication of estimates.

AIM: To develop an algorithm for detecting abnormal measurements for stationary and non-stationary processes based on the method of multiplication of estimates.

METHODS: To find the optimal parameter values of the proposed algorithms, we studied the relationship between the probability of correct detection and the probability of a false alarm and the number of multiplied estimates of the initial implementation and the number of covers per implementation length. It has been shown that in conditions of limited a priori data, this method allows to effectively determine the anomalous hydroacoustic measurements both for stationary and non-stationary processes.

RESULTS: Using simulation modeling, we built models of measurements represented by a non-stationary random sequence. The studies have shown the high efficiency of detecting abnormal measurements of the proposed algorithm based on the method of multiplication of estimates. The high performance of the proposed algorithm in conditions of limited a priori data allows for its use in automated primary data processing systems.

全文:

ВВЕДЕНИЕ

Россия традиционно относится к числу ведущим морских держав, играющих активную роль в изучении, освоении и использовании Мирового океана в интересах народного хозяйства и обеспечения обороноспособности страны. Основными источниками информации об обстановке в морской среде являются гидроакустические измерения [1–3].

Отличительными особенностями измерений в области гидроакустики являются, с одной стороны, высокая цена просчета в случае недостаточной их точности, а с другой — трудность достижения необходимой точности ввиду сложности и изменчивости среды распространения, влияния фона. Необходимость знания тонкой пространственной и временной структуры измеряемых гидроакустических нестационарных процессов предъявляет жесткие дополнительные требования к используемым методам и средствам измерений, а также к точности получаемых результатов.

На практике, в большинстве случаев, трудность обработки исходных данных заключается в отсутствии априорной информации о характеристиках случайного процесса [4–6]. Решить задачу обнаружения аномалий при априорной неопределенности аналитически довольно сложно. Чаще всего это сделать просто невозможно.

Рассмотрим и проанализируем метод обнаружения аномальных измерений, основанный на методе размножения оценок [7, 8].

МЕТОД РАЗМНОЖЕНИЯ ОЦЕНОК (МРО)

Пусть на вход измерительной системы поступает нестационарный случайный процесс y (t) в виде суммы полезного сигнала s (t) (функция тренда), аномальных измерений εан (t) и шумовой составляющей εш (t):

yt=st+εанt+εшt. (1)

Алгоритм обнаружения аномальных измерений должен обладать не только высокой эффективностью по отношению к обнаружению сбоев, но и требовать минимальное количество априорных данных о характеристиках полезного сигнала и аддитивного шума.

Усреднив по ансамблю размноженные значения оценочной функции измеряемого процесса, можно очистить исходные данные от шумовой составляющей [7, 8].

Предлагаемый метод обнаружения аномальных измерений основывается на использовании МРО.

На каждом интервале (покрытии) исходной реализации, используя метод наименьших квадратов (полиномом не выше 2-й степени), проводят аппроксимацию и находят разность

Δti=y(ti)sti,

после чего для Δ (ti) проводят ранжирование. При вычислении средней квадратической погрешности σ ранжированного ряда из рассмотрения исключают крайние значения, при этом

σ=1m1i=1mΔti2,

где m = N – 2; N — число отсчетов на покрытии.

Затем устанавливается порог ε = Aσ, (0 < A ≤ 3) превышение которого штрафуется разностным процессом, т.е. если

sti+ε<y(ti)ε, (2)

то y (ti) получает одно штрафное значение, равное 1.

Процедура определения штрафов повторяется для каждой из размноженных оценок исходной реализации.

Аномальными считаются отсчеты, у которых суммарное число штрафов превышает среднее значение.

Воспользовавшись имитационным моделированием, были получены модели результатов измерения, которые представляли собой нестационарную случайную последовательность. В свою очередь случайная составляющая включала в себя значения аномального характера (сбои). Амплитуда аномальных значений на протяжении всей выборки приняты постоянными и положительными. Положение сбоев в реализации, их количество и амплитуду варьировали в зависимости от характера исследований.

При использовании алгоритма по эффективности обнаружения аномальных значений модель представляла собой выборку стационарного гауссовского шума объемом 100 отсчетов, в которой содержалось десять аномальных значений амплитудой 20σ2, расположенных по выборке равномерно в начале, середине и в конце выборки.

Предложенная методика имеет недостаток: значение порога ε = Aσ зависит от σ, где АR, R — множество всех действительных чисел. Для устранения этого недостатка предлагается ввести адаптацию по ε.

При фиксированном уровне значимости α ≤ 0,01, где α — вероятность ложной тревоги, экспериментально найдена зависимость

εσ=26,847σ0,5565.

Для нахождения оптимальных значений параметров предлагаемых алгоритмов исследовали зависимости вероятности правильного обнаружения β = f (P), β = f (R) и вероятность ложной тревоги α = f (P), α = f (R), от числа размноженных оценок исходной реализации P и числа покрытий на длину реализации R.

На рис. 1 представлены вероятности ложной тревоги от числа размножений α (P) при фиксированном пороге обнаружения аномальных измерений и аппроксимации полиномом первой (кривая 1) и второй (кривая 2) степени.

 

Рис. 1. Зависимости вероятности ложной тревоги от числа размножений α (P).

Fig. 1. Relationship between the probability of false alarm and the number of multiplications α (P).

 

При использовании адаптации по порогу обнаружения значение вероятности ложной тревоги α = f (P) уменьшается в среднем в 100 раз. Полученные зависимости являются результатом усреднения по 1000 реализаций.

На рис. 2 приведены зависимости вероятности правильного обнаружения β = f (P) при адаптивном пороге обнаружения (кривые 1, 2) и неадаптивном (кривые 3, 4).

 

Рис. 2. Зависимости вероятности правильного обнаружения от числа размножений β (P).

Fig. 2. Relationship between the probability of correct detection and the number of multiplications β (P).

 

Кривые 1, 3 получены при аппроксимации на каждом покрытии полиномом 1-й степени, а графики 2, 4 — 2-й.

Сравнительный анализ результатов показывает, что при введении адаптации по порогу обнаружения аномальных значений удалось снизить уровень α в среднем в 100 раз. При этом уровень β снизился только на 20–30%.

Необходимо отметить, что увеличение числа размножений P > 7 не приводит к значительному росту β, а значения α несколько возрастают. В связи с этим в качестве оптимального значения числа размножения оценок предлагаемого алгоритма следует принять P = 7.

Совместный анализ зависимостей β = f (R, P) и α = f (R, P) показал, что в сечении графиков P = 7 для предлагаемого алгоритма оптимальное значение R = 10.

Методика, использующая адаптацию по порогу обнаружения, имеет ряд существенных преимуществ по сравнению с фиксированным порогом обнаружения. Однако основным недостатком по-прежнему остается зависимость от σ, т.к. σ нельзя достаточно точно определить при малых объемах выборок.

Отказаться от нахождения уровня дисперсии можно так. Для Δ (ti) на каждом покрытии определяется максимальное значение и устанавливается порог ε = Aymax (где 0 < A ≤ 1), превышение которого штрафуется. То есть, если

y(ti)>ε, (3)

то y (ti) получает одно штрафное значение, равное 1.

При этом для элементов исходной реализации, при выполнении условия (3), происходит накопление значений штрафов. По окончании обработки для всех оштрафованных значений строится плотность распределения вероятностей штрафов, по которой и определяют какие из измерений являются аномальными.

С помощью имитационного моделирования были проведены сравнительные исследования адаптивного алгоритма обнаружения аномальных измерений и метода обнаружения аномальных измерений на базе МРО при одних и тех же параметрах (P = 7 и R = 10).

На рис. 3 приведены кривые 1–3 для зависимости α (σ) и кривые 1’–3’ для зависимости β (σ) для алгоритма с адаптивным порогом обнаружения, где σ принимает значения 0,05; 0,1; 0,15; 0,2 при различных видах функций s (t); шумовая составляющая имела равномерный закон распределения.

 

Рис. 3. Зависимости вероятностей α (а) и β (b) от среднеквадратической погрешности σ для алгоритма с адаптивным порогом без сигнала (1, 1’), при экспоненциальном (2, 2’) и синусоидальном (3, 3’) полезных сигналах.

Fig. 3. Relationships between probabilities α (а) and β (b) and the mean square error σ for the adaptive threshold algorithm without a signal (1, 1’), with exponential (2, 2’) and sinewave (3, 3’) desired signals.

 

Из анализа результатов, показанных на рис. 3, следует, что последний из предложенных алгоритмов (третий) по сравнению с предыдущими является наиболее эффективным. Повышение эффективности наблюдается при оценивании как α, так и β, что связано с использованием способа размножения единственной реализации исходного процесса и принятия решения об измерениях при сбое не по порогу, а по плотности штрафных значений.

ЗАКЛЮЧЕНИЕ

Проведенные исследования показали высокую эффективность обнаружения аномальных измерений предлагаемого алгоритма, основанного на методе размножения оценок. Использование этого метода в качестве основы реализации предлагаемого алгоритма обнаружения позволило эффективно определять аномальные значения результатов измерений не только для стационарного, но и для нестационарного процесса. Высокая эффективность предлагаемого алгоритма в условиях ограниченных априорных данных позволяет его использовать в автоматизированных системах первичной обработки данных.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Автор несет ответственность за все аспекты работы, гарантируя надлежащее рассмотрение и решение вопросов, связанных с точностью и добросовестностью любой её части.

Источники финансирования. Автор заявляет об отсутствии внешнего финансирования при проведении исследования.

Конфликт интересов. Автор декларирует отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Оригинальность. При создании настоящей работы авторы не использовали ранее опубликованные сведения (текст, иллюстрации, данные).

Генеративный искусственный интеллект. При создании настоящей статьи технологии генеративного искусственного интеллекта не использовали.

Рассмотрение и рецензирование. Настоящая работа подана в журнал в инициативном порядке и рассмотрена по обычной процедуре. В рецензировании участвовали один рецензент, член редакционной коллегии и научный редактор издания.

ADDITIONAL INFORMATION

Author contributions: The author approved the version of the manuscript to be published and agrees to be accountable for all aspects of the work, ensuring that issues related to the accuracy or integrity of any part of the work are appropriately investigated and resolved.

Funding sources: No funding.

Disclosure of interests: The authors have no relationships, activities, or interests for the last three years related to for-profit or not-for-profit third parties whose interests may be affected by the content of the article.

Statement of originality: No previously obtained or published material (text, images, or data) was used in this study or article.

Generative AI: No generative artificial intelligence technologies were used to prepare this article.

Provenance and peer review: This paper was submitted unsolicited and reviewed following the standard procedure. The peer review process involved one reviewer, a member of the editorial board, and the in-house scientific editor.

×

作者简介

Evgeny Samarov

Saint Petersburg State Marine Technical University

编辑信件的主要联系方式.
Email: omega511@mail.ru
SPIN 代码: 1077-2126

Dr. Sci. (Engineering), Dean of the Faculty of Natural Sciences

俄罗斯联邦, 3, Lotsmanskaya St., Saint Petersburg, 190121

参考

  1. Acoustics of the ocean. Ed. J De Santo. Moscow: Mir; 1982. (In Russ.)
  2. Olshansky VV. Statistical methods in sonar. (Models, algorithms, solutions). Leningrad: Sudostroenie; 1983. (In Russ.)
  3. Firsov YuG. Fundamentals of hydroacoustics and the use of hydrographic sonars. St. Petersburg: Nestor-Istoriya; 2010. (In Russ.)
  4. Artyushenko VM, Volovach VI. Nonlinear estimation of signal parameters under the influence of narrow-band non-Gaussian interference. Avtometriya. 2019;55(1):80–88. (In Russ.)
  5. Artyushenko VM, Volovach VI. Estimation of the measurement error of the vector information parameter of the signal against the background of multiplicative interference. Radio Engineering. 2016;2:72–82. (In Russ.) EDN: VPKHLZ
  6. Fomin AF, Novoselov ON, Plushev AV. Rejection of abnormal measurement results. Moscow: Energoatomizdat, 1985. (In Russ.)
  7. Certificate Registration Program № 20003610367 / 12.02.2003. Marchuk VI, Sherstobitov AI. Identification of abnormal measurements in automated primary information processing systems: Reg. program number (In Russ.)
  8. Perevertkin SM, Kantor AV, Borodin NF, Shcherbakova TS. On–board telemetry equipment of space aircraft. Moscow: Mashinostroenie; 1977. (In Russ.)

补充文件

附件文件
动作
1. JATS XML
2. Fig. 1. Relationship between the probability of false alarm and the number of multiplications α (P).

下载 (54KB)
3. Fig. 2. Relationship between the probability of correct detection and the number of multiplications β (P).

下载 (56KB)
4. Fig. 3. Relationships between probabilities α (а) and β (b) and the mean square error σ for the adaptive threshold algorithm without a signal (1, 1’), with exponential (2, 2’) and sinewave (3, 3’) desired signals.

下载 (103KB)

版权所有 © Samarov E.K., 2025

Creative Commons License
此作品已接受知识共享署名 4.0国际许可协议的许可

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: ПИ № ФС 77 - 70733 от 15.08.2017.