Іванюк А. О. Дослідження взаємозв’язків у даних з використанням шту- чних нейронних мереж

English version

Дисертація на здобуття ступеня доктора філософії

Державний реєстраційний номер

0825U000334

Облікова картка дисертації

0825U000334.pdf

Здобувач

Іванюк Андрій Олегович

Спеціальність

113 - Прикладна математика

Дата захисту

13-12-2024

Спеціалізована вчена рада

PhD 7057

Національний університет "Києво-Могилянська академія"

Анотація

Іванюк А.О. Дослідження взаємозв’язків у даних з використанням штучних нейронних мереж — Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії у галузі знань 11 “Математика та статистика” за спеціальністю 113 “Прикладна математика”. — Національний університет «Києво-Могилянська академія», Київ, 2024. Ця дисертація зосереджена на вивченні зв’язків у даних за допомогою застосування штучних нейронних мереж. Ці зв’язки можуть бути представлені в різних формах, і моделюватись по-різному. Їх правильне моделювання є ключовим для успішного вирішення різноманітних завдань, таких як класифікація, регресія та генеративне моделювання. У сучасних нейронних мережах широко використовуються стандартні метрики для оцінки їх продуктивності, наприклад, класифікаційна точність, середньоквадратична похибка тощо. Проте, високі показники цих метрик не гарантують відсутності помилок або вразливостей у моделях. Моделі можуть видавати помилкові результати з високим рівнем впевненості, особливо при взаємодії з адверсаріальними прикладами — спеціально створеними вхідними даними, які вводять модель в оману. Це дослідження стосується цієї важливої проблеми шляхом детального вивчення кількісної оцінки невизначеності та стійкості нейронних мереж до адверсаріальних атак. Використовуючи адверсаріальні дані як інструмент, ця робота спрямована на поглиблення розуміння надійності моделей та розроблення більш стійких систем на основі нейронних мереж, які можуть протистояти різноманітним атакам та забезпечувати стабільну продуктивність у реальних застосуваннях. Досліджуючи адверсаріальні взаємозв’язки та патерни в даних, ця робота має на меті використовувати їх як метрику генералізації для виявлення слабких місць моделей та оцінки їх здатності до узагальнення. Розуміння того, як моделі реагують на суперечливі збурення, відкриває унікальний погляд на їх внутрішню структуру та механізми прийняття рішень. Це дозволяє не лише виявляти вразливі місця, але й розробляти методи для їх усунення, що підвищує загальну надійність та ефективність моделей. У рамках цього дослідження вивчаються різні параметризації нейронних мереж для моделювання послідовностей та їх вплив на продуктивність моделей і стійкість до адверсаріальних атак. Особлива увага приділяється новим архітектурам та активаційним функціям, які можуть покращити здатність моделей до генералізації та їхню стійкість. Адверсаріальна стійкість розглядається як важлива метрика для виявлення слабких місць моделей та оцінки їх загальної ефективності. Дослідження охоплює ефективні параметризації для різних типів вхідних даних, включаючи зображення, мовні сигнали та текст. Застосовуються ці параметризації до різних завдань машинного навчання, таких як класифікація зображень, моделювання мови та регресія на основі латентних дифузійних моделей. Проведені експерименти спрямовані на виявлення того, як різні стратегії параметризації можуть покращити продуктивність моделей, зберігаючи або навіть підвищуючи їх стійкість до адверсаріальних атак. Отримані результати надають важливі знання для розробки більш надійних та здатних до генералізації моделей машинного навчання. Це сприяє прогресу у цій галузі шляхом виявлення оптимальних технік параметризації, які збалансовують продуктивність та стійкість, та можуть бути застосовані у широкому спектрі практичних задач. Загалом, ця дисертація робить вагомий внесок у розуміння та покращення стійкості нейронних мереж до адверсаріальних атак, пропонуючи нові підходи до параметризації та моделювання, які можуть бути застосовані у різних сферах машинного навчання. Результати цього дослідження можуть стати основою для розробки більш надійних та ефективних моделей, здатних забезпечувати високу продуктивність та безпеку у реальних застосуваннях. Проведені експерименти підтверджують, що використання розглянутих параметризацій може підвищити точність класифікації, але також виявляють складності, пов’язані з їх адверсаріальним тренуванням. Подальші дослідження у цьому напрямку можуть призвести до створення моделей, які не лише демонструють високу продуктивність, але й є стійкими до різноманітних атак, що є критично важливим у сучасному світі, де безпека та надійність моделей машинного навчання набувають все більшого значення. Ключові слова: адверсаріальна стійкість, адверсаріальні приклади, адверсаріальне очищення, механізм уваги, параметризація моделей, дифузійне моделювання, автокодувальники, обробка сигналів, адаптивні алгоритми, алгоритми оптимізації, функції активації, регуляризація нейронні мережі, штучна нейронна мережа, алгоритм, згорткова нейронна мережа, параметри, похибка машинне навчання, класифікація, регресія, генеративне моделювання, комп’ютерний зір, обробка природної мови, аудіо моделювання.

Читати повністю

Керівник роботи

Крюкова Галина Віталіївна

Офіційні опоненти

Родіонов Андрій Миколайович
Cеменов Володимир Вікторович

Рецензенти

Олецький Олексій Віталійович
Швай Надія Олександрівна

Публікації

A. Ivaniuk and G. Kriukova, ”On Geometric Properties of Adversarial Examples,”2021 11th IEEE International Conference on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications (IDAACS), Cracow, Poland, 2021, pp. 964-967

Ivaniuk A. Speech audio modeling by means of causal moving average equipped gated attention / A. Ivaniuk // Могилянський математичний журнал. - 2022. - Т. 5. - С. 53-56.

A. Ivaniuk (2024). ”Latent diffusion model for speech signal processing.”Bulletin of V.N. Karazin Kharkiv National University, series Mathematical modelling. Information technology. Automated control systems, vol. 61, pp. 43-51.

Читати повністю

Схожі дисертації

0825U000335

Слєпко Роман Тарасович

Аналіз стану поверхонь пар тертя за характеристикаси вібраційних сигналів

0825U000322

Гембара Назар Тарасович

Математичне моделювання двоїстого впливу водню на залишкову довговічність елементів конструкцій

0825U000323

Гриненко Михайло Васильович

Моделювання напружено-деформованого стану та експериментально-розрахунковий метод оцінки опірності руйнуванню теплоенергетичної сталі

0825U000316

Райтер Орест Костянтинович

Математичні моделі для оцінки довговічності фібробетонних елементів конструкцій за повзучості

0825U000218

Ольшевська Віта Анатоліївна

Алгоритми i коди над силовськими 2-пiдгрупами симетричних груп S2n