193232, Санкт-Петербург, пр. Большевиков, д. 22/1 vestnik@sut.ru
ISSN 3034-2201

Конференция "Подготовка профессиональных кадров в магистратуре
в эпоху цифровой трансформации" (ПКМ).
Избранные статьи

2026 год

 

Луканов С. Ю., Тимошевская О. Ю.

Экспериментальное исследование мультиагентных подходов к обучению с подкреплением в задаче планирования пути покрытия

Аннотация
Постановка задачи. Задача планирования пути покрытия группами автономных агентов определенной целевой области является актуальной для широкого класса прикладных систем. Рост размерности среды и числа взаимодействующих агентов приводит к усложнению процессов координации и увеличению времени достижения полного покрытия. Дополнительную сложность вносит ограниченность наблюдений агентов, в результате чего задача управления формулируется в условиях частичной наблюдаемости и стохастической динамики. В связи с этим весьма востребованной является разработка специализированных подходов к интеллектуальному управлению, обеспечивающих минимизацию времени покрытия целевой области при децентрализованном принятии решений. Целью исследования является разработка инструментария, который позволяет обучать модели управления группой однородных автономных агентов в задаче планирования пути покрытия целевой области, обеспечивающих минимизацию математического ожидания времени достижения полного покрытия в условиях частично наблюдаемого марковского процесса принятия решений.
Методы. Для формализации задачи используется модель частично наблюдаемого марковского процесса принятия решений, включающая описание состояний системы, пространств действий и наблюдений агентов, вероятностной динамики среды и функции вознаграждения. Решение задачи синтеза групповой стратегии основано на методах глубокого обучения с подкреплением для мультиагентных систем, ориентированных на децентрализованное исполнение при обучении с централизованным критиком. Для оценки эффективности применяются методы имитационного моделирования в дискретном двухмерном клеточном пространстве. Новизна. Разработана унифицированная экспериментальная среда для сопоставления мультиагентных архитектур в задаче планирования пути покрытия целевой области. Показано, что использование карт малого размера ограничивает статистическую значимость ряда метрик координации агентов, что обосновывает переход к картам большего размера. Выявлены типовые источники деградации качества покрытия, связанные с граничными эффектами и малыми фрагментами целевой области, и предложена модификация среды, снижающая влияние указанных факторов. Результаты. Предложен подход к синтезу групповой стратегии управления, позволяющий обеспечить достижение полного покрытия целевой области за конечное время. Проведенное моделирование подтверждает возможность эффективной координации действий агентов и сокращения времени покрытия по сравнению с некоординированными стратегиями при сохранении децентрализованного характера управления. Экспериментальные исследования показали различия в динамике покрытия и координации агентов для рассматриваемых архитектур. Теоретическая значимость работы заключается в развитии методов формализации и решения задач мультиагентного покрытия в условиях частичной наблюдаемости. Практическая значимость определяется возможностью применения полученных результатов при разработке интеллектуальных систем управления группами автономных мобильных агентов, в том числе для задач мониторинга, разведки и робототехнических систем. Полученные результаты могут быть использованы при проектировании мультиагентных систем покрытия и при сравнительном анализе методов управления агентами в сложных дискретных средах.

Ключевые слова
глубокое обучение с подкреплением, система управления, планирование пути покрытия, мультиагентная система, искусственный интеллект.

Библиографическая ссылка на статью
Луканов С. Ю., Тимошевская О. Ю. Экспериментальное исследование мультиагентных подходов к обучению с подкреплением в задаче планирования пути покрытия // Вестник СПбГУТ. 2026. Т. 4. № 1. С. 2. EDN: TTWHJB

Эта статья относится к разделу Информационные системы и технологии

Эта статья относится к разделу "Подготовка профессиональных кадров в магистратуре в эпоху цифровой трансформации" (ПКМ)

EDN: TTWHJB
Читать статью

 


 

Лосев А. П., Бучатский А. Н.

Разработка метода выбора параметров сжатия видео для кодека AV1 на основе алгоритма многокритериальной оптимизации NSGA-II

Аннотация
Постановка задачи. Увеличение требований к пропускной способности сетей связи в результате распространения видео сверхвысокой четкости актуализирует вопросы обеспечения эффективного сжатия таких потоков при помощи видеокодеков. Современные видеокодеки, основанные на высокой вычислительной сложности за счет применения ресурсоемких математических операций, чрезвычайно требовательны к аппаратным ресурсам и являются ресурсоемкими в отношении времени сжатия видеопоследовательностей. Целью исследования является разработка алгоритма, позволяющего предсказывать наиболее оптимальные параметры для сжатия видео при помощи алгоритма многокритериальной оптимизации. Предлагается применять алгоритм NSGA-II и видеокодек AV1 как образцы алгоритма многокритериальной оптимизации и ресурсозатратного видеокодека, так как программные энкодеры для AV1 до сих пор требуют большого количества времени на сжатие видео. В качестве методов используется решение задачи многокритериальной оптимизации параметров сжатия видео в форме отдельных элементов указанной задачи, а также формирование Парето-оптимального набора ее решений как выходного элемента алгоритма с учетом специфики программного сжатия видео с применением библиотеки с открытым исходным кодом FFMpeg. Основными параметрами задачи многокритериальной оптимизации являются время сжатия, коэффициент сжатия, а также метрики объективной оценки качества (пиковое отношение сигнал / шум, индекс структурного сходства и многометодная оценка с методом слияния) в качестве полноценного набора используемых величин при программном сжатии видео. Элементом новизны представленного исследования является применение многокритериальной оптимизации к процессу сжатия видеопоследовательности и рассмотрение параметров видеокодека как коэффициентов для вышеупомянутой задачи. Также к элементам новизны можно отнести адаптивный метод расчетов, учитывающий разрешение и частоту входных кадров в видеопоследовательности. Результат. Использование представленного решения по применению многокритериальной оптимизации к видеопоследовательностям на этапе сжатия позволяет заранее спрогнозировать желаемые параметры для целевого видеофрагмента при конвертации видео из несжатого формата в сжатый, а также создает новые возможности для анализа влияния параметров видеокодеков на основе их моделирования в рамках многокритериальной оптимизации. Проведенное моделирование задачи пятикритериальной оптимизации с пятью поколениями из 40 особей в каждом позволило получить сводную таблицу для восьми показателей сжатия видео, таких как метрики объективной оценки качества, скорость цифрового потока, параметры кодека и время сжатия видео. Практическая значимость. Внедрение данного программного модуля в программы нелинейного монтажа видео обеспечит пользователей адаптивным подбором параметров кодека при экспорте видеопоследовательности, что позволит быстрее получать заданный результат. На основе представленного программного решения задачи многокритериальной оптимизации создана программа для ЭВМ, позволяющая проводить анализ видеопоследовательностей при помощи алгоритма, описанного в исследовании.

Ключевые слова
видеокодек, задача многокритериальной оптимизации, Парето-фронт, сжатие видео, видеокодек AV1, цветовое пространство YUV, алгоритм NSGA-II, пространственная и временная сложность видео.

Библиографическая ссылка на статью
Лосев А. П., Бучатский А. Н. Разработка метода выбора параметров сжатия видео для кодека AV1 на основе алгоритма многокритериальной оптимизации NSGA-II // Вестник СПбГУТ. 2026. Т. 4. № 1. С. 3. EDN: VURWDD

Эта статья относится к разделу Радиотехнологии связи

Эта статья относится к разделу "Подготовка профессиональных кадров в магистратуре в эпоху цифровой трансформации" (ПКМ)

EDN: VURWDD
Читать статью

 


 

Ушакова А. Р., Казанцева А. Г.

Проектирование архитектуры государственной информационной системы как инструмента цифровой верификации данных об отходах

Аннотация
Постановка задачи. Современная модель государственного экологического надзора переходит от частотного контроля к риск-ориентированному подходу, требующему достоверных и верифицируемых цифровых данных. В сфере обращения с отходами актуальной проблемой остается расхождение между заявленными и фактическими массами отходов, что затрудняет оценку негативного воздействия объектов на окружающую среду. Целью исследования является обоснование архитектуры государственной информационной системы, обеспечивающей цифровую верификацию данных об отходах и автоматическое выявление индикаторов риска на основе достоверных источников информации. Элементом научной и прикладной новизны является предложенная архитектура системы цифровой верификации данных об отходах, объединяющая автоматизированный расчет нормативов образования отходов и механизм цифровой верификации на основе фактических данных. В отличие от существующих подходов, предлагаемое решение исключает необходимость ручной обработки данных и обеспечивает формирование достоверных, воспроизводимых индикаторов риска, соответствующих требованиям риск-ориентированного подхода государственного экологического надзора. Результаты. Разработана архитектура государственной информационной системы, включающей подсистему внутреннего учета для хозяйствующих субъектов и подсистему мониторинга для Росприроднадзора. Первая подсистема автоматически рассчитывает нормативы образования отходов на основе данных «1С: Бухгалтерия» и сведений о выпускаемой продукции. Вторая подсистема сопоставляет расчетные нормативы с фактическими данными из отчетов об организации и о результатах осуществления производственного экологического контроля, выявляя расхождения и классифицируя отходы как находящиеся в «зоне риска». Интеграция данных происходит с сохранением конфиденциальности коммерческой информации. Система также обеспечивает обратную интеграцию, автоматически заполняя формы отчетности в Личном кабинете природопользователя. Практическая значимость. Внедрение системы может повысить точность экологического учета, снизить административную нагрузку, усилить прозрачность данных и обеспечить приоритет надзора в отношении объектов с наибольшими рисками нарушений обязательных требований.

Ключевые слова
Росприроднадзор, объекты контроля, индикаторы риска, обращение с отходами, цифровизация, государственная информационная система.

Библиографическая ссылка на статью
Ушакова А. Р., Казанцева А. Г. Проектирование архитектуры государственной информационной системы как инструмента цифровой верификации данных об отходах // Вестник СПбГУТ. 2026. Т. 4. № 1. С. 4. EDN: EVGLPR

Эта статья относится к разделу Цифровая экономика, управление и бизнес-информатика

Эта статья относится к разделу "Подготовка профессиональных кадров в магистратуре в эпоху цифровой трансформации" (ПКМ)

EDN: EVGLPR
Читать статью