Российские учёные представили инновационную нейросеть для точного распознавания объектов

На международной конференции по обработке изображений ICIP 2024 в Абу-Даби российские исследователи представили новую ансамблевую нейросеть, которая с высокой точностью определяет объекты на изображениях, не входящих в базы данных.

По словам учёных, новый алгоритм имеет потенциал для развития сфер беспилотных транспортных средств и медицинской диагностики, где важно различать неопознанные элементы и графические артефакты. С увеличением объема данных возникает необходимость в более надежных нейросетях, способных классифицировать новые объекты и распознавать технические помехи, которые часто возникают при получении изображений.

Команда исследователей, состоящая из студентов и преподавателей Университета МИСИС и Московского физико-технического института (МФТИ), разработала ансамблевую нейросеть SDDE (Saliency Diversified Deep Ensembles). Эта нейросеть состоит из нескольких моделей, каждая из которых обучается на подмножествах различных баз данных, фокусируясь на уникальных характеристиках изображений. Благодаря такому подходу, SDDE определяет объекты с минимальной погрешностью.

Один из авторов разработки, студент 3 курса Института компьютерных наук НИТУ МИСИС Максим Жданов, отметил, что SDDE показала лучшие результаты по сравнению с аналогичными алгоритмами. Исследователи предложили новый метод диверсификации ансамблей, что позволило повысить точность распознавания данных, находящихся вне распределения. Это особенно важно для применения нейросети в реальных условиях. Например, система автопилота должна безошибочно определять объекты на дороге, чтобы предотвращать аварии. В медицинской диагностике требуется обширная база данных, и неоткалиброванные модели могут быть чрезмерно уверенными в своих неверных предположениях. Новая нейросеть лишена излишней уверенности, что позволяет ей более адекватно оценивать свои расчеты.

Для улучшения обнаружения помех-артефактов исследователи использовали подход Outlier Exposure, который заключается в обучении модели на специальных наборах данных. Этот метод помогает нейросети лучше справляться с техническими помехами и аномалиями.

Алгоритм разрабатывался в некоммерческой лаборатории научных исследований искусственного интеллекта T-Bank AI Research.