В Tinkoff Research придумали, как ускорить обучение искусственного интеллекта в 20 раз

Учёные из лаборатории исследований искусственного интеллекта Tinkoff Research разработали SAC-RND — новый алгоритм для обучения ИИ. На робототехнических симуляторах было достигнуто повышение скорости обучения в 20 раз по сравнению со всеми существующими аналогами при возросшем на 10 % качестве. Оптимизация крайне ресурсоёмкого процесса обучения ИИ ускорит развитие многих сфер, где применяется ИИ.

Источник изображения: Tinkoff

Разработчики утверждают, что SAC-RND может «повысить безопасность беспилотных автомобилей, упростить логистические цепочки, ускорить доставку и работу складов, оптимизировать процессы горения на энергетических объектах и сократить выбросы вредных веществ в окружающую среду. Открытие не только улучшает работу узкоспециализированных роботов, но и приближает нас к созданию универсального робота, способного в одиночку выполнять любые задачи».

Результаты исследования были представлены в конце июня на 40-й Международной конференции по машинному обучению (ICML) в Гонолулу, Гавайи. Это конференция является одной из трёх крупнейших в мире в сфере машинного обучения и искусственного интеллекта.

Одним из наиболее перспективных видов обучения ИИ является обучение с подкреплением (RL), позволяющее ИИ учиться методом проб и ошибок, адаптироваться в сложных средах и изменять поведение на ходу. Обучение с подкреплением может использоваться во всех сферах: от регулирования пробок на дорогах до рекомендаций в социальных сетях.

При этом ранее считалось, что использование случайных нейросетей (RND) не применимо для офлайн-обучения с подкреплением. В методе RND используются две нейросети — случайная и основная, которая пытается предсказать поведение первой. Свойство нейросети определяются её глубиной — количеством слоёв, из которых она состоит. Основная сеть должна содержать больше слоёв, чем случайная, иначе моделирование и обучение становится нестабильным или даже невозможным.

Использование неправильных размеров сетей привело к ошибочному выводу, что метод RND не умеет дискриминировать данные — отличать действия из датасета от прочих. Исследователи из Tinkoff Research обнаружили, что при использовании эквивалентной глубины сетей, метод RND начинает качественно различать данные. Затем исследователи приступили к оптимизации ввода и научили роботов приходить к эффективным решениям при помощи механизма слияния, основанного на модуляции сигналов и их линейном отображении. До этого при использовании метода RND поступающие сигналы не подвергались дополнительной обработке.

На визуализации ниже в верхнем ряду показаны предыдущие попытки применения метода RND, в нижнем — метод SAC-RND. Стрелки на изображении должны вести робота в одну точку — они указывают направление к правильному действию. Метод Tinkoff Research во всех случаях стабильно приводит робота в нужную точку

Визуализация принятия решения роботами, обученными с помощью разных алгоритмов. Источник изображения: Tinkoff Research

Метод SAC-RND был протестирован на робототехнических симуляторах и показал лучшие результаты при меньшем количестве потребляемых ресурсов и времени. Открытие поможет ускорить исследования в области робототехники и обучения с подкреплением, поскольку оно снижает время получения устойчивого результата в 20 раз и является важным шагом на пути к созданию универсального робота.

Tinkoff Research — российская исследовательская некоммерческая группа. Учёные из Tinkoff Research исследуют наиболее перспективные области ИИ: обработку естественного языка (NLP), компьютерное зрение (CV), обучение с подкреплением (RL) и рекомендательные системы (RecSys). Команда курирует исследовательскую лабораторию «Тинькофф» на базе МФТИ и помогает талантливым студентам совершать научные открытия.

Источник

Admin04.08.2023

0 0 Время чтения: 2 мин.

В Tinkoff Research придумали, как ускорить обучение искусственного интеллекта в 20 раз

Добавить комментарий Отменить ответ

Google прокачает «Ассистента» с помощью большой языковой ИИ-модели

CD Projekt RED дала фанатам поиграть в аддон Phantom Liberty для Cyberpunk 2077 — новые подробности дополнения

Выручка Intel упала на 15 %, но компания смогла вернуться к прибыльности

Дополнение Medical School к симулятору Two Point Campus расскажет о нестандартных врачебных практиках и доверчивых пациентах

Xiaomi подтвердила, что Redmi K60 Ultra получит процессор MediaTek Dimensity 9200+

Wacom представила четыре графических планшета Wacom One стоимостью от $60 до $600

10K-гейминг: цена предзаказа Marvel’s Spider-Man 2 в «М.Видео» и «Эльдорадо» составила 9999 рублей, но у ретейлера есть объяснение

PowerColor раньше AMD представила Radeon RX 7800 XT c 16 Гбайт памяти

Правительство РФ выделило ещё 3,5 млрд рублей на ускорение внедрения 5G

Пошаговая ролевая тактика про управление повстанцами Lost Eidolons получила дату релиза на PS5, Xbox Series X и S

Threads потеряла половину активных пользователей, но Цукерберг намерен их вернуть

Новый алгоритм может похищать данные, анализируя звук нажимаемых клавиш с точностью до 95 %

В Китае в продаже обнаружилась особенная Radeon RX 580 с 16 Гбайт памяти

История повторяется: в Epic Games Store началась раздача Europa Universalis IV, а на подходе — «знаткая сказка» Black Book

NVIDIA представила суперчип GH200 Grace Hopper с памятью HBM3e и производительностью 4 Пфлопс

Марка Fisker представила электрические родстер Ronin и пикап Alaska, поставки которых начнутся в 2025 году

Microsoft обвинили в «вопиющем пренебрежении» кибербезопасностью

После трёх лет раннего доступа в Steam и GOG вышла полная версия Baldur’s Gate 3 — релизный трейлер и первые впечатления журналистов

«Не хороните своих врагов заживо»: Activision подтвердила дату выхода новой Call of Duty: Modern Warfare 3 и показала первый тизер

В США снова запустили реакцию термоядерного синтеза и добились повышения КПД

Статьи по теме

Добавить комментарий Отменить ответ