Новая технология ИИ значительно повышает у роботов навыки распознавания предметов

Робот передвигает игрушечную упаковку сливочного масла по столу в лаборатории интеллектуальной робототехники и зрения Техасского университета в Далласе.

С каждым толчком робот учится распознавать объект с помощью новой системы, разработанной командой компьютерщиков из Калифорнийского университета в Далласе.

Новая система позволяет роботу нажимать на объекты несколько раз, пока не будет собрана последовательность изображений, что, в свою очередь, позволяет системе сегментировать все объекты в последовательности, пока робот не распознает объекты. Предыдущие подходы основывались на одном толчке робота для «изучения» объекта.

Команда представила свой исследовательский документ на конференции Robotics: Science and Systems, состоявшейся 10-14 июля в Тэгу, Южная Корея. Доклады для конференции были отобраны за их новизну, техническое качество, значимость, потенциальное воздействие и ясность.

До того дня, когда роботы смогут готовить ужин, убирать с кухонного стола и разбирать посудомоечную машину, еще далеко. Но исследовательская группа добилась значительного прогресса с помощью своей роботизированной системы, которая использует искусственный интеллект, чтобы помочь роботам лучше идентифицировать и запоминать объекты, сказал доктор Ю Сян, старший автор статьи.

«Если вы попросите робота поднять кружку или принести вам бутылку воды, робот должен распознать эти команды», — сказал Сян, доцент кафедры компьютерных наук в Школе инженерии и компьютерных наук имени Эрика Йонссона.

Технология исследователей из UTD предназначена для того, чтобы помочь роботам обнаруживать самые разнообразные объекты в окружающей среде, например, в домах, и обобщать или идентифицировать похожие версии обычных предметов, таких как бутылки с водой, которые выпускаются различных марок, форм или размеров.

Внутри лаборатории Сяна находится контейнер для хранения игрушек, наполненных обычными продуктами, такими как спагетти, кетчуп и морковь, которые используются для обучения лабораторного робота по имени Рамп. Ramp — это мобильный робот-манипулятор Fetch Robotics, высотой около 4 футов на круглой мобильной платформе. Ramp имеет длинную механическую руку с семью суставами. В конце — квадратная «ладонь» с двумя пальцами для захвата объектов.

Сян сказал, что роботы учатся распознавать предметы аналогично тому, как дети учатся взаимодействовать с игрушками.

«После нажатия на объект робот учится его распознавать», — сказал Сян. «С помощью этих данных мы обучаем модель искусственного интеллекта, чтобы в следующий раз, когда робот увидит объект, ему не нужно было нажимать на него снова. Когда робот увидит объект во второй раз, он просто возьмет его в руки «.

Что нового в методе исследователей, так это то, что робот нажимает на каждый предмет от 15 до 20 раз, в то время как предыдущие методы интерактивного восприятия использовали только одно нажатие. Сян сказал, что многократные нажатия позволяют роботу делать больше фотографий с помощью своей RGB-D камеры, которая включает датчик глубины, чтобы узнать о каждом предмете более подробно. Это снижает вероятность ошибок.

Задача распознавания, дифференциации и запоминания объектов, называемая сегментацией, является одной из основных функций, необходимых роботам для выполнения задач.

«Насколько нам известно, это первая система, которая использует долгосрочное взаимодействие роботов для сегментации объектов», — сказал Сян.

Нинад Харгонкар, докторант компьютерных наук, сказал, что работа над проектом помогла ему улучшить алгоритм, который помогает роботу принимать решения.

«Одно дело разработать алгоритм и протестировать его на абстрактном наборе данных; другое дело протестировать его на реальных задачах», — сказал Харгонкар. «Наблюдение за их работой в реальном мире — это был ключевой опыт обучения».

Следующим шагом для исследователей является улучшение других функций, включая планирование и контроль, что может позволить выполнять такие задачи, как сортировка переработанных материалов.