Упрощенный компонент оптической нейронной сети экономит пространство и энергию

По мере развития исследований в области фотонных вычислений ученые стремятся оптимизировать производительность оптических вычислительных устройств путем внесения специальных изменений в их конструкцию.

Команда под руководством Бо Ву и Шаоцзе Лю из Университета науки и технологии Хуачжун в Китае разработала и протестировала своего рода интерферометрическую сетку Маха-Цендера, которая более эффективна при выполнении вещественного умножения матрицы на вектор.

Их исследование было опубликовано 19 сентября в Intelligent Computing.

Обычная сетка интерферометра Маха-Цендера обладает многими преимуществами, включая большую полосу пропускания и высокую стабильность. Однако она была разработана для сложнозначного матрично-векторного умножения, типа вычислений, требования к оборудованию которого отличаются от требований к вещественному матрично-векторному умножению. Новая сетка настроена таким образом, чтобы использовать преимущества различий между двумя типами вычислений.

Новая сетка более эффективна, поскольку вещественнозначные матрицы имеют вдвое меньше степеней свободы, чем комплекснозначные матрицы, и, следовательно, требуют вдвое меньше фазовращателей. Меньшее количество фазовращателей означает меньшую аппаратную часть, для работы которой требуется меньше электроэнергии. Более того, упрощенная сетка проще в использовании и ее легче изготовить благодаря способу обнаружения света.

Для обычной сетки требуется «когерентный» свет, такой как свет от лазера, волны которого имеют одинаковый размер, форму и направление. Упрощенная сетка обнаруживает «некогерентный» свет, разновидность света, волны которого гораздо менее регулярны и могут создаваться более широким спектром источников света.

По словам исследователей, «Результаты показывают, что предлагаемая сетка MZI демонстрирует отличную производительность в тестовой задаче. Кроме того, анализ ошибок показывает, что предлагаемая схема устойчива к ошибкам изготовления». Более того, упрощенная сетка масштабируема, что означает, что она обладает большим потенциалом для использования в крупномасштабных оптических нейронных сетях, где экономия была бы столь же велика.

«Сначала мы разработали архитектуру, руководствуясь нашей интуицией и здравым смыслом, потому что существует явная избыточность фазовращателей», — сказал автор-корреспондент Хайлун Чжоу из Университета науки и технологии Хуачжун.

Сетка разрабатывалась в несколько этапов, начиная с обычной сетки «типа 0» для оптической матрицы с комплексным значением, переходя к сетке «типа 1» с меньшим количеством фазовращателей, затем к сетке «типа 2» с дополнительным выходным портом, затем к сетке «типа 3» с меньшим размером. Эффективность сетки 3-го типа подтверждается математическими доказательствами и численным моделированием.

«Мы просто хотели рискнуть, выполнив численное моделирование, но неожиданно получили отличный результат», — говорят эксперты.

Моделирование было популярной контрольной задачей по классификации ириса, в которой компьютер должен «изучить» свойства трех различных видов цветков ириса путем обработки набора данных физических измерений, соответствующих примерам каждого типа. Алгоритмом обучения, использованным в этом исследовании, была оптимизация роя частиц. Следующим шагом, по словам авторов, является выполнение крупномасштабной задачи классификации изображений.

Оптические нейронные сети — это аппаратные устройства, которые выполняют ту же функцию, что и искусственные нейронные сети, созданные с использованием обычных компьютеров. То есть их можно запрограммировать для выполнения задач машинного обучения, таких как классификация. По словам исследователей, оптические нейронные сети похожи на биологические нейронные сети в том, что они обе «обрабатывают входную информацию с помощью различных линейных и нелинейных физических операций».

Поиск альтернативных вычислительных парадигм, таких как фотонные и квантовые вычисления, мотивирован быстрым увеличением вычислительной мощности, необходимой для проектов искусственного интеллекта. Авторы хотят помочь «максимально раскрыть преимущества оптических вычислений».