Машинное обучение позволяет компьютерам распознавать сложные шаблоны, такие как лица, а также создавать новые и реалистично выглядящие примеры таких шаблонов. Работая над улучшением этих методов, исследователи впервые наглядно продемонстрировали, как квантовый алгоритм хорошо работает при генерации этих реалистичных примеров, в данном случае создавая аутентичные рукописные цифры [1]. Исследователи рассматривают результат как важный шаг к созданию квантовых устройств, способных выйти за рамки возможностей классического машинного обучения.
Наиболее распространенным применением нейронных сетей является классификация — распознавание рукописных букв, например. Но исследователи все чаще стремятся использовать алгоритмы для более творческих задач, таких как создание новых и реалистичных произведений искусства, музыкальных произведений или человеческих лиц. Эти так называемые генеративные нейронные сети также можно использовать для автоматического редактирования фотографий — для удаления нежелательных деталей, таких как дождь.
Как отмечает Алехандро Пердомо-Ортис из Zapata Computing в Торонто, включение квантовых вычислений в современные генеративные сети может привести к гораздо большей производительности. Поэтому исследователи пытались реализовать алгоритмы на текущем поколении так называемых зашумленных квантовых устройств среднего масштаба — элементарных квантовых машинах с менее чем 50 квантовыми битами (кубитами).
“Растет интерес к применению алгоритмов на основе квантовых схем в генеративном моделировании”, — говорит Пердомо-Ортис, но успех пока ограничен. При генерации реалистичных рукописных цифр — стандартного эталона в этой области — предыдущие исследования приводили только к небольшим, зернистым цифрам с низким разрешением, едва напоминающим цифры из обучающего набора. Теперь он и его коллеги сообщают об улучшенных результатах благодаря новой архитектуре машинного обучения.
В их работе используется так называемая состязательная сеть — тип нейронной сети, построенный из двух подсетей, генератора и дискриминатора. Генераторная сеть учится создавать реалистичные изображения, начиная с начального начального распределения вероятностей для разных изображений — часто выбираемых с равными вероятностями для всех изображений — и затем обучаясь методом проб и ошибок. Оно постепенно настраивается, чтобы с высокой вероятностью создавать изображения, похожие на изображения в обучающих данных.
Сеть дискриминаторов играет роль противника, который пытается отличить поддельные изображения, созданные генератором, от реальных обучающих изображений. Основываясь на производительности дискриминатора, генератор затем настраивает себя, чтобы иметь возможность более эффективно обманывать дискриминатор, создавая более реалистичные изображения. Дискриминатор, в свою очередь, настраивается, чтобы лучше выявлять подделки. По сути, генератор учится работать лучше, проходя испытания против противника, который, тем временем, учится быть лучшим противником.
Но эффективность таких состязательных сетей зависит от начального начального распределения вероятностей для изображений. Чтобы повысить производительность системы, Пердомо-Ортис и его коллеги решили дополнить эту состязательную сеть квантовой схемой, разработанной для включения выбора начальных вероятностей в процесс обучения.
Основываясь на предыдущей работе, они подозревали, что одно конкретное подмножество элементов в сети дискриминаторов (“слой” в системе) должно содержать важную информацию, необходимую для улучшения производительности генератора. Команда поставила перед своей квантовой схемой задачу представлять состояние этого слоя по мере его эволюции и передавать эту информацию в качестве исходной в сеть генератора для повторных испытаний в ходе состязательного процесса. Квантовая схема действовала как шпион для бейсбольной команды, крадя информацию у другой команды, поскольку обе команды постоянно обновляют свои стратегии. Преимущество квантовой схемы в том, что она может представлять гораздо более широкий диапазон состояний, чем сопоставимая классическая система.
Их небольшое устройство для квантовых вычислений основано на наборе из восьми кубитов, хранящихся в захваченных ионах иттербия. С помощью этой платформы исследователи впервые обучили полный алгоритм машинного обучения стандартному набору данных из рукописных цифр, широко используемых в промышленности. Данные включают в себя 60 000 изображений рукописных однозначных цифр. После того, как сеть была обучена, команда проверила ее способность генерировать новые примеры рукописных цифр.
Сгенерированные цифры обеспечивают разрешение значительно лучшее, чем цифры, ранее созданные с использованием других устройств квантового машинного обучения. Как подчеркивают исследователи, эта производительность явно не лучше, чем та, которую можно достичь с помощью лучшей классической системы машинного обучения. Но работа демонстрирует, что квантово-улучшенная версия определенного алгоритма может работать лучше, чем обычная версия, а также может быть запущена на современных квантовых устройствах.
“Успех, продемонстрированный в этом примере, должен открыть пространство для проектирования машинного обучения с использованием шумных квантовых устройств”, — говорит квантовый физик Норберт Линке из Университета Мэриленда в Колледж-Парке. Он предполагает, что в будущем лучшие системы машинного обучения вполне могут включать как классические, так и квантовые аспекты. Точно так же “лучший шахматист в мире — это не человек и не компьютер, а машина с помощью человека”, — говорит он.
Автор: Марк Бьюкенен
Источник: https://physics.aps.org/articles/v15/106