Представьте, что вы находитесь в самолете с двумя пилотами, человеком и компьютером. У обоих “руки” на пультах управления, но они всегда следят за разными вещами. Если они оба обращают внимание на одно и то же, человек получает право управлять. Но если человек отвлекается или что-то упускает, компьютер быстро берет управление на себя.
Познакомьтесь с Air-Guardian, системой, разработанной исследователями Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL). В то время как современные пилоты сталкиваются с потоком информации с нескольких мониторов, особенно в критические моменты, Air-Guardian действует как проактивный второй пилот; партнерство между человеком и машиной, основанное на понимании и внимании.
Но как именно он определяет внимание? Для людей он использует отслеживание глаз, а для нервной системы он полагается на нечто, называемое «картами значимости», которые точно определяют, куда направлено внимание. Карты служат визуальными ориентирами, выделяющими ключевые области на изображении, помогая понять и расшифровать поведение сложных алгоритмов. Air-Guardian выявляет ранние признаки потенциальных рисков с помощью этих маркеров внимания, вместо того чтобы вмешиваться только при нарушениях безопасности, как традиционные системы автопилота.
Более широкое применение этой системы выходит за рамки авиации. Аналогичные механизмы совместного управления однажды могут быть использованы в автомобилях, дронах и более широком спектре робототехники.
«Интересной особенностью нашего метода является его дифференцируемость», — говорит постдок MIT CSAIL Лянхао Инь, ведущий автор новой статьи о Air-Guardian. «Наш уровень взаимодействия и весь сквозной процесс можно обучить. Мы специально выбрали каузальную модель нейронной сети непрерывной глубины из-за ее динамических особенностей в отображении внимания. Еще одним уникальным аспектом является адаптивность. Система Air-Guardian не является жесткой; ее можно регулировать в зависимости от требований ситуации, обеспечивая сбалансированное партнерство человека и машины.»
В ходе полевых испытаний и пилот, и система принимали решения на основе одних и тех же необработанных изображений при навигации к целевой путевой точке. Успех Air-Guardian оценивался на основе совокупных вознаграждений, полученных во время полета, и более короткого пути к контрольной точке. Guardian снизил уровень риска при полетах и увеличил вероятность успешного достижения целевых точек.
«Эта система представляет инновационный подход авиации с искусственным интеллектом, ориентированный на человека», — добавляет Рамин Хасани, научный сотрудник MIT CSAIL research и изобретатель liquid neural networks. «Наше использование жидких нейронных сетей обеспечивает динамичный, адаптивный подход, гарантируя, что ИИ не просто заменяет суждения человека, но дополняет их, что приводит к повышению безопасности полетов и сотрудничеству в небе».
Истинная сила Air-Guardian заключается в его базовой технологии. Используя основанный на оптимизации кооперативный слой, использующий визуальное внимание человека и машины, и жидкие нейронные сети непрерывного действия замкнутой формы (CfC), известные своим мастерством в расшифровке причинно-следственных связей, он анализирует поступающие изображения на предмет важной информации. Дополнением к этому является алгоритм VisualBackProp, который определяет фокусные точки системы на изображении, обеспечивая четкое понимание ее карт внимания.
Для будущего массового внедрения необходимо усовершенствовать человеко-машинный интерфейс. Обратная связь предполагает, что индикатор, такой как линейка, мог бы быть более интуитивно понятным для обозначения того, когда система guardian берет управление на себя.
Air-Guardian возвещает новую эру более безопасного неба, предлагая надежную систему безопасности в те моменты, когда внимание человека рассеивается.
«Система Air-Guardian подчеркивает синергию между опытом человека и машинным обучением, продвигая цель использования машинного обучения для повышения квалификации пилотов в сложных сценариях и уменьшения эксплуатационных ошибок», — говорит Даниэла Рус, профессор электротехники и компьютерных наук Массачусетского технологического института Эндрю (1956) и Эрны Витерби в Массачусетском технологическом институте, директор CSAIL и старший автор статьи.
«Одним из наиболее интересных результатов использования показателя визуального внимания в этой работе является возможность более раннего вмешательства и большей интерпретируемости пилотами-людьми», — говорит Стефани Гил, доцент кафедры компьютерных наук Гарвардского университета, которая не участвовала в работе. «Это демонстрирует отличный пример того, как искусственный интеллект может использоваться для работы с человеком, снижая барьер для достижения доверия за счет использования естественных механизмов коммуникации между человеком и системой искусственного интеллекта».
Это исследование частично финансировалось Исследовательской лабораторией ВВС США (USAF), Ускорителем искусственного интеллекта ВВС США, компанией Boeing Co. и Управлением военно-морских исследований. Полученные результаты не обязательно отражают точку зрения правительства США или ВВС США.