Что важного случилось в области искусственного интеллекта в 2025 году
Сложно представить другую сферу технологий, которая в 2025-м развивалась так же бурно, как искусственный интеллект. О главных событиях — новом квантовом чипе от Google, развитии мультимодальных моделей и появлении ИИ-агентов с элементами общего искусственного интеллекта — рассказал руководитель магистерской программы «Глубокое обучение и генеративный искусственный интеллект» Сергей Муравьев.
Квантовые вычисления с чипом Willow и алгоритмом Quantum Echoes

В октябре 2025 года компания Google представила квантовый чип Willow. Ожидается, что он станет прорывом в квантовых вычислениях благодаря 105 сверхпроводящим кубитам с точностью однокубитовых ворот 99,97% и двухкубитовых — 99,88%. Алгоритм Quantum Echoes, реализованный на этом чипе, моделирует «эхо» в квантовых системах: сигнал искажается, корректируется и возвращается обратно, усиливаясь интерференцией, что позволяет измерять сложные физические процессы в 13 000 раз быстрее суперкомпьютеров. Это первое проверяемое квантовое преимущество, подтвержденное в журнале Nature, где результаты воспроизводимы на классических системах для верификации.​

Авторы изобретения заявляют, что применение Quantum Echoes выходит за рамки демонстрации. В сфере ИИ чип может генерировать синтетические датасеты для обучения моделей, недоступные классическим методам, особенно в химическом моделировании молекул и материаловедении. В биомедицине с помощью нового чипа можно ускорить симуляцию белковых взаимодействий, потенциально сокращая разработку лекарств с лет до месяцев, а в материаловедении — поиск новых сверхпроводников при температурах выше абсолютного нуля. Стабильность Willow при криогенных температурах (ниже -200 °C) минимизирует шум, делая его масштабируемым для промышленных задач.​

Будущие перспективы чипа включают интеграцию с ИИ: квантовые эхо-алгоритмы усиливают нейросети в задачах оптимизации, где классические градиентные спуски проваливаются из-за экспоненциальной сложности. Google Quantum AI подчеркивает, что Willow преодолевает барьер процессора Sycamore 2019 года, предлагая реальную пользу в машинном обучении и физике. Исследователи, включая нобелевского лауреата Мишеля Деворета, отмечают: искусственные атомы в чипе имитируют реальные, открывая эру гибридных квантово-классических систем.

Ссылки:
1. Google Explores Quantum Chaos on Its Most Powerful Quantum Computer Chip
2. Google Quantum AI впервые достигла проверяемого квантового преимущества: алгоритм Quantum Echoes на чипе Willow
3. Our Quantum Echoes algorithm is a big step toward real-world applications for quantum computing
4. Observation of constructive interference at the edge of quantum ergodicity
Развитие мультимодальных моделей ИИ с видео и изображениями

Справка: мультимодальные модели искусственного интеллекта — это системы, способные принимать и анализировать несколько разных типов информации одновременно, например текст, изображения, аудио, видео и т. д. 

Наиболее значимым прорывом 2025 года стало достижение практического уровня понимания динамических сцен. Модели нового поколения, такие как Sora 2.0 от OpenAI  и Claude Vision 3 от Anthropic, благодаря усовершенствованным временным трансформерам (temporal transformers), научились не просто описывать события в видео, но и анализировать причинно-следственные связи и долгосрочные нарративы в роликах длиной до часа. Это позволило им впервые стабильно преодолеть порог в 92% точности на комплексных бенчмарках MVBench и VCR, что приблизило их к человеческому уровню зрительного восприятия и понимания контекста.

В области методологии обучения мультимодальных моделей главным достижением стал масштабный переход на синтетические данные для тренировки видео-компонентов. Комбинация архитектур Vision Transformers (ViT) с временными диффузионными моделями позволила обучать системы на колоссальных объемах — до 1015 токенов — сгенерированного видео (например, от Gemini). Этот подход радикально снизил стоимость создания датасетов и, что критически важно, позволил целенаправленно обучать модели на редких и сложных edge-кейсах (ночной дождь, оптические иллюзии, crowded-сцены). Благодаря этому удалось существенно минимизировать системные ошибки (bias) и повысить их надежность в нестандартных условиях реального мира.

Ссылки:
1. MVBench
2. Towards Multimodal In-Context Learning for Vision & Language Models
3. Figure AI showcases upgraded Helix, flips packaging and boxes like a champ
4. Multimodal AI: Breaking Down Barriers Between Text, Image, Audio and Video
Появление продвинутых агентов ИИ с элементами AGI

Справка: Компания OpenAI предлагает пятиуровневую систему классификации для отслеживания прогресса ИИ на пути к достижению общего искусственного интеллекта (Artificial General Intelligence — AGI). Последний, пятый, уровень — это системы искусственного интеллекта, способные выполнять работу целой организации, в том числе принимать стратегические решения.

OpenAI в 2025 году анонсировала агентов пятого уровня AGI, фокусирующихся на автономной агентности и мультиагентных системах, где ИИ генерирует гипотезы и итеративно тестирует их без человеческого надзора. Эти модели, эволюция o1 и o3, достигают 85% успеха в SWE-bench (программирование) и GAIA (общие задачи), персонализируясь под пользователя через долгосрочную память. Мультиагентные фреймворки, такие как AutoGen 2.0, координируют рои агентов для коллективного решения, имитируя команды ученых.

В основе работы таких агентов лежит иерархическое рассуждение: агент разбивает задачу на подзадачи, делегирует подагентам и агрегирует результаты с верификацией. В медицине такой подход позволяет синтезировать молекулы лекарств: агент моделирует взаимодействия, предсказывает токсичность и оптимизирует синтез, сокращая цикл разработки на 70%. Такая мультиагентная система для синтеза персонализированных лекарств использует федеративное обучение, адаптируя поведение под стиль пользователя без передачи данных.
Переход к ИИ-организациям виден в проектах вроде xAI’s Grok Swarm: тысячи агентов решают глобальные задачи, от климатического моделирования до финансовой оптимизации. Безопасность обеспечивается constitutional AI, где агенты голосуют за этичные действия. Этот уровень знаменует эру, где ИИ не инструмент, а партнер, способный к инновациям за пределами человеческого опыта.

Ниже несколько публикаций, которые фокусируются на продвинутых ИИ-агентах. Они охватывают бенчмарки ARC-AGI, GAIA, SWE-bench и архитектуры вроде o5/Grok-4:
Определяет Level 5 как «AI as an Agent» с полной автономией, превосходящей человека в широком спектре задач (ASI), с примерами вроде AlphaFold и рисками misalignment.​
Предлагает агентов с иерархическим рассуждением (Grok-4: 92.5% на олимпиадных задачах), достигающих пятого уровня автономности ИИ в математике и кодинге.​
Анализ бенчмарков ARC-AGI-2 для агентов, с прогрессом в reasoning (IMO Gold, ICPC) и границами LLM.​
Риск-анализ AGI, с фокусом на переходах, автономией и экзистенциальными угрозами мультиагентных систем.​