Создание метавселенных имеет решающее значение для создания генеративного ИИ. / Фото: Роман Кутузов Dall-E

В начале августа китайский стартап Unitree представил своего нового робота — A2 Stellar Hunter.  «Робособака» демонстрирует невероятные трюки, начиная от танцев на одной ноге и заканчивая уверенным прохождением сложного рельефа по бездорожью. Практически одновременно лаборатория Google Deepmind заявила о разработке Genie 3 — своего нового ИИ, способного по текстовой подсказке генерировать не просто видео, а целые трехмерные миры, которые можно свободно исследовать. Почему из всего огромного потока новостей эти две кажутся мне наиболее интересными? Они демонстрируют два вектора развития технологий, которые, соединившись, способны перевернуть мир.

Мир роботов

«В 2025 году появились агенты, способные выполнять настоящую когнитивную работу; написание компьютерного кода уже никогда не будет прежним. В 2026 году, вероятно, появятся системы, способные находить новые идеи. В 2027 году, возможно, появятся роботы, способные выполнять задачи в реальном мире… Если нам придется создать первый миллион человекоподобных роботов по старинке, но затем они смогут управлять всей цепочкой поставок — добывать и перерабатывать полезные ископаемые, водить грузовики, управлять заводами и т. д. — чтобы создать больше роботов, которые смогут построить больше предприятий по производству микросхем, центров обработки данных, то темпы прогресса, очевидно, будут совершенно иными», — написал два месяца назад гендиректор OpenAI Сэм Альтман.

Это вопрос не только экономики. Есть исследователи, которые полагают, что полный потенциал развития ИИ до уровня AGI (общего ИИ, способного выполнять все задачи не хуже или лучше человека) в принципе недостижим, если у искусственного интеллекта не будет физического воплощения, благодаря которому он сможет исследовать реальный мир и взаимодействовать с людьми, подобно тому, как это делает человеческий ребенок, пишет Марк Ли, почетный профессор компьютерных наук Университета Аберистуита (Великобритания) и автор книги «Как вырастить робота».

Профессор по должности теоретик, а Сэм Альтман —  немного мечтатель и визионер, как и положено основателю технологической компании, которая хочет изменить мир. 

Но вот что пишут самые практичные и приземленные на свете люди — инвестбанкиры из Morgan Stanley. По их оценке, к 2050 году вместе с людьми Землю будет населять как минимум 1 миллиард человекоподобных роботов, их производство создаст рынок стоимостью $5 трлн. В основном они будут использоваться в промышленных и коммерческих целях, однако по мере наращивания масштабов производства цена робота снизится с текущих $200 тыс. до $15 тыс. и постепенно они появятся  как помощники в домах, прогнозируют аналитики инвестбанка.  

«Прогноз использования роботов в домохозяйствах гораздо более консервативен: к 2050 году в домах будет всего 80 миллионов человекоподобных существ. Мы не увидим робота в каждом доме в одночасье», — полагает Адам Джонас, руководитель отдела глобальных исследований автомобилей и совместной мобильности в Morgan Stanley. Тем не менее, по его оценке к 2050 г. около трети богатых домохозяйств США с доходом свыше $200 тыс. в год обзаведутся робоприслугой, а может и «целым штатом гуманоидных дворецких».

И третий вывод исследования, менее приятный для США: по мнению аналитиков инвестбанка, в разработке роботов сейчас побеждает Китай. «По нашему мнению, лидерство Китая в области ИИ-робототехники, возможно, должно усилиться, прежде чем конкуренты, включая США, обратят на него более пристальное внимание», — цитирует отчет Шэна Чжуна, руководителя отдела промышленных исследований Morgan Stanley.

Основатель Unitree Ван Синсин делает все, чтобы оправдать эти прогнозы.

«Молодой человек в очках»

Так назвал Вана Синсина Forbes. Предпринимателю всего 35 лет, тем не менее, его стартап уже «единорог». По данным журнала в июне этого года Unitree получила раунд венчурного финансирования по общей оценке 12 млрд юаней ($1,7 млрд). 

Инвесторами стали китайский автопроизводитель Geely Automobile, финтех-гигант Ant Group и инвестиционная компания HongShan Capital Group (ранее известная как Sequoia Capital China).

Возможно, успеху способствовал тот факт, что Ван Синсин стал самым молодым среди руководителей технологических компаний, приглашенных в феврале этого года на встречу с руководителем КНР Си Цзинпином. При этом он занимал почетное место в первом ряду, пишет South China Morning Post. А может, это был танец 16 его роботов H1, которые выступили вместе с живыми танцорами на Весеннем Фестивале 2025 года — шоу по национальному ТВ Китая посмотрели более 1 млрд человек.

Скорее всего, сработало все вместе. Успехи Unitree вдохновляют не только начальство, публику и венчурных капиталистов, но и розничных инвесторов. «Поскольку Unitree остается частной компанией, инвесторы вместо этого охотятся за ее поставщиками. Стоимость акций Zhejiang Changsheng Sliding Bearings в Шэньчжэне подскочила на 62% за последние пять торговых дней и более чем на 600% за последние 12 месяцев. Акции Ningbo Shuanglin Auto Parts подскочили на 575% по сравнению с прошлым годом», — писала в феврале South China Morning Post.

А демонстрация  фантастической робособаки A2 Stellar Hunter привела 6 августа к росту на 5% китайского индекса Solactive China Humanoid Robotics,  который включает компании, занимающиеся производством и разработкой роботов, пишет Bloomberg.

Представитель Unitree заявил Forbes, что компания контролирует более двух третей мирового рынка роботов-собак и является лидером по продажам гуманоидных роботов в мире, однако отказался назвать конкретные цифры. 

Да, пока Tesla с трудом пытается запустить в серию своих гуманоидов Optimus, Unitree уже продает робособак по цене от $2800 и человекоподобных роботов R1 по цене от $5900 (без учета доставки). Робот высотой примерно 1,2 м и весом 25 кг может взаимодействовать  с окружающим миром  с помощью встроенных микрофонов, динамика и камер. Он также умеет ходить, бегать, ходить на руках, делать кувырок, драться (или, по крайней мере, изображать движения бойца кунг-фу), ложиться, вставать и многое другое.

Впрочем, не будем преувеличивать — пока это скорее дорогая игрушка, нежели что-то реально полезное в хозяйстве. «Unitree R1 вряд ли сможет заменить вам домработницу, у него нет  «ловких рук» и маловато сил из-за ограниченного крутящего момента. Компания рекламирует его как «умного компаньона»…Он может быть полезен для сферы образования и исследований, поскольку гораздо доступнее других гуманоидных роботов такого размера», — пишет в обзоре портал CNX Software.

Эволюция на стероидах

Почему создание действительно полезного человекоподобного робота такая сложная задача? Я подробно писал об этом в прошлом году. Проблему еще в 80-х годах прошлого века сформулировал канадский инженер Ханс Моравек, в его честь она получила название «парадокс Моравека». Его суть в том, что сложные задачи — вычисления, логические рассуждения — требуют от компьютера относительно мало вычислительной мощности,  в то время как элементарные для человека действия вроде движения, ориентации в пространстве, распознавания образов, требуют огромных ресурсов.

Моравек полагал, что объяснение парадокса лежит в сфере биологии. Базовые навыки человеческого тела и разума, такие как способность вовремя опознать добычу или хищника, сориентироваться в сложной ситуации, точно манипулировать своим телом и предметами, отшлифованы миллионами лет естественного отбора, поэтому нам они кажутся простыми, но невероятно сложны для машин, лишенных такого эволюционного «багажа».

И что теперь делать, тоже ждать миллионы лет, пока роботы натренируют необходимую ловкость и смекалку?

Нет, есть другой вариант. Человечество уже поднаторело в создании виртуальных миров или метавселенных. И хотя знаменитый, масштабный и дорогостоящий проект метавселенной Horizon Worlds гендиректора Meta Марка Цукерберга похоже, провалился, принеся ему около $70 млрд убытков да еще и юридические проблемы, в целом эта идея может оказаться крайне полезной с  совершенно неожиданной стороны. 

Метавселенные (такие как игровая среда Fortnite, например, или Roblox) конечно, нравятся людям, в основном как средство развлечения.

Однако если создать цифровую метавселенную, точно отображающую физические параметры реального мира, в нее можно запускать различные ИИ (от «разумов» роботакси до человекоподобных роботов) чтобы они быстро, безопасно и относительно недорого учились в ней взаимодействовать с реальным миром. 

Этакая «эволюция на стероидах»,  официально процесс называется «обучение на синтетических данных», сгенерированных специальными ИИ-моделями, чтобы учить с их помощью другие ИИ.

Именно такой подход предложил, например, гендиректор Nvidia Дженсен Хуанг для тренировки роботов и роботакси — его компания уже предлагает специальную обучающую метавселенную  Cosmos World Foundation.

Компания Amazon, в которой по ее данным уже работают свыше 1 млн автономных роботов (правда, не человекоподобных)  тоже использует синтетические данные для их обучения, моделируя различные сценарии, с которыми роботы могут столкнуться, особенно в дни пиковой нагрузки, например, в Киберпонедельник. 

В этом свете появление нового генератора интерактивных миров Genie 3 от Google DeepMind приобретает особое значение. Он пока еще не очень мощный — способен генерировать несколько минут интерактивных 3D-сред с разрешением 720p и частотой 24 кадра в секунду, но это значительный прогресс по сравнению с 10–20 секундами, на которые был способен Genie 2.

Хотя Genie 3 имеет значение для образовательного опыта, игр или прототипирования творческих концепций, его настоящий потенциал проявится в обучении ИИ-агентов для выполнения универсальных задач, и имеет решающее значение для достижения AGI, полагают в Google. 

«Мы считаем, что модели мира играют ключевую роль на пути к AGI, особенно для воплощенных (то есть действующих в реальном мире, как роботы, например) агентов, где моделирование сценариев реального мира представляет особую сложность», — цитирует TechCrunch Джека Паркера-Холдера, научного сотрудника из группы открытости DeepMind.

Модель представляет собой шаг вперед в обучении агентов выходить за рамки простого реагирования на входные данные, позволяя им потенциально планировать, исследовать, выявлять неопределенности и совершенствоваться путем проб и ошибок — своего рода самостоятельное, воплощенное обучение, которое, по мнению многих, является ключом к достижению AGI, резюмирует TechCrunch.

Возможно, в будущем мы вспомним провал метавселенной Meta не как бизнес-драму, а как предвестник эпохи, в которой цифровые миры нужны будут прежде всего машинам. И тогда вопрос «зачем строить метавселенные?» получит неожиданный ответ: чтобы научить миллиард роботов жить среди нас.

Поделиться