26.03.2025 02:56

Google представил «самую интеллектуальную» модель ИИ, умеющую рассуждать

Модели с функцией рассуждения сегодня есть у OpenAI, Anthropic, DeepSeek, Google и xAI

Alphabet Inc.

GOOGL

Alphabet Inc.

GOOG

Владислав Осипов

корреспондент Oninvest

Google утверждает, что по ряду тестов Gemini 2.5 Pro опережает некоторые ведущие решения конкурентов, включая OpenAI, Anthropic и DeepSeek / Фото: X / Google

Технологический гигант Google представил «рассуждающий» ИИ Gemini 2.5 — это новое семейство моделей чат-ботов с функцией рассуждения, которые делают паузу, чтобы «подумать» перед тем, как ответить на вопрос. Акции холдинговой компании Google — Alphabet — подорожали на торгах во вторник больше чем на 1,5%.

Детали

Первой моделью в серии стала Gemini 2.5 Pro Experimental — мультимодальная (работающая одновременно с разными типами данных) модель ИИ с развитой способностью к рассуждению, которую в компании называют «самой интеллектуальной из всех созданных ранее». Она доступна на платформе для разработчиков Google AI Studio, а также в приложении Gemini для подписчиков с тарифом Gemini Advanced, который стоит $20 в месяц.

Google заявила, что с этого момента все ее новые ИИ-модели будут обладать встроенными возможностями логического анализа, пишет TechCrunch.

Google пока не опубликовала информацию о стоимости API-доступа к Gemini 2.5 Pro, пообещав раскрыть подробности в ближайшие недели.

Акции Alphabet класса A на торгах во вторник выросли на 1,7%, до $170,6.

Как показала себя новая модель ИИ

Google уже выпускала «рассуждающую» версию Gemini в декабре. По утверждению Google, Gemini 2.5 Pro опережает как предыдущие модели компании, так и некоторые ведущие решения конкурентов по ряду тестов. В частности, модель была разработана с прицелом на создание визуально насыщенных веб-приложений и агентных программных решений.

— В тесте по редактированию кода Aider Polyglot Gemini 2.5 Pro набрал 68,6%, превзойдя модели OpenAI, Anthropic и китайской лаборатории DeepSeek.

— В тесте SWE-bench Verified, оценивающем способности в области разработки программного обеспечения, Gemini 2.5 Pro набрал 63,8%, обойдя OpenAI o3-mini и DeepSeek R1, но уступив Claude 3.7 Sonnet от Anthropic, который получил 70,3%.

— В тесте Humanity’s Last Exam — мультимодальном экзамене, включающем тысячи краудсорсинговых вопросов по математике, гуманитарным и естественным наукам — Gemini 2.5 Pro показал результат 18,8%, обойдя большинство флагманских моделей конкурентов.

— Gemini 2.5 Pro поддерживает контекст объемом в 1 миллион токенов, что эквивалентно примерно 750 тыс. слов за один запрос — это больше, чем весь цикл «Властелин колец», отмечает TechCrunch. Разработчики планируют расширить поддерживаемый объем данных до 2 млн токенов.

Контекст

С 2024 года, когда была запущена первая способная «рассуждать» модель от OpenAI — o1, — технологическая отрасль вступила в новую ИИ-гонку: разработчики стремятся достичь или превзойти возможности o1. Сегодня модели с функцией рассуждения также есть у Anthropic, DeepSeek, Google и xAI. Они используют больше времени и вычислительных ресурсов, чтобы проверять факты и логически осмысливать задачи до того, как дать ответ, пишет TechCrunch. Такие методы помогли ИИ-моделям добиться значительного прогресса в решении математических и программных задач. Многие эксперты считают, что модели с функцией рассуждения станут ключевым элементом ИИ-агентов — автономных систем, способных выполнять задачи без участия человека. Однако такие модели обходятся разработчикам дороже, отмечает издание.

Что рекомендуют аналитики

С начала января акции Alphabet класса A снизились на 10%, но за последний год они подорожали на 13%. По данным MarketWatch, из 68 аналитиков, отслеживающих бумаги технологического гиганта, 55 рекомендуют их покупать, все остальные — держать в портфеле. Консенсусная цена Уолл-стрит составляет $219,3, что на 28,5% выше текущей стоимости.

#Alphabet