Кутузов Роман

Роман Кутузов

колумнист Oninvest, технологии
Масштабирование больших языковых моделей, возможно, достигло своих пределов /Фото: JLStock / Shutterstock.com

Масштабирование больших языковых моделей, возможно, достигло своих пределов /Фото: JLStock / Shutterstock.com

На прошлой неделе случился сбой на серверах Amazon, который имел глобальные последствия: он обрушил на некоторое время работу множества крупных сайтов и компаний. Событие наглядно показало, как сильно современный мир зависит от обычно невидимых пользователю облачных сервисов, предоставляющих услуги аренды вычислительных мощностей и программ через интернет. Однако бум ИИ движет нас в этом направлении еще дальше, спровоцировав настоящую лихорадку строительства новых облачных дата-центров. Которые, может быть, в таком количестве и не нужны.

В плену облаков

Сбой у Amazon начался в 3 часа утра по Нью-Йорку в понедельник 20 октября и его ликвидация затянулась на долгих 15 часов. Только к шести вечера компания отрапортовала, что последствия ошибки устранены.

Обычно мы не задумываемся, в какой степени зависим от облачных сервисов — огромной и быстрорастущей индустрии, которую, собственно, Amazon и изобрел в 2006 году (подробнее почитать об этом можно здесь). Общая выручка инфраструктурных облачных сервисов по прогнозу Statista достигнет $400 млрд уже в этом году. Amazon лидирует на этом рынке с долей около 30%, еще 20% у Microsoft и 13% у Google — как нетрудно заметить, эти компании, называемые «гиперскейлерами» за стремительное наращивание своих облачных мощностей, уже контролируют без малого две трети рынка.

Миллионы бизнесов по всему миру доверяют им свои сервисы и данные, потому что арендовать вычислительные мощности проще и удобнее, чем закупать,  администрировать и модернизировать собственные.

В журнале Fortune Крис Бэр, коммерческий директор и партнер Stream Data Centers написал:

Без центров обработки данных полеты были бы приостановлены (пилоты не могли бы получать информацию о погоде, а планы полетов были бы недоступны), связь стала бы примитивной, платежи перестали бы обрабатываться — даже служба 911, работающая через онлайн-систему, перестала бы работать. И это только начало.

Author - Oninvest

Крис Бэр

коммерческий директор и партнер Stream Data Centers

Он-то нахваливал современные  дата-центры как одно из важнейших достижений цивилизации, но не прошло и двух недель, как эта правда обернулась обратной стороной: если крупный облачный сервис выходит из строя, начинает рушиться все вокруг.

Лично у меня в понедельник отказался работать Zoom, но это были просто цветочки. Крупнейшие мировые компании, включая Netflix, Starbucks, United Airlines, Delta Air Lines, McDonald’s и многие другие временно не смогли предоставить клиентам доступ к своим онлайн-сервисам, перечисляет CNN. По данным BBC, сбой затронул более тысячи компаний и миллионы интернет-пользователей.

«Облачные вычисления — это чудо, но в основе их лежит бесконечный список сложных сервисов и зависимостей, которые всегда находятся в одной конфигурации от сбоя», — цитирует журнал Wired Марка Сент-Джона, соучредителя стартапа по системной безопасности Neon Cyber.

Справедливости ради нужно отметить, что сбои в облачных сервисах Amazon случаются, как правило, не чаще чем раз в год, но если уж происходят, то, как говорится, на все деньги.

То ли еще будет

Проблема в том, что перспективная технология искусственного интеллекта тоже зависима от облачных сервисов — огромных дата-центров, оснащенных специально оптимизированными для обучения и применения ИИ процессорами.

Это связано с тем, что компьютеры, необходимые для работы инструментов ИИ, мощные и дорогие, а локальное оборудование не так легко модифицировать в соответствии с меняющимися потребностями бизнеса. Разумнее арендовать эту компьютерную мощность и платить за нее только по мере необходимости, отмечает CNN.

Сегодня это может показаться гипотетическим сценарием, но технологическая индустрия обещает быстрый переход к использованию ИИ-агентов, автономных программ, которые будут выполнять больше работы от имени людей в ближайшем будущем, и это может сделать компании, школы, больницы и финансовые учреждения еще более зависимыми от облачных сервисов

Author - Oninvest

Клэр Даффи

технологический репортер CNN

В 2024 году McKinsey опросило 1491 компанию из 101 страны — и  78% респондентов заявили, что их организации используют ИИ как минимум в одной бизнес-функции. Годом ранее этот показатель составлял 55%.

По оценке агентства, к 2030 году мировые капитальные затраты на инфраструктуру центров обработки данных (без учета ИТ-оборудования) превысят $1,7 трлн, причем львиную долю прироста обеспечат потребности ИИ — они потребуют 156 ГВт мощности дата-центров против 64 ГВт у всех остальных приложений.

Не даром именно в эту сферу изо всех сил рвется компания Oracle, которая видит в ИИ свой шанс стать еще одним гиперскейлером, упущенный в начале 2010-х из-за скептического отношения ее сооснователя Ларри Эллисона к облачным вычислениям.

По мере распространения ИИ сбои в работе центров обработки данных могут происходить чаще, поскольку модели искусственного интеллекта очень энергоемки, приводит CNN мнение старшего аналитика Emarketer Джейкоба Борна. 

Впрочем, есть и свет в конце тоннеля: в бизнес дата-центров для ИИ заходят новые игроки, такие как уже упомянутая Oracle, Meta и OpenAI, да и сам ИИ может помочь обнаружить и устранить уязвимости безопасности, «если компании будут инвестировать в эти возможности так же, как в такие модные и популярные инструменты, как чат-боты на основе ИИ и приложения для создания видео», полагает Даффи.

Это все хорошо, но что, если гигантские дата-центры, в которые OpenAI уже обязалась вложить более $1 трлн, и вовсе не понадобятся?

Кроткие наследуют ИИ-мир

«Блаженны кроткие, ибо они наследуют землю» — цитата из Нового завета, Евангелие от Матфея. И часть названия научной работы Массачусетского технологического института (MIT), явно не без умысла названная «Кроткие модели наследуют землю». 

Глубочайшая вера гендиректора OpenAI Сэма Альтмана в то, что ИИ тем лучше, чем больше доступные ему вычислительные мощности, подвергается сомнению. 

«За последнее десятилетие наблюдалось невероятное масштабирование систем ИИ несколькими компаниями, что привело к неравенству в производительности моделей ИИ. В данной статье утверждается, что, вопреки преобладающей интуиции, убывающая отдача от масштабирования вычислений приведет к конвергенции возможностей моделей ИИ. Другими словами, «кроткие» модели (с ограниченным вычислительным бюджетом) унаследуют мир, приближаясь к уровню производительности лучших моделей в целом», — пишут авторы исследования.

«Лаборатории искусственного интеллекта стремятся построить центры обработки данных размером с Манхэттен, каждый из которых стоит миллиарды долларов и потребляет столько же энергии, сколько небольшой город. Эти усилия основаны на глубокой вере в «масштабирование» — идеи о том, что добавление вычислительной мощности к существующим методам обучения ИИ в конечном итоге приведет к созданию сверхразумных систем, способных выполнять любые виды задач. Однако все больше исследователей в области искусственного интеллекта утверждают, что масштабирование больших языковых моделей, возможно, достигло своих пределов и что для повышения производительности искусственного интеллекта могут потребоваться другие прорывы», — вторит им TechCrunch.

По оценке исследователей из MIT, в течение ближайшего десятилетия производительность передовых ИИ, работающих в гигантских дата-центрах, будет постепенно снижаться, в то время как благодаря совершенствованию алгоритмов эффективность моделей, работающих на более скромном оборудовании будет расти, сокращая разрыв, пишет Wired.

В качестве примера журнал приводит случай с китайской недорогой и эффективной  ИИ-моделью DeepSeek, которая в январе 2025 года обвалила американский технологический рынок на $1 трлн.

Вызов масштабированию бросает и Thinking Machines Lab — стартап, созданный бывшим техническим директором OpenAI Мирой Мурати. Путь вперед заключается не в увеличении объемов обучения, а в повышении качества обучения, цитирует Venturebeat научного сотрудника Thinking Machines Рафаэля Рафаилова.

Схожей точки зрения придерживается и Сара Хукер, бывшая руководительница исследований в ИИ-лаборатории Cohere,  а ныне соосновательница стартапа Adaption Labs. В интервью TechCrunch она рассказала, что Adaption Labs создаёт системы искусственного интеллекта, способные непрерывно адаптироваться и обучаться на основе реального опыта, делая это чрезвычайно эффективно, но раскрыть подробности отказалась.

«OpenAI и другие американские технологические компании подписали соглашения на сотни миллиардов долларов на создание инфраструктуры искусственного интеллекта в США… Всё больше экспертов сомневаются в целесообразности подобных сделок», — полагает Wired.

И что же случится, если победят «кроткие»?

«Темное волокно» и Ветхий Завет

Возможный сценарий подсказывает нам история «переизбытка оптоволокна» (fiber glut), приключившаяся в эпоху «пузыря доткомов» в конце 90-х — начале 2000-х годов.

В 1998 году Министерство торговли США обнародовало ультраоптимистический прогноз, согласно которому интернет-трафик должен был удваиваться каждые 100 дней, то есть расти примерно в 10 раз за год, писала в 2002 году The Wall Street Journal.

На волне ажиотажа телекоммуникационные компании проложили миллионы километров оптоволоконного кабеля под улицами и на океанском дне. Прогнозы оказались ошибочными. Трафик рос, но отнюдь не так быстро. В итоге в 2002 году использовалось лишь 2,7% проложенных линий. Значительная часть оставшегося оптоволокна, называемого в отрасли «темным волокном», рисковала навсегда остаться без использования. Избыток мощностей привел к падению цен на пропускную способность в среднем на 65%, а  большинство компаний, предоставляющих услуги передачи данных на большие расстояния, — к банкротству,  писала WSJ. 

Акции Corning, крупнейшего в мире производителя оптического волокна, рухнули с $109 в 2000 году до $1,6 к 2002 году. Компания, впрочем, выжила и сейчас чувствует себя неплохо с капитализацией около $75 млрд, хотя до пиков 2000 года ее акции еще не добрались. Так повезло не всем. Один из крупнейших операторов связи WorldCom, также как и многие другие компании вроде Global Crossing, Winstar Communications, Metromedia Fiber Network подверглись реструктуризации или ликвидации, пишет Fierce Network, проводя параллель между теми временами и нынешним бумом дата-центров для ИИ.

Если уж мы обратились к библейским цитатам, вот еще одна: «Что было, то и будет; и что делалось, то и будет делаться, и нет ничего нового под солнцем», говорит Экклезиаст.

Если в прошлом мы учились на ошибках через банкротства и крах акций, то сегодня ставки выше: от стабильности облачной инфраструктуры зависит не только бизнес, но и здравоохранение, транспорт, безопасность.

Будущее, скорее всего, окажется гибридным: часть задач будет решаться в гигантских дата-центрах, а часть — на локальных, энергоэффективных и «кротких» моделях. Кто сумеет найти баланс между мощью и разумностью, тот и унаследует не только землю, но и следующую технологическую эпоху. 

Поделиться