Маркетплейсы для ИИ: как Amazon и Microsoft меняют правила обучения моделей

Amazon работает над созданием маркетплейса контента, где разработчики смогут покупать данные для обучения своих ИИ-моделей. Схожий проект есть у Microsoft. Фото: PJ McDonnell / Shutterstock.com
Два техногиганта — Amazon и Microsoft — работают над созданием собственных маркетплейсов контента для обучения ИИ. Они могут стать посредниками на рынке, где издатели смогут легально продавать данные для обучения и использования алгоритмами. Зачем им это нужно?
Снова маркетплейсы
По данным The Information, Amazon уведомила руководителей издательской индустрии о планах запустить специализированный маркетплейс, где медиакомпании смогут продавать свои материалы разработчикам ИИ-продуктов. Облачное подразделение компании — AWS — перед закрытой конференцией для издателей в Нью-Йорке разослала презентационные слайды, где маркетплейс контента (content marketplace) был указан наряду с инструментами облачной платформы, включая генератор моделей Bedrock и аналитическую платформу Quick Suite. Официальный представитель Amazon в комментарии TechCrunch не опроверг планы по созданию маркетплейса, но подробностями делиться не стал.
Один из крупнейших конкурентов Amazon — Microsoft — также работает над собственным маркетплейсом издательского контента (publisher content marketplace — PCM). Он начал пилотировать платформу еще в прошлом году и сотрудничает с The Associated Press, Condé Nast, Vox Media и Yahoo. Вместо разрозненных и часто непрозрачных договоренностей один на один Microsoft предлагает стандартизированный подход: издатели заранее формулируют условия использования архивов и новостных лент, а разработчики ИИ выбирают подходящие сценарии и тарифы.
Иск вместо клика
Интерес к разработке таких маркетплейсов выглядит как реакция индустрии на то, что прежний «социальный контракт» открытого интернета перестал работать. Раньше он держался на простой логике обмена: издатели выкладывали материалы в открытый доступ, поисковые системы и агрегаторы индексировали их, показывали ссылки и фрагменты, а взамен приводили аудиторию на сайты — вместе с рекламными показами и подписками. Но с распространением ИИ пользователь получает готовый ответ прямо в чате и не переходит к первоисточнику. Так «компенсация трафиком» стала для многих медиа недостаточной.
Кроме того, долгое время крупные технологические компании действовали по логике «соберем данные сейчас — разберемся с правами потом». И это привело к нескольким судебным спорам. В апреле 2024 года группа из восьми крупных американских газет, включая New York Daily News и Chicago Tribune, подала иск против OpenAI и Microsoft, заявив о неправомерном использовании миллионов статей для обучения ИИ. К октябрю того же года Dow Jones (материнская компания Wall Street Journal) и New York Post предъявили схожие претензии Perplexity AI: по их версии, сервис занимается «массовым незаконным копированием». В январе 2026 года крупнейшие правообладатели в музыкальной индустрии Universal Music Group, Concord и ABKCO подали иск против Anthropic, потребовав компенсации ущерба. Он, по оценкам истцов, может превысить $3 млрд.
В этом контексте крупные игроки начали искать способы формализовать доступ к данным и снизить юридические риски. Но первые шаги были, скорее, разрозненными договоренностями, а не устойчивой бизнес-моделью. Amazon, например, заключила сделку с The New York Times: по данным WSJ, издание получает от $20 млн до $25 млн в год за доступ к архивам, а также к контенту Athletic. OpenAI подписала пятилетнее соглашение с News Corp., стоимость которого оценивается в $250 млн, а также с Axel Springer и Financial Times.
Но формат эксклюзивных сделок оставляет вне игры нишевых издателей и чаще всего строится на фиксированных выплатах, без связи с тем, как именно используется контент и какой вклад он вносит в ответы моделей.
Поэтому сейчас разработчики ИИ обсуждают новый «контракт» — маркетплейс контента. По нему правообладатели задают условия и устанавливают гибкие тарифы — отдельно для обучения, генерации, цитирования или доступа к обновляемым лентам. Платформы фиксируют использование и обеспечивают прозрачную отчетность, а выплаты привязываются к фактическому потреблению.
Крупные игроки почти всегда стараются выходить на прямые отношения без посредников. Нет смысла платить комиссию, если можно договориться напрямую, говорит Денис Сметнев, сооснователь Skyeng и маркетингового агентства uForce.
[Большой] пласт рынка — это небольшие и средние издания. Ради них крупные ИИ-провайдеры вряд ли будут строить отдельную инфраструктуру — удобнее отдать эту работу маркетплейсам-агрегаторам. В итоге модель будет стандартной: топ-издатели – в прямых сделках, а «длинный хвост» — через посредника.
Создание таких маркетплейсов может помочь технокомпаниям решить, в том числе, и проблему «галлюцинаций» нейросетей. В корпоративном секторе, на который делает ставку облачное подразделение Amazon, цена ошибки слишком высока, поэтому бизнес готов платить за генерацию ответов с опорой на верифицированные данные. Perplexity AI уже пилотирует похожую схему, где издатели получают часть дохода от подписки или рекламы, если их контент был использован для ответа пользователю.
Высокую потребность качественных данных для ИИ подтверждает Осип Бурлов, операционный директор Youkeeps, компании-разработчика персонализированного ИИ-ассистента, интегрированного в Copilot и Microsoft 365. Он отмечает: большинство создает агентов на базе готовых LLM и low-code конструкторов.
Для разработчика логика простая: ты собираешь агента — на продажу или для себя — и хочешь использовать проверенный контент. Нужен нормальный факт-чекинг, разметка, безопасность и, главное, легальные права. Если есть маркетплейс со стандартами и гарантиями, тебе не нужно «бегать и искать», переживая из-за возможных исков.
Не отпустить клиента
По мнению венчурного инвестора Павла Мясникова, создание таких маркетплейсов — это продолжение борьбы за контроль над цепочкой создания стоимости вокруг ИИ.
Amazon и Microsoft уже контролируют дистрибуцию облачных вычислений. Продажа данных — следующий логичный шаг: от микрочипов и дата-центров к облачным технологиям, далее — к обучению и эксплуатации моделей и к конечным продуктам на базе ИИ.
Маркетплейс, продолжает Мясников, станет инструментом удержания клиентов внутри экосистемы.
В случае с Microsoft это направление «точно станет заметным», продолжает Осип Бурлов. Оно позволит улучшать собственные ИИ-модели: Copilot получит более обученных агентов, а качество данных вырастет.
Это важно, с учетом того, что ранее в этом месяце инвесторы обвалили акции Microsoft после квартального отчета. Среди причин: у его облачного подразделения Azure рост выручки не оправдал ожиданий рынка. Кроме того, Microsoft испытывает проблемы с продвижением Copilot — спустя три года после запуска у него всего 15 млн пользователей. Для компании, на которую правообладатели подали в суд, это еще и инструмент управления репутационными рисками.
Для Amazon этот проект имеет не менее важное значение. Его котировки в феврале во время обвала рынка рухнули почти на 15%, они падали девять сессий подряд. Одной из причин стало то, что компания в начале февраля объявила о планах потратить беспрецедентные $200 млрд в 2026 году на дата-центры, чипы и все, что связано с развитием ИИ. Рынок испугался, что ставка на «железо» и дата-центры может не сыграть в долгую.
И маркетплейс становится тем самым звеном, которое связывает инвестиции в «железо» с реальными доходами от облаков и рекламы. Одним из бенефициаров этой инициативы должно стать облачное подразделение AWS, которое в 2025 году принесло свыше $128 млрд, 18% от общей выручки Amazon. Превращаясь в брокера лицензионных данных, Amazon создает для бизнеса систему одного окна: вы арендуете серверы, здесь же легально покупаете контент для обучения моделей и здесь же разворачиваете ИИ-агентов, направление, которое глава AWS Мэтт Гарман ранее назвал потенциальным многомиллиардным направлением бизнеса.
Инициатива может изменить и рекламный бизнес Amazon, который в 2025 году принес $68 млрд (плюс 21% в годовом выражении). У Amazon есть ИИ-ассистент Alexa, а также ИИ-бот для покупок Rufus. Доступ к качественному контенту через маркетплейс важен для их обучения, чтобы советы от собственных ИИ-ассистентов были экспертными, а не случайными. ИИ открывает дорогу к новому типу рекламы — вместо борьбы за место на странице выдачи бренды будут конкурировать за то, чтобы ИИ упомянул их товар как лучший выбор в контексте диалога.
«Чистые» данные vs дикий рынок
Препятствием для успеха таких площадок остается спрос: кто именно и в каких объемах готов платить за то, что технически можно получить бесплатно? Пока суды не вынесли окончательных решений по искам правообладателей, юридический статус сбора данных для обучения моделей остается в серой зоне.
В этом контексте маркетплейс рискует превратиться в «витрину для комплаенса» — место, куда приходят только самые крупные корпоративные клиенты, которым критически важно иметь на руках лицензионные соглашения для аудита, тогда как основная масса стартапов продолжит обучать модели на «диких» данных.
Источники The Information указывают на скепсис издателей: они опасаются, что реальных покупателей на «чистый» контент окажется критически мало, а доходы от таких продаж не покроют падение трафика из поисковых систем.
Павел Мясников указывает на еще одно ограничение: рынок прав на данные во многом определяется правовым регулированием, а не технической недоступностью.
Как и в случае фотостоков, правила определяют, что и как можно использовать легально. В долгосрочной перспективе многие, вероятно, будут искать способы обходить маркетплейсы и саму необходимость покупать данные.
Кроме того, успех маркетплейсов контента, вероятно, будет зависит от того, смогут ли они показать ценность «чистых» данных: например, гарантировать, что модели, обученные на лицензионном контенте, галлюцинируют значительно реже, чем их «пиратские» аналоги.
Тем не менее, для малых игроков, чей контент сейчас используется без какого-либо вознаграждения, это шанс на получение доходов от ИИ-бума. Если маркетплейсы смогут предложить прозрачную модель оплаты за факт использования, это превратит данные из пассивного актива в торгуемый товар.
При этом, как отмечает Павел Мясников, работа подобных маркетплейсов может сформировать новые рыночные ниши вокруг оборота данных. «Такие платформы неизбежно откроют рынок посредников-агентов, которые будут собирать и перепродавать данные через маркетплейсы», — объясняет он.
По мнению Осипа Бурлова, маркетплейсы контента смогут частично компенсировать «переток» просмотров с сайтов в ИИ-интерфейсы — особенно для экспертных и аналитических медиа. «Отраслевые и научные, юридические, финансовые, аналитические издания могут выиграть, если их контент начнут оплачивать по факту использования в ответах», — говорит Бурлов.