Microsoft и Meta оплатят контент Wikipedia. Он — главный источник обучения ИИ-моделей
Оператор интернет-энциклопедии переводит доступ к своему контенту для обучения ИИ с бесплатной модели на коммерческую, пытаясь компенсировать рост расходов на инфраструктуру

Фонд Wikimedia объявил о заключении ряда партнерств с крупнейшими технологическими компаниями / Фото: Shutterstock / reative Salim
Фонд Wikimedia, оператор онлайн-энциклопедии Wikipedia, объявил о заключении ряда партнерских соглашений с крупнейшими технологическими компаниями, в том числе с Microsoft, Meta, Amazon, Perplexity и Mistral AI. Для некоммерческой организации это стало важным шагом к тому, чтобы начать зарабатывать на зависимости бигтехов от ее контента, сообщает Reuters.
Детали
Контент Wikipedia играет ключевую роль в обучении ИИ-моделей. Более 65 млн статей на свыше чем 300 языках составляют значимую часть обучающих данных для генеративных чат-ботов и цифровых ассистентов, которые разрабатывают крупнейшие технологические компании, отмечает Reuters.
Массовое использование свободно доступных материалов Wikipedia для обучения ИИ привело к росту нагрузки на серверы и, как следствие, к увеличению расходов некоммерческой организации, указывает агентство, отмечая, что основным источником доходов Wikipedia по-прежнему остаются пожертвования от пользователей. На этом фоне Wikipedia активно продвигает свой продукт Enterprise, который позволяет технологическим компаниям платить за доступ к контенту для обучения ИИ и получать данные в формате, удобном для масштабных задач.
«Нам потребовалось некоторое время, чтобы понять, какой набор функций и возможностей нам следует предложить, если мы собираемся перевести эти [крупные технологические] компании с нашей бесплатной платформы на коммерческую», — сообщил в интервью Reuters президент Wikimedia Enterprise Лэйн Бекер. «Но все наши партнеры из числа бигтехов, действительно, видят необходимость в том, чтобы взять на себя обязательства по поддержке работы Wikipedia», — добавил он, подчеркнув, что Wikipedia сейчас является критически важным элементом работы крупных технологических компаний. «И им [бигтехам] необходимо понять, как финансово поддерживать Wikipedia», — заметил Бекер.
Финансовых подробностей соглашений Wikipedia с Microsoft, Meta и Amazon, а также других деталей этих партнерств он не раскрыл.
Контекст
Это не первые подобные договоренности Wikipedia, отмечает Reuters. В 2022 году фонд Wikimedia объявлял о соглашении с Google. В соответствии с ним, Google оплачивает доступ к структурированному и высокодоступному API, который предоставляет компании данные Wikipedia в удобном для масштабного использования формате, в том числе для сервисов и функций, в которых система использует эти знания (например, в поиске и панелях знаний).