Искусственный интеллект начал свою холодную войну

@ Silas Stein/DPA/Global Look Press

3 февраля 2025, 08:40 Мнение

Искусственный интеллект начал свою холодную войну

Реакция в США на успехи китайской технологии искусственного интеллекта DeepSeek значительно ускорила разделение мира ИИ. Китайцы сыграли не по правилам своей индустрии, созданным в США.

Анна Сытник Анна Сытник

генеральный директор АНО «Колаборатория»

В самом начале года был сделан решительный шаг к тому, чтобы над миром опустился технологический «железный занавес»: противостояние двух технологических экосистем. Как в случае с холодной войной, гонка в сфере искусственного интеллекта может привести к появлению конкурирующих пространств, где будут доминировать разные стандарты искусственного интеллекта (ИИ). Например, страны BRICS+ могут поддерживать китайские технологии, а коллективный Запад – американские.

Разделение мира ИИ значительно ускорила реакция в США на модель DeepSeek R1, выпущенную небольшой китайской компанией (около 200 человек) с бюджетом меньше, чем у одной из команд Meta* (признана экстремистской организацией в РФ). Самое важное, что они сделали – сыграли не по правилам своей индустрии, созданным в США. Поэтому на Западе новость вызвала хаос, всеобщее раздражение и восхищение. Китайская модель, умеющая рассуждать, оказалась сопоставимой по производительности с глобальным лидером – американской моделью o1 от OpenAI. Это стало возможным благодаря нескольким ключевым отличиям от конкурентов, которые и привели к обрушению рынка.

Во-первых, DeepSeek R1 намного более эффективна – она была обучена с использованием меньших вычислительных ресурсов и при более низких затратах по сравнению с аналогами. Это очень важно. Раньше считалось, что обучение крупных языковых моделей – это роскошь. OpenAI, Anthropic и прочие ИТ-гиганты спускали на это сотни миллионов долларов. Потому что на это нужны были целые дата-центры, с очень дорогим железом (то есть GPU – графическими процессорами, монополию на которые и имеет американская Nvidia). Можно провести аналогию: чтобы заводу работать, нужна отдельная электростанция. А тут приходит DeepSeek и заявляет: «А мы сделаем то же самое за несколько миллионов долларов – и, кстати, вместо 100 тыс. GPU нам хватает двух тысяч». Это шокировало.

Во-вторых, модель DeepSeek R1 является открытым исходным кодом. То есть достигнутый ею результат доступен для всех. Каждый может загрузить модель на свой компьютер через Ollama или LM Studio и без подключения к интернету потом ее использовать. Код открыт, всё можно посмотреть. Это честная инженерия, никаких фокусов. Они ничего не скрывают. Модель лицензирована MIT, что позволяет исследователям и разработчикам свободно использовать ее весовые коэффициенты и результаты. Они всем понятны. Это выгодно отличает ее от ближайшего конкурента – OpenAI, который давно закрыл свой код и доступ к весам своих моделей, предоставляя только API (программный интерфейс). И да, DeepSeek бесплатна и на данный момент не имеет лимитов.

В-третьих, DeepSeek – это просто удобное приложение. Оно просто устанавливается на смартфон, ничего лишнего, легко разобраться как использовать. Кстати, оно доступно в России, в отличие от ChatGPT. А если смотреть по миру в целом, оно вышло на первое место по количеству загрузок, обогнав ChatGPT. Это, конечно, на какое-то время обвалило ее работу, но они в итоге справились.

И наконец, DeepSeek изменили принцип обучения больших моделей, уйдя от концепции монстра, который пытается быть мастером на все руки. Они решили, что это глупо. Зачем активировать все 600 млрд параметров сразу, если для каждой задачи нужен узкий специалист? Они и сделали экспертную систему, в которой активно только то, что нужно в данный момент. Примерно 30 млрд параметров одновременно. Это стало огромной экономией.

Пузырь индустрии ИИ лопается. Сейчас все начнут подстраиваться под новые условия, будут меняться правила игры. DeepSeek поставила под вопрос гигантские инвестиции американских компаний в ИИ. В кои-то веки не китайские исследователи будут догонять западных, а наоборот. Марк Цукерберг уже создал «штабы экстренного реагирования» из инженеров, чтобы разобраться, как небольшая китайская компания смогла выпустить прорывную технологию ИИ. Они будут перенимать опыт снижения стоимости обучения и работы DeepSeek. Есть довольно интересные мнения. Главный ученый Meta Ян Лекун считает, что качество модели не имеет смысла, если у компании нет устойчивой экономики. Другими словами, даже если DeepSeek технологически конкурентоспособен, его способность изменить рынок зависит только от того, сможет ли он эффективно монетизироваться. Ну это спорно, потому что пока все работают в минус. OpenAI уже 10 лет убыточна.

Сейчас американцы заявляют, что Китай украл у них технологии. Но так ли это, мы пока не можем сейчас дать однозначный ответ. Компания OpenAI опубликовала заявление, в котором обвинила китайские стартапы в попытках использования наработок американских компаний для улучшения своих моделей ИИ. Есть метод, который называется «дистилляция». Он заключается в том, что одна модель учится на основе другой. Так обучается ряд небольших моделей на больших. В Белом доме полагают, что китайская компания могла использовать американские разработки, и объявляют это угрозой национальной безопасности.

Удивительно, кстати, что Трамп пока весьма сдержанно высказался. Он заявил, что если китайцы могут тренировать модели эффективнее, то и их «лучшие в мире ученые» смогут. Самое забавное, что если спросить DeepSeek R1, каким образом она обучена, то в своих рассуждениях она отвечает: «сначала вспомню, что я основан на GPT-4 от OpenAI». Если это так, то это говорит нам о двух вещах: 1) да, методы обучения будут меняться; 2) будут появляться «красные линии» использования чужих технологий ИИ. США начали идти в эту сторону еще при Байдене. Тогда ИТ-гиганты восприняли ограничения резко негативно, та же Nvidia сказала, что это плохо отразится на рынке, но теперь, вероятно, они пересмотрят свою позицию.

Уже нет сомнений, что мы наблюдаем гонку за мировое господство в сфере ИИ. Такое ощущение, что старт этому дало заявление Дональда Трампа о запуске проекта Stargate, который подразумевает инвестиции в ИИ в размере 500 млрд долларов. Это сопоставимо с затратами на лунную программу и в три раза превышает годовой объем всей венчурной индустрии США. Ответный удар от китайского DeepSeek не заставил себя долго ждать. Примерно в это же время американская OpenAI показал Operator – своего первого агента, который может полноценно пользоваться браузером и заказывать билеты, еду, столики и т. д. Китайская ByteDance тоже представила своего агента – UI-TARS. Китайская Alibaba запустила модель Qwen2.5-1M, поддерживающую контекст в 1 млн токенов.

Это в восемь раз больше, чем у ChatGPT. Американская Meta вошла в гонку с масштабным проектом – строительством дата-центра размером с Манхэттен. По мощности это сравнимо с целой атомной электростанцией. И в итоге Китай объявил о запуске собственного Stargate – правительство выделяет один триллион юаней (137 млрд долларов) на развитие ИИ. Это в три раза меньше, чем американский проект. Но в США только одна компания – OpenAI – получает частные деньги, а в Китае, наоборот, государственные субсидии получат пять вендоров, в том числе DeepSeek.

И последнее на текущий момент – OpenAI выпустили o3-mini бесплатно. Ощущается, как OpenAI задвигались, когда появилась конкуренция. И это все произошло за несколько дней. Это огромные темпы, и это только начало.

* Организация (организации) ликвидированы или их деятельность запрещена в РФ

..............