Китайская нейросеть DeepSeek обогнала ChatGPT и обвалила акции ИТ-гигантов: почему так произошло
27 января на первое место в топе самых скачиваемых приложений для Айфона вышла китайская нейросеть DeepSeek. Сначала в США, а потом и в России.
Популярность DeepSeek стала главной темой последних дней, а также причиной «черного понедельника» для акций ряда американских ИТ-компаний — больше всех пострадала Nvidia. А все потому, что две модели компании — обычная нейросеть V3 и «рассуждающая» R1 — в тестах обошли конкурентов от OpenAI, Meta* и Google. При этом на обучение ИИ китайские специалисты потратили несравнимо меньше денег, да еще и проводили его в условиях американских технологических санкций.
Пока в США обсуждают, не проиграли ли они гонку нейросетей, приложение завоевало популярность и в России — за счет легкого доступа без смены региона и иностранных карт. Расскажу, как DeepSeek за короткое время стала феноменом.
Что такое DeepSeek
DeepSeek — это название и нейросетевой модели, и компании, которая ее выпускает. Компанию в 2023 году основал Лян Вэньфэн, глава китайского хедж-фонда High-Flyer. Как пишут западные СМИ, он использовал ИИ, чтобы предугадывать тренды на рынке и принимать инвестиционные решения.
Еще в 2021 году Вэньфэн скупал чипы Nvidia, необходимые для обучения нейросетей. Год спустя администрация Джо Байдена запретила Nvidia и AMD продавать в Китай ряд графических процессоров, которые применяют в машинном обучении. Это должно было увеличить технологический разрыв на рынке нейросетей между странами. Но еще до ограничений Вэньфэн скопил запасы мощных чипов H100. А для обучения флагманской модели компания использовала «разрешенные» GPU послабее.
DeepSeek изначально была сайд-проектом Вэньфэна, пишет Financial Times. Компания выпустила модели V1 и V2, о них практически не говорили за пределами Китая. Но постепенно предприниматель все больше вовлекался в работу ИИ-лаборатории. DeepSeek искала сотрудников в лучших китайских университетах, зарплаты им предлагали на уровне главных работодателей страны вроде ByteDance, которой принадлежит TikTok.
Летом 2024 года Вэньфэн в интервью делился своим видением: «В течение многих лет китайские компании использовали чужие технологические инновации и монетизировали их в своих сервисах. Но это недолговечная стратегия. Наша цель — не быстрая прибыль, а технологическое развитие».
Почему о DeepSeek заговорили только сейчас
В декабре и январе DeepSeek представила две новые модели с открытым исходным кодом. Про них сейчас все и говорят:
- DeepSeek-V3 выпустили в декабре 2024 года. Она работает по тем же принципам, что и классическая ChatGPT: умеет генерировать текст и отвечать на вопросы. В тестах модель опередила Llama 3.1 от Meta*, GPT-4o от OpenAI и Claude Sonnet 3.5 от Anthropic. При этом специалистов удивляли заявления китайцев, что на тренировку модели ушло всего два месяца и 5,5 млн долларов. Для сравнения, на обучение GPT-4 потратили свыше 100 млн долларов.
- DeepSeek-R1 представили в январе 2025 года. Это «рассуждающая» модель — она готова выполнять сложные задачи, составляет логические цепочки, сама перепроверяет свои выводы, в том числе промежуточные, может брать время «на подумать». R1 в ряде тестов превзошла аналогичную нейросеть o1 от OpenAI. При этом в приложении ChatGPT модель платная, а DeepSeek предоставляет много бесплатных попыток.
Популярность DeepSeek сейчас — следствие сарафанного радио. В конце января нейросеть стали активно обсуждать: сначала специалисты Кремниевой долины, потом СМИ, потом обычные пользователи. В итоге 27 января приложение DeepSeek заняло первое место в топе бесплатных приложений App Store в США, а 28 января — в России. По данным сервиса Sensor Tower, 80% загрузок пришлось на период с 20 января.
Есть два фактора, благодаря которым китайская нейросеть стала такой обсуждаемой.
Никто не понимает, как можно было сделать так дешево. На рынке ИИ за несколько лет устоялось мнение, что обучение и тренировка нейросетей — это очень дорого и требует передовых технологий. Как я уже писал, на обучение GPT-4 ушло свыше 100 млн долларов. И это уже не актуальная модель — мы не знаем, сколько времени заняло дообучение до версий 4о и o1. Успех DeepSeek поднимает вопрос, насколько оправданны траты американских компаний и не переоценены ли их разработки на рынке.
В то же время DeepSeek фактически не зарабатывает на пользователях. Обе модели бесплатные в приложениях, а еще у них открытый исходный код для использования в личных и коммерческих целях. Доступ по API к «рассуждающей» нейросети DeepSeek-R1 платный, но ценник на 90% ниже, чем у GPT-o1.
Сравнение двух компаний вызвало шутки в ИТ-сообществе. В соцсетях отметили необычный таймлайн: американская некоммерческая организация OpenAI вводит подписку за 200 $, а проект китайского хедж-фонда DeepSeek открывает свои разработки людям.
Влияет политический контекст. Между США и Китаем усиливается технологическая гонка, в том числе в сфере ИИ. Запрет Nvidia поставлять мощные чипы был связан именно с этим. Но DeepSeek получила огромную популярность даже на фоне торговых ограничений: компания нашла способ обучать новые модели при меньших вычислительных мощностях. Появились даже теории, что Китай обходил санкции и на самом деле закупал самые производительные чипы Nvidia.
У США есть собственные проекты для соперничества с Китаем в сфере нейросетей. В январе Дональд Трамп объявил о запуске инициативы Stargate: OpenAI, Oracle и SoftBank договорились инвестировать 500 млрд долларов в инфраструктуру для развития ИИ. Но некоторые специалисты указывают, что США «проморгали» прорыв Китая в этой области. После выхода DeepSeek-R1 авторитетный венчурный инвестор Марк Андриссен провел параллель с запуском первого в мире искусственного спутника Земли Советским Союзом в 1957 году — для США это был ощутимый проигрыш в космической гонке.
Впрочем, политический контекст есть не только у США, но и у Китая. В сети появилось множество примеров того, как ответы DeepSeek не проходят внутреннюю политическую цензуру. Например, нейросеть не отвечает на вопросы про Си Цзиньпина и ссылается на ошибки при вопросах о событиях на площади Тяньаньмэнь.
Как на DeepSeek отреагировали рынок и конкуренты
27 января акции западных технологических компаний отреагировали на успех DeepSeek резким падением. Индекс S&P 500 потерял 1,5% — это крупнейшее падение с 10 января 2025 года. А индекс Nasdaq 100 упал на 3%.
Пострадали в основном компании, которые зарекомендовали себя как лидеры на рынке искусственного интеллекта. Миллиарды капитализации потеряли Microsoft, Meta* и материнский холдинг Alphabet, в который входит Google. Больше всех подешевела Nvidia, капитализация которой просела почти на 600 млрд долларов.
Причина опять же в дешевизне разработки DeepSeek. Технологический сектор задумался над целесообразностью миллиардных вложений в обучение нейросетей и развитие мощнейших чипов. Особенно остро этот вопрос встает в ситуации, когда главный китайский конкурент тратит на это несравнимо меньше денег, да и еще и пользуется GPU с меньшими вычислительными мощностями. А ведь именно из-за оптимизма в отношении развития ИИ Nvidia в 2024 году сместила Apple и стала самой дорогой компанией в мире.
Соцсети отреагировали на падение шутками про «красный день для американского ИТ-сектора». При этом The Wall Street Journal объясняет падение временной паникой. По мнению журналистов, одна DeepSeek не потопит технологических гигантов из США.
Руководство некоторых компаний из-за успеха DeepSeek столкнулось с кризисом, пишет VentureBeat. В приложении Blind, где анонимно общаются сотрудники стартапов Кремниевой долины, обсуждали обеспокоенность менеджмента Meta* по поводу китайской нейросети. А OpenAI пообещала поделиться с бесплатными пользователями новейшей моделью ChatGPT o3-mini. Глава компании Сэм Альтман назвал DeepSeek «впечатляющей моделью» и заявил о готовности конкурировать.
DeepSeek же не останавливается. 27 января компания представила новую модель — на этот раз для распознавания и генерации изображений. По тестам она опережает Dall-E 3 от OpenAI.
Как попробовать DeepSeek в России
В России DeepSeek получила большую популярность в том числе за счет того, что западные сервисы закрывали доступ российским пользователям. С ChatGPT, Gemini и другими приложениями есть проблемы при регистрации, посещении с IP-адреса внутри РФ и оплате банковской картой. DeepSeek же доступна в российских магазинах приложений, сайт тоже открывается без проблем, и платить за дополнительные функции не нужно.
Попробовать DeepSeek можно:
Единственная проблема: DeepSeek временно ограничила регистрацию для пользователей вне Китая после наплыва новых юзеров. Меру объяснили масштабной кибератакой на сервис.
Мы постим кружочки, красивые карточки и новости о технологиях и поп-культуре в нашем телеграм-канале. Подписывайтесь, там классно: @t_technocult