ГлавнаяНовостиВойна чипов AI Inference в 2026 году: Anthropic исследует собственную разработку чипов, Nvidia приобретает Groq, а гиганты сражаются за доминирование

Война чипов AI Inference в 2026 году: Anthropic исследует собственную разработку чипов, Nvidia приобретает Groq, а гиганты сражаются за доминирование

Война чипов AI Inference в 2026 году: Anthropic исследует собственную разработку чипов, Nvidia приобретает Groq






Весной 2026 года индустрию искусственного интеллекта потрясли важные новости: по данным Reuters, Anthropic изучает возможность разработки собственных чипов.Эта лаборатория искусственного интеллекта с годовым доходом, превышающим 30 миллиардов долларов, и растущей базой пользователей модели Клода, серьезно рассматривает возможность превращения из потребителя вычислительной мощности в ее определяющую сторону.

Источники признают, что планы все еще находятся на ранней стадии;компания еще не утвердила конкретные планы и не сформировала специальную команду.В конечном итоге Anthropic может предпочесть покупать чипы, а не разрабатывать их собственными силами.Но даже такая возможность говорит о многом.

В настоящее время Anthropic использует как TPU (тензорные процессоры), разработанные материнской компанией Google Alphabet, так и чипы Amazon Trainium для разработки и запуска Claude.Буквально на этой неделе компания также подписала долгосрочное соглашение с Google и Broadcom — последняя является основным спонсором дизайна TPU Google.Подписание многомиллиардного соглашения о внешних закупках и одновременное тихое изучение собственных разработок — этот двойной подход пугающе похож на подходы Meta и Microsoft несколько лет назад, у которых теперь есть свои собственные чипы.

По отраслевым оценкам, разработка высококлассного ИИ-чипа стоит примерно 500 миллионов долларов, но, помимо цены, более примечательным является отраслевой сигнал, стоящий за шагом Anthropic.Когда компания, специализирующаяся на чистом моделировании, начинает серьезно рассматривать возможность разработки собственного кремния, аппаратная битва за выводы ИИ фактически выходит на новый уровень интенсивности.

Вывод становится новым полем битвы

За последние два года индустрия искусственного интеллекта претерпела резкий сдвиг: большая часть спроса на вычислительную мощность быстро переместилась из области обучения в сторону вывода.

Фаза обучения, которая может занять недели или даже месяцы, требует крупномасштабных кластеров графических процессоров для параллельных вычислений, и доминирование Nvidia на этой стороне практически непоколебимо.Но вывод другой.Вывод — это вычисления в реальном времени, которые происходят каждый раз, когда модель отвечает на запрос пользователя;он преследует низкую задержку, высокую пропускную способность и низкое энергопотребление — цели, которые не полностью соответствуют возможностям графических процессоров.

По прогнозу Barclays, к 2026 году спрос на вычисления для вывода будет составлять более 70% от общего спроса на вычислительные мощности ИИ, что в 4,5 раза превышает спрос на обучение.Можно сказать, что настоящая решающая битва на будущем рынке чипов искусственного интеллекта будет заключаться в умозаключениях.

Nvidia построила десятилетний ров на этапе обучения, но если этот ров не сможет распространиться на этап вывода, всю структуру отрасли придется переписать.По этой причине в конце прошлого года Nvidia сделала официальный шаг, объявив о неэксклюзивном лицензионном соглашении со стартапом Groq, занимающимся созданием чипов для вывода искусственного интеллекта.Джонатан Росс, основатель и генеральный директор Groq, президент Сонни Мадра и несколько основных инженеров впоследствии присоединились к Nvidia.Зарубежные СМИ со ссылкой на инсайдеров сообщили, что вознаграждение за эту сделку составит около 20 миллиардов долларов.

Официальная формулировка Nvidia осторожна и подчеркивает, что это всего лишь технологическая лицензия плюс привлечение талантов, а не традиционное приобретение.Но этот нетипичный метод приобретения довольно распространен в Кремниевой долине — он позволяет избежать громоздких антимонопольных проверок, в то же время существенно объединяя целевую технологию и основную команду.

История Грока изначально была весьма примечательной.Основатель Росс был одним из основных участников проекта Google TPU и хорошо осознавал присущие ограничения архитектуры графического процессора в сценариях вывода: тысячи параллельных вычислительных блоков и чрезвычайно сложная логика планирования памяти.Эти функции являются преимуществами при обучении, но вызывают непредсказуемое дрожание задержки при выводе.

По этой причине Грок выбрал совершенно другой путь: полностью исключив планировщик на аппаратном уровне и вместо этого заставив компилятор определять путь потока каждого бита данных на этапе кода, позволяя чипу работать как автоматизированная сборочная линия с точностью до наносекунды.Эта архитектура называется LPU или языковой процессор.В тестах на вывод основных крупных моделей скорость генерации слов может быть более чем в десять раз выше, чем у графических процессоров Nvidia, в то время как энергопотребление на один токен составляет лишь одну десятую от последнего.

Благодаря такой исключительной производительности Groq привлек более 1,5 миллиона пользователей-разработчиков и получил несколько раундов инвестиций от ведущих организаций, таких как Cisco, Samsung и BlackRock, при этом оценка однажды достигла 6,9 миллиардов долларов.Однако то, что сделало его успешным, также привело к его краху.Именно чрезмерно блестящая способность Грока делать выводы сделала его самой важной целью, которую нужно было запереть в глазах Дженсена Хуанга.

На первый взгляд, приобретение Groq компанией Nvidia призвано дополнить ее техническую схему с точки зрения вывода, но на более глубоком уровне это защитная интеграция.Включив в свою экосистему одного из сильнейших внешних конкурентов, Nvidia отбирает козыри у второстепенных поставщиков облачных технологий и компаний-разработчиков программного обеспечения для искусственного интеллекта, которые не имеют возможности разрабатывать свои собственные чипы.Без Groq в качестве альтернативы возможности для тех, кто не желает облагаться налогом со стороны Nvidia, внезапно сузились.

Гиганты точат свои мечи

Однако эта отчаянная ситуация не может длиться долго.

Фактически, задолго до возвышения Грока крупные облачные гиганты уже самостоятельно планировали свои собственные пути развития вычислительной мощности.У Google есть TPU, у Amazon — Trainium, а у Microsoft — Maia — все три внутренних маршрута сейчас достигли зрелой стадии, когда их можно продавать на стороне.

TPU седьмого поколения от Google под кодовым названием Ironwood был официально выпущен и запущен в конце 2025 года. По сравнению с предыдущим поколением его однокристальная производительность выросла более чем в 4 раза, а один кластер может соединять между собой до 9216 чипов.Google не скрывал своего позиционирования продуктов этого поколения: наиболее экономически эффективной коммерческой системы в эпоху логических выводов.От вынужденной разработки собственными силами из-за нехватки внутренних вычислительных мощностей в 2015 году до открытия возможности развертывания TPU в собственных центрах обработки данных клиентов в 2025 году Google потратила десять лет на то, чтобы превратить аварийный проект в стратегическое оружие.Заявление Anthropic о том, что в будущем для обучения и развертывания серии Claude будет использовано до одного миллиона TPU, еще больше подтвердило коммерческую ценность Ironwood на рынке.

Amazon идет по другому пути.AWS уже давно сильно зависит от чипов, разработанных ее дочерней компанией Annapurna Labs.Серия Trainium примерно сравнима с графическими процессорами Nvidia, но направлена ​​на снижение стоимости облачной инфраструктуры и снижение зависимости от внешних поставщиков.Недавнее подписание AWS многолетнего соглашения о сотрудничестве с Cerebras по внедрению чипов Cerebras Wafer-Scale Engine (WSE) в центры обработки данных для параллельного развертывания с чипами Trainium собственной разработки является конкретным проявлением этой логики приоритета собственной разработки и дополнения внешними закупками.

Цель AWS очень ясна: использовать Trainium для выполнения низкоскоростных и недорогих запросов на вывод и использовать чипы Cerebras для привлечения высококлассных клиентов, которые чрезвычайно чувствительны к задержкам и готовы платить больше за скорость.

Что касается чипов вывода, в отличие от обучающих чипов, которые стремятся к краткосрочной скорости, они уделяют больше внимания долгосрочной энергоэффективности.Графический процессор Nvidia потребляет около 700 Вт, а специальный чип вывода с эквивалентной вычислительной мощностью может контролировать энергопотребление в пределах 200 Вт.Для сверхкрупномасштабных приложений, требующих сотен тысяч микросхем вывода, этот разрыв может ежегодно приносить сотни миллионов долларов экономии средств.Это одна из основных причин, почему облачные гиганты, такие как Google, Amazon и Meta, конкурируют за ставку на специализированные чипы ASIC.

Согласно последним новостям, Meta заключила соглашение о сотрудничестве в области чипов для обучения и вывода мощностью 1 ГВт с Broadcom, что должно привнести новые катализаторы на и без того «хаотичный» рынок чипов вывода.

Гетерогенная эпоха: возникают новые альянсы

Если внутренние направления исследований и разработок облачных гигантов — это долгосрочные ставки с достаточными гарантиями ресурсов, то альянс между Intel и SambaNova представляет собой еще один более реалистичный путь прорыва.

В 2026 году SambaNova объявила о выпуске гетерогенного аппаратного решения совместно с Intel, использующего трехуровневую архитектуру: графический процессор для предварительного заполнения, процессор Intel Xeon 6 в качестве основного процессора управления и выполнения и SambaNova RDU для декодирования, специально разработанный для рабочих нагрузок агента ИИ.Это решение будет доступно предприятиям, поставщикам облачных услуг и независимым проектам в области искусственного интеллекта во второй половине 2026 года.

SambaNova отметила, что системы на чистом графическом процессоре хороши для параллельной связи предварительного заполнения, но в задачах вывода в производственных средах ключевыми переменными, определяющими общую скорость и стоимость, являются инструментальное планирование ЦП и эффективность декодирования выделенных ускорителей вывода.

Данные его испытаний показывают, что скорость компиляции LLVM процессоров Intel Xeon 6 более чем на 50% выше, чем у серверных процессоров на базе архитектуры Arm, а производительность векторной базы данных выше до 70%.Эти два индикатора точно отражают основные узкие места производительности рабочего процесса агента кода.

Роль Intel в этом сотрудничестве интригует.Когда-то она была гегемоном ПК, но в эпоху графических процессоров она была практически исключена из основного поля битвы за чипы искусственного интеллекта.Теперь, благодаря преимуществам Xeon 6 в управлении ЦП и планировании, он вновь обретает точку опоры в решениях для гетерогенного вывода.Экосистема программного обеспечения центров обработки данных основана на архитектуре x86, которая также вернула Intel в центр сцены искусственного интеллекта.

Крупные фишки в центре внимания

Церебрас – еще одно имя, о котором стоит написать отдельно.

Этот стартап, специализирующийся на ИИ-чипах размером с пластину, подал заявку на IPO в 2024 году, а затем отозвал ее, что привело к широко распространенным сомнениям в его перспективах на рынке капитала.Но позже OpenAI подписала соглашение о сотрудничестве с Cerebras на сумму более 10 миллиардов долларов для предоставления вычислительных мощностей для ChatGPT.Эта новость вернула Церебрасу внимание общественности и заставила те учреждения, которые ждали и наблюдали, пересмотреть его техническую ценность.В феврале 2026 года Cerebras завершила новый раунд финансирования в размере 1 миллиарда долларов при общей сумме финансирования в 2,6 миллиарда долларов и послеинвестиционной оценке около 23 миллиардов долларов.

Основной технологией Cerebras является Wafer-Scale Engine (WSE), который использует всю пластину как один чип, преодолевая физические ограничения традиционных чипов и обеспечивая чрезвычайно выдающуюся производительность по задержке в конкретных задачах вывода.По данным Cerebras, скорость ее чипов в канале декодирования вывода может быть до 25 раз выше, чем у графических процессоров Nvidia.

Недавнее объявление AWS о многолетнем соглашении о сотрудничестве с Cerebras по внедрению чипов WSE в центры обработки данных для вывода результатов искусственного интеллекта знаменует собой ключевой переход к идентичности этого стартапа — от финансовой истории к поставщику крупнейшей в мире облачной платформы.

Выбор AWS Cerebras основан на той же логике, что и OpenAI: для сценариев, чрезвычайно чувствительных к скорости отклика, таких как помощь в программировании и задачи агента, каждая миллисекунда сокращения задержки напрямую соответствует пользовательскому опыту и коммерческой ценности — и это как раз слабость графических процессоров.

Для Cerebras, поскольку все больше и больше людей используют ИИ для решения все более сложных задач, спрос на скорость будет только возрастать.Если скорость сама по себе является ценностью продукта, то платить за скорость надбавку — естественное коммерческое поведение.Эту логику принимает все больше и больше предприятий.

CoreWeave: новый центр притяжения рынка вычислительной мощности

За битвой за вычислительную мощность стоит реструктуризация поставок инфраструктуры.В этом отношении роль CoreWeave становится все более незаменимой.

В 2025 году Meta взяла на себя инициативу по подписанию соглашения о поставках с CoreWeave, согласившись приобрести вычислительные мощности для искусственного интеллекта на сумму 14,2 миллиарда долларов к 2031 году;Документы, недавно поданные в SEC, показывают, что Meta присоединилась к соглашению, согласившись приобрести дополнительные вычислительные мощности искусственного интеллекта на 21 миллиард долларов к 2032 году. Добавление этого нового соглашения увеличило портфель невыполненных заказов CoreWeave до 87,8 миллиардов долларов, из которых только на Meta приходится около 40%.

Рост CoreWeave — это микрокосм эволюции вычислительной мощности графических процессоров от дефицитного товара до инфраструктуры.Будучи арендатором исключительно вычислительной мощности, он предоставляет не возможности моделей, а базовую поддержку, позволяющую моделям работать.Помимо трех крупнейших облачных гигантов, предприятиям искусственного интеллекта нужен вариант вычислительной мощности, не привязанный к экосистеме платформы, и CoreWeave как раз заполняет этот пробел.

В 2025 году объем продаж CoreWeave составил 5,13 миллиарда долларов, что примерно на 170% больше, чем в предыдущем году.Число центров обработки данных увеличилось до 43, а используемая мощность составила 850 мегаватт.Компания оснащена примерно 600 000 графическими процессорами, в основном Nvidia H100 и H200, при этом доля серии Blackwell постоянно увеличивается.Суммарная мощность по контракту достигла 3500 мегаватт, что более чем в четыре раза превышает нынешнюю используемую мощность.

Однако логика расширения CoreWeave также является ее самым большим структурным давлением.Чтобы покрыть расходы на расширение центра обработки данных, компания недавно объявила о частном размещении облигаций на сумму 4,75 миллиарда долларов.Имея на руках менее 4 миллиардов долларов наличными, завершение капитальных затрат в размере от 30 до 35 миллиардов долларов в 2026 году означает, что для поддержания высокоскоростного расширения ей придется полагаться на внешнее финансирование.Инвесторы CoreWeave явно делают ставку на основное мнение о том, что спрос на вычислительную мощность будет продолжать расти высокими темпами в долгосрочной перспективе.

Хаос продолжается

Исследование Anthropic собственного дизайна чипов, приобретение Nvidia компании Groq за 20 миллиардов долларов, десятилетние усилия Google по превращению TPU в эталонный продукт, внедрение Amazon Cerebras в собственный центр обработки данных для создания дифференцированного портфеля логических выводов и альянс Intel с SambaNova для борьбы за долю на рынке гетерогенных логических выводов — все эти, казалось бы, разрозненные события указывают на то, что логический вывод станет новым полем битвы.

Все больше и больше людей понимают, что фокус ИИ смещается от обучения более качественных моделей к тому, как делать больше запросов с меньшими затратами и с большей скоростью.Этот сдвиг вызвал масштабную трансформацию в предыдущей системе вычислительной мощности, ориентированной на графические процессоры.

Этот раунд соревнований отличается от ранней замены процессоров на графические процессоры.Это было одностороннее превосходство новых продуктов над старыми.Сегодняшняя битва за чипы вывода больше похожа на реструктуризацию разделения труда внутри сложной экосистемы.Ни одна архитектура не может доминировать во всех сценариях, и гетерогенные комбинации становятся мейнстримом.Графические процессоры выполняют высокопараллельное предварительное заполнение, выделенные микросхемы вывода берут на себя декодирование, центральные процессоры отвечают за планирование и координацию, с разной направленностью на облако и периферию, а в каждом канале конкурируют несколько игроков.

Это означает, что исход еще далек от решения.

Для Anthropic изучение собственного дизайна чипов — это активное стремление к автономности вычислительной мощности и страховой полис, позволяющий не оказаться в заложниках у поставщиков верхнего уровня.Но длительный цикл и большие инвестиции в исследования и разработки чипов означают, что этот путь будет непростым.Для Nvidia ров в экосистеме CUDA все еще глубок, но все более очевидный разрыв в производительности и стоимости на этапе вывода становится общей целью прорыва для всех потенциальных претендентов.Для других технических конкурентов, таких как Groq, технологическое лидерство не обязательно приводит к коммерческому успеху, и вероятность его приобретения постоянно возрастает.

Линия фронта подведена, а список участников продолжает расти.Битва вычислительных мощностей искусственного интеллекта только что вступила в самую напряженную фазу.