В Кремниевой долине появилась новая мода — «tokenmaxxing», соревнование в том, кто быстрее «сжигает» больше токенов, то есть объёма текста, который обрабатывают модели ИИ. Но за этим стоит куда более серьёзная проблема: токены заканчиваются, потому что мощности для ИИ стремительно исчерпываются.
Спрос растёт быстрее, чем индустрия успевает строить мощности
С начала года спрос на вычисления для ИИ вырос настолько, что крупнейшие лаборатории начали ограничивать доступ:
- Anthropic в марте стала снижать доступность своих моделей в часы пик, а в апреле её сервисы ежедневно падали на 30 минут.
- OpenAI внезапно отключила Sora, чтобы перераспределить дефицитные ресурсы.
- GitHub Copilot перестал принимать новых подписчиков.
Причина проста: спрос растёт быстрее, чем строятся дата‑центры. С января по март количество токенов, проходящих через OpenRouter, увеличилось в четыре раза.
Гигантские инвестиции — и всё равно мало
Гипермасштабные компании — Alphabet, Amazon, Meta, Microsoft, Oracle — вкладывают рекордные суммы в дата‑центры. Только в этом году Alphabet, Amazon и Oracle заняли более $100 млрд.
Anthropic объявила о партнёрстве с Amazon на $100 млрд для получения до 5 ГВт серверных мощностей. Google добавила ещё $40 млрд. OpenAI изменила соглашение с Microsoft, чтобы иметь возможность размещать свои модели в любых облаках.
Но даже такие суммы не решают проблему.
Политические барьеры: дата‑центры не хотят видеть у себя
В США растёт сопротивление строительству дата‑центров:
- в штате Мэн пытались запретить центры мощностью выше 20 МВт;
- в более чем 10 штатах рассматривают аналогичные меры;
- в 2025 году проекты на $156 млрд были заблокированы или задержаны.
Причины:
- рост цен на электроэнергию;
- опасения за экологию;
- нехватка инфраструктуры.
Похожие протесты происходят в Ирландии, Бразилии и других странах.
Главная проблема — нехватка оборудования
Даже если дата‑центр построен, его нечем заполнить.
GPU: дефицит тотальный
- Nvidia обеспечивает более 2/3 мировых мощностей ИИ.
- Аренда H100 подорожала на 30% с ноября.
- Новые модели недоступны, компании вынуждены брать старые.
- Amazon почти распродала доступ к Trainium2, а мощности Trainium4 уже забронированы.
Память HBM: всё раскуплено до 2027 года
SK Hynix, Samsung и Micron заявляют, что весь объём 2026 года уже продан. Даже алгоритм Google TurboQuant, который снижает потребность в памяти, не спасает ситуацию.
CPU: неожиданное возрождение
«Агентные» ИИ‑системы требуют много CPU — примерно 1 CPU на 1 GPU, тогда как чат‑ботам нужно 1 CPU на 12 GPU. Спрос настолько вырос, что капитализация Intel удвоилась за полгода.
Почему мощности не успевают за спросом
Проблема в том, что поставщики оборудования инвестируют слишком мало. Гипермасштаберы утроили свои вложения — до $750 млрд, а производители чипов, серверов и систем охлаждения увеличили инвестиции лишь на 50% и тратят в три раза меньше, чем облачные гиганты.
TSMC работает на пределе:
- самые передовые фабрики полностью загружены;
- строительство новой занимает 2–3 года;
- капитальные расходы растут, но как доля выручки — падают.
Маск и Альтман требуют больше чипов — но это невозможно быстро
Сэм Альтман призывает TSMC «строить больше». Илон Маск обещает построить «Terafab» — фабрику, производящую больше вычислительной мощности, чем весь мировой рынок сегодня.
Но:
- запуск возможен не раньше 2028 года;
- масштаб будет намного меньше заявленного;
- оборудование для такой фабрики тоже в дефиците.
Главный вывод
Разрыв между спросом на ИИ и возможностями индустрии будет только расти. Программное обеспечение развивается за месяцы, а цепочки поставок — за годы. Производители боятся перепроизводства, а спрос растёт взрывными темпами.
«Tokenmaxxing» может закончиться не потому, что людям надоест, а потому что мощности закончатся.




