Amazon Web Services (AWS) представила обновлённую версию процессора Graviton4 с сетевой пропускной способностью 600 Гбит/с — что, по заявлениям компании, является рекордом в публичных облаках. В технических терминах официально приводится аналогия: такой канал позволяет считывать данные с 100 аудио-CD в секунду.
Чипы Graviton — CPU, а также серия ускорителей Trainium создаются в Annapurna Labs в Остине, штат Техас. Этот шаг демонстрирует решимость AWS уменьшить зависимость от Intel, AMD и Nvidia.
На конференции AWS re:Invent 2024 был представлен Project Rainier — суперкомпьютер для стартапа Anthropic, реализованный на базе ускорителей Trainium2. В этот проект AWS вложила 8 млрд USD. На сегодня в кластер входят более 500 000 чипов Trainium2 — объём, который ещё совсем недавно занимал бы Nvidia.
AWS подчёркивает, что хотя чип Nvidia Blackwell может предложить более высокую производительность, Trainium2 показывает лучшее соотношение цена/производительность, а Trainium3, обещающий двукратный прирост производительности при 50 % снижении энергопотребления, выйдет в 2025 году.
Согласно аналитикам, подход AWS заключается в снижении затрат: стоимость обучения ИИ-моделей на Trainium2/3 ниже на 30–40 % по сравнению с аналогами от Nvidia. Комплексный контроль над инфраструктурой — от чипов до охлаждения — позволяет AWS оптимизировать расходы.
AWS уже достигает высокой доходности на облачном направлении, за счёт своей вертикальной интеграции и собственных чипов. Одновременно Nvidia может столкнуться с давлением на маржу: ей приходится снижать цены, чтобы не потерять долю рынка в гиперскейлерских кластерах.
"AWS… launching a full-scale assault on Nvidia"s claim to AI-chip supremacy… Trainium3 is launching soon, promising twice the performance and half the power consumption… They've already deployed half a million of these chips…"
Планы AWS по ускоренной интеграции пользовательских чипов в ИИ-инфраструктуру становятся реальностью. Graviton4 и Trainium2/3 уже сейчас справляются с обучением моделей — и делают это дешевле, чем GPU Nvidia. Остальное зависит от того, сможет ли Amazon продолжить поддерживать программную совместимость и адаптацию Trainium, и как Nvidia ответит на вызов.