Google представила тензорные процессоры TPU восьмого поколения для обучения ИИ

В рамках мероприятия Cloud Next '26 компания Google анонсировала восьмое поколение собственных тензорных блоков обработки (TPU) в двух версиях. Модель TPU 8t предназначена для обучения ведущих моделей искусственного интеллекта, а TPU 8i — для обеспечения их работы (инференса).

По словам Google, TPU 8t демонстрирует высокую эффективность при выполнении масштабных вычислительно-интенсивных задач обучения, требующих повышенной вычислительной пропускной способности и широкой полосы при горизонтальном масштабировании. TPU 8i, в свою очередь, создан с увеличенной пропускной способностью памяти для обработки задач инференса — от обычных пользовательских запросов до сложных взаимодействий между ИИ-агентами.

В компании отметили, что оба чипа предназначены для работы в специализированных суперкомпьютерах Google и способны выполнять широкий спектр задач: от обучения передовых базовых моделей и разработки агентов до обработки огромных объемов инференс-вычислений. На протяжении многих лет TPU служат основой для ведущих моделей, включая семейство Gemini. Новое поколение обеспечит масштабируемость, эффективность и экономическую выгоду согласно заявленным параметрам.

Google утверждает, что TPU 8t призван сократить время разработки ведущих ИИ-моделей с месяцев до недель. Система обеспечивает почти трехкратный рост вычислительной производительности на один pod по сравнению с предыдущим поколением. Серверы с этим TPU поддерживают до 9600 чипов и 2 петабайт общей высокопроизводительной памяти.

Помимо сырой производительности, TPU 8t достигает 97% полезного вычислительного времени благодаря комплексному набору функций надежности, доступности и удобства эксплуатации.

TPU 8i разработан для обработки сложной, совместной и итеративной работы множества специализированных агентов, которые часто объединяются в сложные потоки для предоставления решений и аналитики. Новый чип сочетает 288 ГБ высокоскоростной памяти с 384 МБ встроенной SRAM — втрое больше, чем у предыдущего поколения, что позволяет удерживать активный набор данных модели полностью на кристалле и избегать простоев. Google также удвоила количество физических процессоров на сервере, используя собственные чипы Axion на базе архитектуры ARM. Вся система оптимизирована за счет применения неоднородной архитектуры памяти.

Google заявляет, что внедрение этих инноваций обеспечивает на 80% лучшую производительность в расчете на доллар по сравнению с чипами предыдущего поколения, что позволяет компаниям обслуживать почти вдвое больше клиентов по той же цене. Кроме того, TPU 8t и TPU 8i демонстрируют до двукратного улучшения производительности на ватт по сравнению с поколением Ironwood.