Le PDG de Google, Sundar Pichai, a annoncé le lancement de la huitième génération de Tensor Processing Unit (TPU) lors de Cloud Next 2026, introduisant pour la première fois des puces distinctes pour l'entraînement et l'inférence. Le TPU 8t, conçu pour l'entraînement, peut connecter 9 600 puces dans un super-nœud, offrant une puissance de calcul de 121 ExaFlops et 2 Po de mémoire partagée, triplant ainsi les performances de la génération précédente Ironwood. Le TPU 8i, axé sur l'inférence, connecte 1 152 puces par pod, améliorant significativement la mémoire et réduisant la latence grâce à la nouvelle topologie réseau Boardfly. Les deux puces seront disponibles sur le Google Cloud AI Hypercomputer plus tard en 2026.