Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

La clé du problème de l'IA

Les géants de la technologie et les startups expérimentent de nouvelles approches pour résoudre un problème tenace de l’IA : l’énergie.

ZNewsZNews25/08/2025

« Je ne comprends pas », a déclaré Andrew Wee, qui a 30 ans d’expérience dans le secteur des centres de données et du matériel informatique dans la Silicon Valley.

Ce qui le rendait perplexe, voire même furieux, c'était les besoins énergétiques prévus des futurs superordinateurs d'IA, les machines censées alimenter le grand bond en avant de l'humanité.

Wee, qui a occupé des postes de direction chez Apple et Meta et qui est désormais responsable du matériel pour le fournisseur de cloud Cloudflare, estime que la croissance actuelle de l'énergie nécessaire à l'IA - qui, selon le Forum économique mondial, augmentera de 50 % par an jusqu'en 2030 - n'est pas durable.

« Nous devons trouver des solutions techniques, des solutions politiques et d’autres solutions pour résoudre collectivement ce problème », a déclaré Wee.

Une nouvelle voie pour les puces d'IA

À cette fin, l’équipe de Wee chez Cloudflare teste un tout nouveau type de puce, issue d’une startup fondée en 2023 appelée Positron, qui vient d’annoncer un nouveau tour d’investissement de 51,6 millions de dollars .

Ces puces ont le potentiel d’être beaucoup plus économes en énergie que les puces de Nvidia, le leader du secteur des tâches d’inférence.

Il s'agit du processus de génération de réponses d'IA à partir des requêtes des utilisateurs. Si les puces Nvidia continueront d'être utilisées pour entraîner l'IA dans un avenir proche, une inférence plus efficace pourrait permettre aux entreprises d'économiser des dizaines de milliards de dollars et une quantité d'énergie correspondante.

Selon le WSJ , au moins une douzaine de startups de puces électroniques sont en concurrence pour vendre aux fournisseurs de cloud computing des puces d'inférence personnalisées du futur.

AI anh 1

La puce Ironwood a été développée par Google spécifiquement pour les tâches d'inférence. Photo : Google.

Google, Amazon et Microsoft sont également dans le coup, construisant des puces axées sur l'inférence pour alimenter leurs propres outils d'IA internes et pour les vendre à des partenaires via des services cloud.

Pour atteindre leurs objectifs, les fabricants de nouvelles puces d’IA utilisent une stratégie « classique » : reconcevoir les puces à partir de zéro, spécifiquement pour la nouvelle classe de tâches qui deviennent soudainement importantes en informatique.

C'était la formule des cartes graphiques d'autrefois, et c'est ainsi que Nvidia a bâti son succès actuel. Il a fallu du temps pour que les puces graphiques soient réorientées vers l'IA, mais la réalité est que cela n'a jamais été une solution idéale.

"Goulot"

Jonathan Ross, qui dirigeait auparavant le programme de développement de puces d'IA de Google, a déclaré avoir fondé une startup appelée Groq parce qu'il pensait qu'il existait une manière complètement différente de concevoir des puces, optimisées uniquement pour exécuter des modèles d'IA puissants.

Groq affirme que sa puce peut également fournir une puissance d'IA beaucoup plus rapidement que la meilleure puce de Nvidia et, surtout, avec seulement un tiers de la puissance.

Cela est dû à sa conception unique, avec de la mémoire intégrée à l'intérieur, plutôt que séparée, et il est logique que la startup puisse fournir des tâches d'inférence à un coût inférieur à celui des systèmes de Nvidia, selon Jordan Nanos, analyste chez SemiAnalysis.

Parallèlement, Positron adopte une approche différente pour accélérer les inférences. La startup, en partenariat avec Cloudflare, a créé une puce simplifiée aux capacités plus restreintes, destinée uniquement à accélérer les tâches.

Le système de nouvelle génération de Positron devrait concurrencer directement la puce de nouvelle génération de Nvidia, appelée Vera Rubin. Selon la feuille de route de Nvidia, la puce de Positron sera 2 à 3 fois plus efficace, tout en fournissant 3 à 6 fois plus de puissance par unité d'entrée, selon Mitesh Agrawal, PDG de Positron.

AI anh 2

La puce nouvelle génération de Positron est simplifiée et offre une gamme de fonctionnalités plus restreinte, visant uniquement à accélérer les tâches. Photo : Positron.

C'est un truisme dans l'histoire de l'informatique que chaque fois que les ingénieurs en matériel découvrent comment faire quelque chose plus rapidement ou plus efficacement, les programmeurs et les consommateurs découvrent comment utiliser tous les nouveaux gains de performance.

Mark Lohmeyer, vice-président de l'IA et de l'infrastructure informatique chez Google Cloud, a déclaré qu'à mesure que les consommateurs et les entreprises adoptent de nouveaux modèles d'IA plus exigeants, cela signifie que peu importe l'efficacité avec laquelle son équipe peut fournir l'IA, la demande pour celle-ci n'a pas de fin.

Comme la plupart des autres grands fournisseurs d’IA, Google s’efforce de trouver de nouvelles façons radicales de générer de l’énergie pour alimenter les systèmes, notamment l’énergie nucléaire et la fusion.

Si les nouvelles puces peuvent aider les entreprises à développer l'IA plus efficacement, le secteur dans son ensemble est toujours en passe de consommer de plus en plus d'énergie. Comme le souligne un récent rapport d'Anthropic, cela signifie que la production d'énergie, et non les centres de données et les puces, pourrait constituer le véritable obstacle au développement futur de l'IA.

Source : https://znews.vn/chia-khoa-cho-van-de-cua-ai-post1572212.html


Comment (0)

No data
No data

Même catégorie

Moments impressionnants de la formation de vol en service lors de la Grande Cérémonie de l'A80
Plus de 30 avions militaires se produisent pour la première fois sur la place Ba Dinh
A80 - Raviver une fière tradition
Le secret des trompettes de près de 20 kg de la fanfare militaire féminine

Même auteur

Patrimoine

Chiffre

Entreprise

No videos available

Nouvelles

Système politique

Locale

Produit