Nvidia a joué un rôle central dans l'essor de l'IA l'année dernière grâce à ses processeurs graphiques (GPU) pour serveurs, dont le H100, qui sont onéreux. Ils sont essentiels à l'entraînement et au déploiement de l'IA générative comme ChatGPT d'OpenAI.
Nvidia continue de démontrer sa force sur le segment des GPU grand public en annonçant trois nouvelles cartes graphiques au CES 2024 : les RTX 4060 Super, RTX 4070 Ti Super et RTX 4080 Super, proposées entre 599 $ et 999 $. Elles intègrent des cœurs Tensor supplémentaires, conçus pour exécuter des applications d'IA générative. Nvidia équipe également les ordinateurs portables d'Acer, Dell, Lenovo, etc.
La demande pour les GPU d'entreprise de Nvidia - qui coûtent des dizaines de milliers de dollars par puce et sont généralement utilisés dans des systèmes de huit GPU - a aidé l'entreprise à enregistrer de fortes ventes, portant sa capitalisation boursière à plus de 1 000 milliards de dollars.
Les GPU pour PC ont longtemps été la principale source de revenus de Nvidia, utilisés pour les jeux vidéo . Mais l'entreprise affirme que les cartes graphiques de cette année bénéficient d'une refonte et sont désormais conçues pour exécuter des modèles d'IA sans renvoyer d'informations vers le cloud. Par exemple, la puce RTX 4080 peut générer des vidéos IA 150 % plus rapidement que son prédécesseur. D'autres améliorations logicielles permettent de traiter des modèles de langage volumineux cinq fois plus rapidement.
Justin Walker, directeur principal de la gestion des produits chez Nvidia, a déclaré que l'entreprise avait vendu 100 millions de GPU RTX. Nvidia espère que les applications d'IA qui arriveront l'année prochaine tireront parti des nouveaux GPU. Microsoft devrait annoncer Windows 12, la prochaine version de Windows, plus tard cette année.
La nouvelle puce de Nvidia pourrait servir à créer des images avec l'outil Firefly d'Adobe Photoshop ou à supprimer l'arrière-plan lors des appels vidéo. Nvidia développe également des outils permettant aux développeurs de jeux d'intégrer l'IA générative à leurs titres.
Ces puces montrent que, même si Nvidia reste principalement engagé dans les GPU pour serveurs, la société concurrencera Intel, AMD et Qualcomm sur le marché de l'IA locale. Selon CNBC, ces trois concurrents ont annoncé de nouvelles puces destinées aux « PC IA ». L'industrie technologique cherche à optimiser la mise en œuvre de l'IA générative, qui requiert une puissance de calcul colossale et dont l'exécution dans le cloud est coûteuse.
Une solution technique promue par les concurrents de Microsoft et Nvidia est appelée « AI PC », ou parfois « edge computing ». Au lieu d'utiliser de puissants supercalculateurs connectés à Internet, l'appareil serait doté de puces d'IA plus performantes et pourrait exécuter de grands modèles linguistiques ou des applications d'imagerie créatives, mais avec quelques défauts.
Les nouvelles cartes graphiques seront conformes aux restrictions d'exportation américaines et pourront être vendues en Chine, offrant une alternative aux chercheurs et aux entreprises chinoises qui ne peuvent pas se permettre les GPU de serveur les plus puissants de Nvidia.
(Selon CNBC)
Source
Comment (0)