Lors de sa conférence annuelle re:Invent à Las Vegas, Amazon Web Services (AWS) a dévoilé une série d’annonces majeures. Parmi elles, une nouvelle famille de modèles d’intelligence artificielle (IA) baptisée Nova et des avancées sur ses puces Trainium. L’objectif est clair : se positionner comme un acteur sérieux face à ses concurrents de toujours Microsoft et Google.
Une nouvelle famille de modèles Nova
Avec Nova, Amazon frappe fort, la gamme de modèles d’intelligence artificielle conçus pour répondre à des besoins variés combine performance, polyvalence et accessibilité financière. Ces modèles incluent des versions textuelles et multimodales, optimisées pour des tâches complexes ou des utilisations spécifiques.
- Différents modèles pour tous types de besoins :
- Nova Micro : Un modèle exclusivement textuel, idéal pour des tâches nécessitant une faible latence. Sa fenêtre de contexte, limitée à 128 000 jetons, convient parfaitement aux petites applications.
- Nova Lite : Ce modèle multimodal peut traiter du texte, des images et des vidéos, tout en restant abordable. Avec une capacité de 300 000 jetons, il peut analyser jusqu’à 30 minutes de vidéo par requête.
- Nova Pro : Équilibré entre coût, précision et vitesse, il convient aux entreprises cherchant une solution performante pour des tâches complexes.
- Nova Premier : Disponible en 2025, ce modèle promet des capacités avancées pour des applications nécessitant un raisonnement sophistiqué ou la création de modèles personnalisés.
- Deux modèles pour la création multimédia :
- Nova Canvas, dédié à la génération et à l’édition d’images à partir de commandes textuelles.
- Nova Reel, qui produit des vidéos courtes, actuellement limitées à six secondes, mais pouvant atteindre deux minutes l’année prochaine.
Avec ces innovations, Amazon promet des coûts réduits jusqu’à 75 % par rapport à OpenAI (GPT) et Google (Gemini), tout en intégrant des systèmes de modération pour limiter les contenus inappropriés et protéger les droits d’auteur.
Amazon met l’accent sur l’intégration de mécanismes de modération et de filigranes pour prévenir les dérives. Cette stratégie visant à rassurer les entreprises et les utilisateurs, devient un enjeu majeur dans un contexte où les régulateurs et le grand public surveillent de près les applications de l’IA. D’autres entreprises pionnières de ce domaine, comme Google, mettent en avant une stratégie et une infrastructure de leurs modèles basée sur le respect des données privées, des droits d’auteurs et sur la prévention des deepfakes.
AWS mise sur le matériel Trainium
AWS ne limite pas ses annonces à ses nouveaux modèles d’IA mais pousse également l’innovation matérielle avec ses nouvelles puces Trainium.
- Trainium2 : Désormais disponible, elle offre des performances jusqu’à quatre fois supérieures à la génération précédente, tout en améliorant l’efficacité énergétique. AWS met en avant un rapport performance/prix 30 à 40 % supérieur à celui des GPU traditionnels.
- Trainium3 : Prévue pour fin 2025, la puce Trainium3 bénéficiera d’un processus de fabrication en 3 nanomètres, permettant d’augmenter la puissance de calcul tout en réduisant la consommation énergétique. AWS promet que ses UltraServers alimentés par Trainium3 seront quatre fois plus performants que leurs prédécesseurs.
Autre annonce autre surprise, AWS, en collaboration avec Anthropic, et d’un investissement de 4 milliards de dollars, construit un UltraCluster intégrant des centaines de milliers de puces Trainium. Ce projet vise à créer le plus grand cluster de calcul d’IA au monde, une infrastructure capable de rivaliser avec les investissements massifs de Microsoft et Google. Anthropic adapte déjà son modèle Claude pour qu’il fonctionne sur Trainium afin de renforcer l’écosystème d’Amazon.
Avec Nova et Trainium, Amazon ne se contente pas de suivre la concurrence : il redéfinit son approche pour s’imposer comme un acteur clé dans l’IA générative. Ces avancées technologiques, combinées à des coûts compétitifs et une stratégie de partenariat ambitieuse, pourraient bien redessiner les équilibres sur ce marché en pleine effervescence.
Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.
Source : aws.amazon.com