Amazon Web Services (AWS), lors de son événement mondial Re:Invent qui s’est tenu à Las Vegas du 27 novembre au 1er décembre, a fait sensation en dévoilant sa stratégie pour se hisser au sommet de l’industrie des modèles de fondation. Cette initiative vise à concurrencer directement les géants du secteur, Microsoft et Google. L’annonce d’Amazon comprend des développements majeurs tels que Titan Image Generator, la vectorisation multimodale et l’intégration de Claude 2.1, qui devraient révolutionner le domaine de l’intelligence artificielle (IA).
Titan Image Generator : Révolution dans la génération d’images
Amazon a introduit Titan Image Generator, un générateur d’images révolutionnaire, qui représente un pas en avant significatif dans le domaine de la génération d’images assistée par l’IA. Cette plateforme cloud d’IA permet non seulement de créer des images à partir de prompts, mais également de réaliser des retouches précises. Par exemple, il devient possible d’ajouter des éléments tels qu’une planche de surf dans une scène de plage ou de remplacer des montagnes par une forêt en arrière-plan d’une publicité automobile.
Comparé à d’autres modèles de génération d’images tels que Midjourney et Dall-E, Titan Image Generator se distingue par sa précision et sa polyvalence. De plus, Amazon s’engage à indemniser les clients qui pourraient faire face à des litiges liés à la violation de droits d’auteur lors de l’utilisation de Titan Image Generator, renforçant ainsi la confiance des utilisateurs.
Titan Multimodal Embeddings : Fusion de texte et d’image
Amazon élargit encore son offre en introduisant Titan Multimodal Embeddings, une fonctionnalité qui réunit le texte et l’image. Jusqu’à présent, seuls les textes étaient pris en charge, mais désormais, les images peuvent également être intégrées. Cette fonctionnalité permet de réaliser des recherches intelligentes (Rag) ou des prompts qui combinent à la fois du texte et de l’image.
Imaginez une société de photographie ayant des millions de clichés en stock. Avec Titan Multimodal Embeddings, son équipe peut rechercher des images en utilisant une phrase, une image ou même une combinaison de texte et d’image. Par exemple, ils peuvent demander « des images similaires » à une image donnée, mais avec un ciel ensoleillé. Cette fonctionnalité offre une flexibilité inégalée pour explorer et rechercher des données visuelles.
Claude 2.1 et Llama 70b : Des avancées remarquables
Claude 2.1 et Llama 70b sont deux autres annonces majeures faites par Amazon lors de l’événement Re:Invent. Claude 2.1 a permis de réduire de manière significative le nombre d’hallucinations, le rendant plus fiable. De plus, le nombre de tokens supportés a été doublé pour atteindre 200 000, offrant ainsi la possibilité de traiter des prompts plus longs et complexes. Cette augmentation de la taille du modèle le place en avance par rapport aux concurrents sur le marché.
Llama 70b, qui fait également son entrée dans Amazon Bedrock, la solution de gestion des modèles de fondation d’AWS, offre des performances améliorées. Ces deux avancées illustrent l’engagement d’Amazon à rester à la pointe de la technologie dans le domaine de l’IA.
Un partenariat stratégique avec Anthropic
Claude, développé par la start-up américaine Anthropic, a attiré l’attention d’Amazon, qui a annoncé un investissement de 4 milliards de dollars dans la société en septembre 2023. Ce partenariat va au-delà de l’aspect financier, car AWS est le seul cloud à intégrer nativement Claude grâce à une instance dédiée. Cette stratégie rappelle celle de Microsoft avec OpenAI et l’intégration de ChatGPT dans le cloud Azure.
Model Evaluation : Comparer les modèles de fondation
Amazon a également ajouté un nouvel outil, Model Evaluation, à sa plateforme Bedrock. Cet outil permet de comparer les modèles de fondation entre eux, offrant ainsi une évaluation objective de leur performance. Il est proposé en deux modes : manuel et automatique. Les utilisateurs peuvent choisir les modèles à évaluer pour des tâches spécifiques telles que la réponse aux questions ou la synthèse de contenu.
Pour les évaluations automatiques, les clients peuvent sélectionner des critères prédéfinis tels que la précision, la robustesse ou la toxicité, et télécharger leurs propres jeux de données de test ou utiliser des ensembles de données disponibles en ligne. Lorsque des critères subjectifs ou nuancés sont nécessaires, Model Evaluation propose des workflows basés sur l’expertise humaine. Les évaluateurs peuvent être internes ou externes, selon les besoins du client.
SageMaker HyperPod : Optimisation de l’apprentissage des grands modèles
Amazon SageMaker a également fait l’objet d’améliorations significatives avec l’introduction de SageMaker HyperPod. Cette solution vise à optimiser l’apprentissage des grands modèles en anticipant les erreurs de traitement. Concrètement, le processus d’apprentissage est distribué sur des centaines voire des milliers de GPU, exécutant des calculs massifs en parallèle pendant des semaines, voire des mois. En cas d’erreur, il est généralement nécessaire de revenir au checkpoint précédent, ce qui peut entraîner une perte de temps considérable.
SageMaker HyperPod résout ce problème en permettant des checkpoints beaucoup plus fréquents pour minimiser les pertes de temps en cas de défaillance d’un nœud. De plus, il automatise la gestion des pannes, réduisant ainsi la nécessité d’interventions manuelles. Cette innovation positionne Amazon en tant que leader de l’ingénierie de l’apprentissage des modèles de fondation, un domaine qui était traditionnellement dominé par Microsoft et Google.
Conclusion
Amazon Web Services a clairement annoncé son intention de devenir un acteur majeur dans le domaine des modèles de fondation. Les annonces faites lors de l’événement Re:Invent montrent l’engagement d’Amazon à innover et à fournir des solutions de pointe dans le domaine de l’IA. Avec Titan Image Generator, Titan Multimodal Embeddings, Claude 2.1, Llama 70b, Model Evaluation et SageMaker HyperPod, Amazon se positionne comme un concurrent sérieux pour Microsoft et Google. Il reste à voir comment ces développements auront un impact sur l’industrie de l’IA, mais il est clair qu’Amazon est prêt à relever le défi.