L’IA révolutionnaire de Elon Musk : xAI et son Grok-1

Introduction

Après avoir marqué l’industrie automobile avec Tesla, la santé avec Neuralink, et les réseaux sociaux avec X, Elon Musk s’attaque maintenant au monde de l’intelligence artificielle avec xAI. Cette start-up, fondée en mars dernier, compte parmi ses rangs 16 chercheurs issus de géants de l’intelligence artificielle tels que DeepMind, OpenAI, Google Research, Microsoft Research et Tesla. Leur objectif ? Développer une IA révolutionnaire qui bénéficie à l’ensemble de l’humanité, sans se restreindre à une seule catégorie d’utilisateurs.

Grok, une avancée majeure

Grok est le fruit des travaux acharnés des ingénieurs de xAI. Contrairement à certains modèles concurrents, Grok a été conçu avec une philosophie différente. En minimisant les garde-fous, les équipes de xAI ont cherché à éviter l’auto-censure souvent observée chez d’autres modèles, comme Claude 2 ou GPT-4. Le premier modèle, Grok-0, était doté de 33 milliards de paramètres, ce qui lui permettait de rivaliser avec des modèles plus volumineux, tels que LLaMa 2 (70B), tout en ayant seulement la moitié des ressources d’entraînement.

Grok n’en est pas resté là. Les ingénieurs de xAI ont apporté des améliorations significatives à ses capacités de raisonnement et de codage, faisant évoluer le modèle vers Grok-1, la version actuelle en action. Selon les tests réalisés par xAI, Grok-1 surpasse GPT-3.5 sur de nombreuses tâches, ce qui en fait un concurrent de taille sur le marché de l’IA.

Performances de Grok-1

Sur le benchmark GSM8k, qui évalue la compréhension et le raisonnement généraux, Grok-1 affiche un score de 62,9%, dépassant ainsi GPT-3.5. Cependant, il est important de noter que des modèles tels que Palm 2 et Claude 2 restent en tête. Dans le domaine de MMLU, qui teste la compréhension dans divers sujets, Grok-1 réalise un score solide de 72,7%, le plaçant au-dessus de GPT-3.5 et surpassant même LLaMa 2 (70B). Même comparé à des modèles tels que Claude-2 d’Anthropic et GPT-4 d’OpenAI, Grok-1 fait preuve de performances remarquables.

Grok et son intégration à Twitter

Pour tester Grok, les équipes de X (Twitter) ont développé une interface dédiée directement accessible depuis le réseau social. Cependant, seul les abonnés Premium+ de X, au tarif de 16 dollars par mois, ont accès à cette IA. Les utilisateurs européens doivent actuellement utiliser un VPN connecté aux États-Unis pour pouvoir l’utiliser, en raison de réglementations en vigueur.

Contrairement à d’autres chatbots, tels que Claude ou ChatGPT, Grok ne permet pas de maintenir plusieurs conversations simultanées. Au lieu de cela, il propose plusieurs prompts de démarrage, chacun adapté aux préférences des utilisateurs. Cela peut aller de discussions humoristiques à des sujets sérieux, reflétant ainsi la variété des intérêts des utilisateurs de Twitter.

Les particularités de Grok

L’une des particularités majeures de Grok réside dans sa connexion directe à Twitter. Cette intégration lui permet de solliciter des informations en temps réel depuis le réseau social. Par exemple, lorsqu’on lui demande les dernières actualités en France, Grok effectue une requête sur Twitter pour obtenir les informations les plus récentes. Cependant, cette fonctionnalité peut parfois mener à des mélanges d’informations et à une synthèse d’actualité partiellement erronée, ce qui peut être considéré comme une forme d’hallucination.

De plus, Grok peut parfois donner des réponses erronées lorsqu’on lui demande quel type de données a été utilisé pendant son entraînement. Certaines réponses erronées sont attribuées à des informations disponibles publiquement sur le web lors de l’entraînement de Grok, mais les ingénieurs de xAI assurent qu’aucun code d’OpenAI n’a été utilisé dans le développement de Grok.

L’expérience utilisateur avec Grok

Bien que Grok n’ait pas été initialement conçu pour s’exprimer en français, il se débrouille remarquablement bien dans la langue de Molière. Il est capable de générer rapidement des articles de 500 mots dans un style formel, similaire à celui de GPT-3.5. Cependant, il semble ne pas supporter le Markdown, un langage de balisage léger permettant de formater du texte brut.

En ce qui concerne son approche « spicy » annoncée par Elon Musk, les réponses générées par Grok restent relativement génériques et consensuelles. Le pré-prompt initial, qui encourage l’IA à agir comme une « IA humoristique inspirée par ‘Le guide du voyageur galactique’ et JARVIS d’Iron Man », ainsi que la nécessité de répondre à des questions « sensibles » sans parti pris, ne se traduisent pas nécessairement par des réponses exceptionnellement originales ou audacieuses.

Conclusion

En fin de compte, Grok-1 représente une avancée significative dans le domaine de l’intelligence artificielle, mais il ne révolutionne pas complètement le paysage. Ses performances en termes de raisonnement et de génération de texte sont indéniablement impressionnantes, mais des problèmes d’hallucination et d’erreurs factuelles subsistent. De plus, la promesse d’une IA au caractère « spicy » reste en grande partie non tenue. Elon Musk peut-être un visionnaire, mais Grok-1 ne parvient pas à répondre complètement aux attentes initiales.

Check Also

Les Pleiades : Les étoiles qui brillent dans nos rêves

Introduction Avez-vous déjà levé les yeux vers le ciel nocturne et remarqué un petit amas …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *