Anthropic présente son modèle d’intelligence artificielle le plus avancé : Claude 3.5 Sonnet

25 juin 2024

By aurora

Alors que le monde de l’intelligence artificielle générative continue d’évoluer rapidement, l’une des entreprises leaders dans ce domaine, Anthropic, a récemment lancé son dernier modèle phare, Claude 3.5 Sonnet. Ce nouveau modèle vise à surpasser ses prédécesseurs et à défier des concurrents majeurs tels qu’OpenAI et son modèle GPT-4o. Mais s’agit-il vraiment d’une avancée aussi importante qu’Anthropic le prétend ? Examinons de plus près les caractéristiques et les implications de ce nouveau modèle d’IA.

Des performances impressionnantes

Selon Anthropic, le Claude 3.5 Sonnet offre des performances de référence nettement supérieures à celles des modèles précédents de la série Claude. Grâce à une série de tests de lecture, de codage, de mathématiques et de vision, le nouveau modèle s’est avéré plus performant que son prédécesseur, le Claude 3 Sonnet, mais aussi que le précédent modèle phare de l’entreprise, le Claude 3 Opus. Bien que les tests de référence ne soient pas nécessairement le meilleur critère pour mesurer les progrès de l’IA, ces résultats sont néanmoins remarquables et indiquent une amélioration tangible des capacités du modèle.

Principales améliorations

Outre les résultats des tests de référence, Claude 3.5 Sonnet présente quelques améliorations majeures par rapport aux versions précédentes. En particulier, le modèle comprend mieux les instructions plus subtiles et plus complexes, ainsi que des concepts tels que l’humour – ce qui est notoirement difficile à maîtriser pour l’IA. En outre, le modèle est nettement plus rapide, environ deux fois la vitesse de Claude 3 Opus, ce qui le rend plus adapté aux applications qui nécessitent des réponses rapides, telles que les chatbots pour le service à la clientèle.

Amélioration de la vision artificielle

Un autre domaine d’amélioration significative pour Claude 3.5 Sonnet est la capacité d’analyse d’images. Le nouveau modèle peut interpréter avec plus de précision les graphiques et les diagrammes, ainsi que transcrire du texte à partir d’images « imparfaites », telles que celles présentant des distorsions et des artefacts visuels. Il s’agit d’une avancée majeure par rapport aux capacités de vision par ordinateur de Claude 3 Opus.

Secrets sur la formation des modèles

Bien qu’Anthropic n’ait pas divulgué en détail les données d’entraînement utilisées pour Claude 3.5 Sonnet, Michael Gerstenhaber, chef de produit, a déclaré que le modèle tire une grande partie de sa force de ces ensembles de données, qui comprennent également des données générées par l’IA elle-même. Ce choix pourrait être motivé par des raisons de concurrence, mais aussi pour éviter d’éventuels problèmes juridiques liés à l’utilisation de données protégées par des droits d’auteur.

Alignement sur les intentions des utilisateurs

En plus des données d’entraînement, Anthropic a également travaillé pour aligner Claude 3.5 Sonnet sur les intentions de l’utilisateur, dans l’espoir d’éviter la génération de textes toxiques ou problématiques. Cet effort d’alignement est un aspect important du développement de modèles d’IA sûrs et fiables.

Contexte et disponibilité

Le modèle Claude 3.5 Sonnet conserve le même contexte de 200 000 tokens (environ 150 000 mots) que ses prédécesseurs. Actuellement, le nouveau modèle est disponible gratuitement pour les utilisateurs du client web Anthropic et de l’application Claude iOS, tandis que les abonnés aux formules payantes Claude Pro et Claude Team bénéficient de limites de vitesse plus élevées. Claude 3.5 Sonnet est également disponible via l’API Anthropic et sur des plateformes gérées telles que Amazon Bedrock et Google Cloud’s Vertex AI.

Artifacts : une nouvelle interface pour interagir avec le modèle

Avec le lancement de Claude 3.5 Sonnet, Anthropic a introduit une nouvelle fonctionnalité appelée Artifacts. Cette interface dédiée permet aux utilisateurs d’éditer et d’ajouter du contenu généré par les modèles Anthropic, tels que des fragments de code, des documents textuels ou des designs de sites web. Artifacts offre aux développeurs un outil pour itérer et affiner le contenu généré par l’IA.

Progrès progressif et non révolutionnaire

Bien que Claude 3.5 Sonnet représente une amélioration par rapport aux modèles précédents, M. Gerstenhaber reconnaît qu’il s’agit d’un progrès progressif plutôt que d’une percée révolutionnaire. Cela reflète la tendance actuelle dans le domaine de l’IA générative, où des acteurs majeurs tels que Google et OpenAI ont lancé des mises à jour marginales de leurs modèles phares au cours des derniers mois.

Défis liés à l’architecture des modèles et à la formation

Selon M. Gerstenhaber, l’absence de sauts de performance comparables à ceux du GPT-3 au GPT-4 est due à la rigidité des architectures de modèles actuelles et à l’énorme quantité de calcul nécessaire pour les entraîner. Ces limitations techniques semblent empêcher des avancées plus radicales dans le domaine de l’IA générative.

Priorité à l’efficacité et à l’accessibilité

Plutôt que de se concentrer uniquement sur des modèles toujours plus puissants, Anthropic semble avoir adopté une approche plus stratégique, en investissant dans le développement de produits tels que Claude 3.5 Sonnet pour offrir des performances légèrement supérieures à des prix abordables. Ce choix reflète l’importance de fournir aux développeurs et aux entreprises des outils d’IA efficaces et abordables, indépendamment des spécifications techniques.

Source de l’article ici.