OpenAI o1

modèle d'IA

OpenAI o1 est le premier modèle d'une nouvelle série de modèles d’intelligence artificielle développée par OpenAI. Une version préliminaire (preview) a été lancée en septembre 2024, qui fera l'objet de mises à jour et d'améliorations régulières.

OpenAI o1

Informations
Développé par OpenAIVoir et modifier les données sur Wikidata
Type Type de modèle d'intelligence artificielle (d)Voir et modifier les données sur Wikidata
Site web openai.com/o1Voir et modifier les données sur Wikidata

Chronologie des versions

o1 est un transformateur génératif pré-entraîné conçu pour les tâches de raisonnement complexe, qu'il exécute en prenant plus de temps pour « réfléchir » que les modèles classiques, avant de répondre. Cela le rend plus efficace en programmation, en sciences et dans toutes les tâches nécessitant un raisonnement complexe[1].

Origine

modifier

Selon des informations ayant fuité, o1 était auparavant connu au sein d'OpenAI sous le nom de « Q* », puis sous le nom de « Strawberry » (ce qui signifie « fraise » en français)[2].

Le nom de code « Q* » s'est fait connaître en novembre 2023, à l'époque de l'éviction et de la réintégration ultérieure de Sam Altman, avec des rumeurs suggérant que ce modèle expérimental avait obtenu des résultats prometteurs en mathématiques[3].

En juillet 2024, Reuters a rapporté qu'OpenAI développait un transformateur pré-entraîné génératif baptisé « Strawberry »[2].

Déploiement

modifier

« o1-preview » et sa version légère (« o1-mini ») ont été déployés[4] le 12 septembre 2024 pour les abonnés à ChatGPT Plus et Team[1].

GitHub a commencé à tester l'intégration de o1-preview dans son service Copilot le même jour[5].

OpenAI signale que « OpenAI o1 » est une version d'essai (preview) d'une série de modèles de « raisonnement », conçu pour résoudre des problèmes plus difficiles que les modèles précédents en sciences, en codage et en mathématiques[4] ; et que l'entreprise prévoit d'ajouter l'accès à o1-mini pour tous les utilisateurs gratuits de ChatGPT. L'API de o1-preview est plusieurs fois plus coûteuse que GPT-4o[6]. Il est accessible dans certaines versions de ChatGPT mais avec une forte limites d'utilisation et de débit (30 messages maximum par semaine)[7].

Capacités

modifier

Selon OpenAI, cette version o1 a été entraîné avec un nouvel algorithme d'optimisation, et un jeu de données spécifiquement adapté, avec notamment la méthode de l'apprentissage par renforcement[6].

Comparé aux modèles précédents, o1 a été formé pour générer une longue « chaîne de pensée » (non visible pour l'utilisateur) avant de produire sa réponse[8],[9]. Autrement dit : « o1 passe plus de temps à « réfléchir » avant de générer une réponse, ce qui le rend plus efficace pour les tâches complexes nécessitant de la réflexion, ainsi que pour des capacités avancées en sciences ou en programmation[1]. Ce modèle d'IA, apprend à affiner son processus de réflexion, à essayer différentes stratégies et à reconnaître ses erreurs[4].

Il est moins vulnérable aux hallucinations, et risque moins de générer des réponses incorrectes ou trompeuses.

Selon Mira Murati, cette capacité à « réfléchir avant de répondre » est un nouveau paradigme, qui implique un coût supplémentaire de calcul lors de l'élaboration de la réponse. L'autre paradigme, qui reste toujours pertinent, consiste à entraîner des modèles plus grands, avec plus de données d'entraînement et plus de puissance de calcul dédiée à cet entraînement[10]. Les résultats des tests d'OpenAI suggèrent une corrélation entre le taux de bonnes réponses et le logarithme de la quantité de calcul dépensée à réfléchir avant de répondre[9],[8].

Évaluation des performances

modifier

o1-preview

modifier

Cette première version génère des réponses d'un niveau comparable à celle d'un doctorant dans sa discipline pour les sujets concernant la physique, la chimie ou la biologie[4].

Évalué sur l'examen de qualification pour l'Olympiade internationale de mathématiques, il a résolu 83 % des problèmes, là où GPT-4o n'en avait résolu que 13 %. Il s'est également classé au 89e centile dans les compétitions de programmation Codeforces, dépassant ainsi la plupart des programmeurs humains à ce test[11].

o1-mini

modifier

Cette version allégée de l'intelligence artificielle est plus rapide, 80 % moins cher que o1-preview, mais elle n'a pas une « connaissance du monde » aussi étendue que o1-preview ; et est particulièrement adapté à la programmation et aux tâches liées aux sciences, aux mathématiques ou à l'ingénierie[12].

Sécurité

modifier

Selon OpenAI, les capacités de raisonnement d'o1 le rendent plus apte à respecter les règles de sécurité fournies dans la fenêtre de contexte du prompt[7].

OpenAI a rapporté que lors d'un test de la pré-version o1, une instance du modèle s’est rendu compte que le test qu’il effectuait était défectueux (dans cette configuration, la tâche demandée était impossible à résoudre en raison du manque d'un élément clé resté hors-ligne). Plutôt que d’abandonner en raison du bug, le modèle a en quelque sorte triché pour accéder à une information à laquelle il n'avait pas accès[7]. Cette « violation des règles » a été détectée, et des mesures d’atténuation de ce type de comportement ont été mises en place[7],[13].

OpenAI a accordé un accès anticipé aux instituts de sécurité de l'intelligence artificielle du Royaume-Uni et des États-Unis pour la recherche, l'évaluation et les tests de sécurité. Dan Hendrycks a écrit que « Le modèle surpasse déjà la plupart du temps les scientifiques titulaires d'un doctorat pour répondre à des questions liées aux armes biologiques. » Il a affirmé que ces capacités préoccupantes continueront à croître, rendant urgent la législations sur la sécurité de l'intelligence artificielle[14].

Références

modifier
  1. a b et c (en) Cade Metz, « OpenAI Unveils New ChatGPT That Can Reason Through Math and Science », sur The New York Times, (consulté le ).
  2. a et b (en) Anna Tong et Katie Paul, « Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry' », sur Reuters, (consulté le ).
  3. (en) Anna Tong, Jeffrey Dasti et Krystal Hu, « OpenAI researchers warned board of AI breakthrough ahead of CEO ouster, sources say », Reuters,‎ (lire en ligne).
  4. a b c et d Open AI (2024) [https://openai.com/index/introducing-openai-o1-preview/ lanement de la version preview d'OpenAi 01
  5. (en) Jay Peters, « GitHub has started testing OpenAI's o1-preview in GitHub Copilot. », sur The Verge, (consulté le ).
  6. a et b (en) Kylie Robison, « OpenAI releases o1, its first model with ‘reasoning’ abilities », sur The Verge, (consulté le ).
  7. a b c et d (en) Lloyd Coombes, « OpenAI's new ChatGPT o1 model 'cheated' on an impossible test — here's what happened », sur Tom's Guide, (consulté le ).
  8. a et b (en) « Learning to Reason with LLMs » [archive du ], sur OpenAI, (consulté le ).
  9. a et b (en) Jeremy Kahn, « Here are 9 things you need to know about OpenAI's o1 model », sur Fortune, (consulté le ).
  10. (en) Will Knight, « OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step », Wired,‎ (ISSN 1059-1028, lire en ligne, consulté le ).
  11. (en) Carl Franzen, « Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance », sur VentureBeat, (consulté le ).
  12. (en) « OpenAI o1-mini », OpenAI, .
  13. (en) « OpenAI o1 System Card », sur OpenAI, , p. 16-17.
  14. (en) Marie Boran, « OpenAI o1 model warning issued by scientist: "Particularly dangerous" », sur Newsweek, (consulté le ).