{"id":1410,"date":"2025-06-14T04:15:40","date_gmt":"2025-06-14T04:15:40","guid":{"rendered":"https:\/\/grossiste-batteries.com\/fr\/blog\/?p=1410"},"modified":"2025-06-14T04:15:41","modified_gmt":"2025-06-14T04:15:41","slug":"predire-et-expliquer-les-performances-des-modeles-dintelligence-artificielle-une-nouvelle-approche-devaluation","status":"publish","type":"post","link":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410","title":{"rendered":"Pr\u00e9dire et expliquer les performances des mod\u00e8les d&rsquo;intelligence artificielle : une nouvelle approche d&rsquo;\u00e9valuation"},"content":{"rendered":"\n<p>Avec le soutien du programme de subventions Accelerating Foundational Model Research (AFMR), une \u00e9quipe de chercheurs de Microsoft et de ses institutions partenaires a d\u00e9velopp\u00e9 une m\u00e9thode d&rsquo;\u00e9valuation des mod\u00e8les d&rsquo;IA capable de pr\u00e9dire et d&rsquo;expliquer leurs faibles performances sur des t\u00e2ches sp\u00e9cifiques, ce que les benchmarks actuels peinent \u00e0 faire.<\/p>\n\n\n\n<p>Dans un article intitul\u00e9 \u00ab Une \u00e9chelle g\u00e9n\u00e9rique pour une \u00e9valuation explicable et pr\u00e9dictive de l&rsquo;IA \u00bb, ils proposent une approche qui va au-del\u00e0 des indicateurs de pr\u00e9cision globale. Elle \u00e9value les connaissances et les capacit\u00e9s cognitives requises pour accomplir une t\u00e2che et \u00e9value les mod\u00e8les en fonction de ces capacit\u00e9s.<\/p>\n\n\n\n<p>ADeLe : Une approche par comp\u00e9tences pour l&rsquo;\u00e9valuation des t\u00e2ches<\/p>\n\n\n\n<p>Ce cadre utilise la technique du niveau de d\u00e9sirabilit\u00e9 annot\u00e9 (ADeLe) pour \u00e9valuer la difficult\u00e9 des t\u00e2ches des mod\u00e8les d&rsquo;IA en appliquant une \u00e9chelle mesurant 18 capacit\u00e9s cognitives et de connaissances. L&rsquo;\u00e9valuation de la difficult\u00e9 repose sur une grille d&rsquo;\u00e9valuation d\u00e9taill\u00e9e, initialement d\u00e9velopp\u00e9e pour les t\u00e2ches humaines et qui a fait ses preuves dans les mod\u00e8les d&rsquo;IA. En comparant les exigences des t\u00e2ches et les capacit\u00e9s du mod\u00e8le, ADeLe g\u00e9n\u00e8re un profil de comp\u00e9tences qui non seulement pr\u00e9dit la performance, mais explique \u00e9galement la r\u00e9ussite ou l&rsquo;\u00e9chec d&rsquo;un mod\u00e8le en reliant les r\u00e9sultats \u00e0 des forces ou des limites sp\u00e9cifiques.<\/p>\n\n\n\n<p>Les 18 \u00e9chelles refl\u00e8tent les capacit\u00e9s cognitives fondamentales (par exemple, l&rsquo;attention, le raisonnement), les domaines de connaissances (par exemple, les sciences naturelles ou les sciences sociales) et d&rsquo;autres facteurs li\u00e9s \u00e0 la t\u00e2che (par exemple, la popularit\u00e9 d&rsquo;une t\u00e2che sur Internet). Chaque t\u00e2che est not\u00e9e de 0 \u00e0 5 en fonction de son niveau d&rsquo;implication dans une comp\u00e9tence particuli\u00e8re. Par exemple, un probl\u00e8me math\u00e9matique simple peut obtenir un score de connaissances formelles de 1, tandis qu&rsquo;un probl\u00e8me math\u00e9matique exigeant une expertise avanc\u00e9e peut obtenir un score de 5. La figure 1 illustre le processus complet, de l&rsquo;\u00e9valuation des exigences des t\u00e2ches \u00e0 la g\u00e9n\u00e9ration d&rsquo;un profil de comp\u00e9tences. Pour d\u00e9velopper le syst\u00e8me, l&rsquo;\u00e9quipe a analys\u00e9 16 000 exemples de 63 t\u00e2ches issues de 20 benchmarks d&rsquo;IA afin de cr\u00e9er une m\u00e9thode de mesure unifi\u00e9e applicable \u00e0 un large \u00e9ventail de t\u00e2ches. L&rsquo;article d\u00e9taille comment les scores des 18 \u00e9chelles universelles expliquent la r\u00e9ussite ou l&rsquo;\u00e9chec d&rsquo;un mod\u00e8le et comment ils pr\u00e9disent la performance lors de l&rsquo;ex\u00e9cution de nouvelles t\u00e2ches dans des environnements familiers et inconnus.<\/p>\n\n\n\n<p>R\u00e9sultats de l&rsquo;\u00e9valuation<\/p>\n\n\n\n<p>L&rsquo;\u00e9quipe a utilis\u00e9 ADeLe pour \u00e9valuer 20 benchmarks d&rsquo;IA populaires et est arriv\u00e9e \u00e0 trois conclusions principales : 1) Les benchmarks d&rsquo;IA actuels pr\u00e9sentent des limites de mesure ; 2) Les mod\u00e8les d&rsquo;IA pr\u00e9sentent des sch\u00e9mas diff\u00e9rents de forces et de faiblesses selon les capacit\u00e9s ; 3) ADeLe peut pr\u00e9dire avec pr\u00e9cision la r\u00e9ussite ou l&rsquo;\u00e9chec des syst\u00e8mes d&rsquo;IA dans de nouvelles t\u00e2ches.<\/p>\n\n\n\n<p>1. D\u00e9tecter les failles cach\u00e9es des m\u00e9thodes de test d&rsquo;IA<\/p>\n\n\n\n<p>De nombreux tests d&rsquo;IA populaires ne mesurent pas les indicateurs qu&rsquo;ils pr\u00e9tendent mesurer ou ne couvrent qu&rsquo;une difficult\u00e9 limit\u00e9e. Par exemple, le benchmark de l&rsquo;examen de la fonction publique est con\u00e7u pour tester la capacit\u00e9 de raisonnement logique, mais il requiert \u00e9galement d&rsquo;autres comp\u00e9tences telles que l&rsquo;expertise et la m\u00e9tacognition. De m\u00eame, TimeQA, con\u00e7u pour tester la capacit\u00e9 de raisonnement temporel, ne contient que des questions de difficult\u00e9 moyenne, sans d\u00e9fis simples ou complexes.<\/p>\n\n\n\n<p>2. Cr\u00e9er des profils d\u00e9taill\u00e9s de comp\u00e9tences en IA<\/p>\n\n\n\n<p>L&rsquo;\u00e9quipe a cr\u00e9\u00e9 des profils complets pour 15 programmes de Master en droit (LLM) \u00e0 l&rsquo;aide d&rsquo;une \u00e9chelle de notation de 0 \u00e0 5 points. Pour ces 18 comp\u00e9tences, elle a trac\u00e9 une \u00ab courbe caract\u00e9ristique du sujet \u00bb afin de montrer l&rsquo;\u00e9volution du taux de r\u00e9ussite du mod\u00e8le en fonction de la difficult\u00e9 des t\u00e2ches.<\/p>\n\n\n\n<p>Elle a ensuite calcul\u00e9 le score de chaque comp\u00e9tence (le niveau de difficult\u00e9 auquel le mod\u00e8le a r\u00e9ussi \u00e0 50 %) et a utilis\u00e9 ces r\u00e9sultats pour g\u00e9n\u00e9rer des graphiques radiaux montrant les forces et les faiblesses de chaque mod\u00e8le \u00e0 diff\u00e9rentes \u00e9chelles et niveaux, comme illustr\u00e9 \u00e0 la figure 2. 3. Pr\u00e9dire la r\u00e9ussite et l&rsquo;\u00e9chec de l&rsquo;IA<\/p>\n\n\n\n<p>Le syst\u00e8me a atteint une pr\u00e9cision d&rsquo;environ 88 % dans la pr\u00e9diction des performances de mod\u00e8les populaires tels que GPT-4o et LLaMA-3.1-405B, surpassant ainsi les m\u00e9thodes traditionnelles. Cela permet de pr\u00e9dire les \u00e9checs potentiels avant le d\u00e9ploiement, ajoutant une \u00e9tape importante \u00e0 l&rsquo;\u00e9valuation de la fiabilit\u00e9 des mod\u00e8les d&rsquo;IA.<\/p>\n\n\n\n<p>Perspectives d&rsquo;avenir<\/p>\n\n\n\n<p>ADeLe peut \u00eatre \u00e9tendu aux syst\u00e8mes d&rsquo;IA multimodaux et int\u00e9gr\u00e9s et a le potentiel de devenir un cadre standardis\u00e9 pour la recherche en IA, l&rsquo;\u00e9laboration de politiques et l&rsquo;audit de s\u00e9curit\u00e9.<\/p>\n\n\n\n<p>Dans un contexte o\u00f9 les progr\u00e8s de l&rsquo;intelligence artificielle g\u00e9n\u00e9rale d\u00e9passent les m\u00e9thodes d&rsquo;\u00e9valuation traditionnelles, ces travaux posent des bases opportunes pour am\u00e9liorer l&rsquo;efficacit\u00e9 de l&rsquo;\u00e9valuation de l&rsquo;IA.<\/p>\n\n\n\n<p><strong><u><a href=\"https:\/\/www.grossiste-batteries.com\/fr\/category\/camera\/6\" target=\"_blank\" rel=\"noreferrer noopener\">\u00ab\u00a0Trouvez la batterie de rechange pour votre telephone ou votre ordinateur portable, achetez votre batterie de rechange en ligne. Grossiste-batteries.com sp\u00e9cialis\u00e9e dans la vente de batteries et de chargeurs pour ordinateurs portables, tablettes, t\u00e9l\u00e9phones&#8230; Livraison Rapide, Garantie 1an!\u00a0\u00bb<\/a><\/u><\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Avec le soutien du programme de subventions Accelerating Foundational Model Research (AFMR), une \u00e9quipe de chercheurs de Microsoft et de ses institutions partenaires a d\u00e9velopp\u00e9 une m\u00e9thode d&rsquo;\u00e9valuation des mod\u00e8les d&rsquo;IA capable de pr\u00e9dire et d&rsquo;expliquer leurs faibles performances sur des t\u00e2ches sp\u00e9cifiques, ce que les benchmarks actuels peinent \u00e0 faire. Dans un article intitul\u00e9 [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"zakra_sidebar_layout":"customizer","zakra_remove_content_margin":false,"zakra_sidebar":"customizer","zakra_transparent_header":"customizer","zakra_logo":0,"zakra_main_header_style":"default","zakra_menu_item_color":"","zakra_menu_item_hover_color":"","zakra_menu_item_active_color":"","zakra_menu_active_style":"zakra_menu_active_style","zakra_page_header":true,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1410","post","type-post","status-publish","format-standard","hentry","category-nouvelles"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v23.7 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Pr\u00e9dire et expliquer les performances des mod\u00e8les d&#039;intelligence artificielle : une nouvelle approche d&#039;\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410\" \/>\n<meta property=\"og:locale\" content=\"fr_FR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Pr\u00e9dire et expliquer les performances des mod\u00e8les d&#039;intelligence artificielle : une nouvelle approche d&#039;\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs\" \/>\n<meta property=\"og:description\" content=\"Avec le soutien du programme de subventions Accelerating Foundational Model Research (AFMR), une \u00e9quipe de chercheurs de Microsoft et de ses institutions partenaires a d\u00e9velopp\u00e9 une m\u00e9thode d&rsquo;\u00e9valuation des mod\u00e8les d&rsquo;IA capable de pr\u00e9dire et d&rsquo;expliquer leurs faibles performances sur des t\u00e2ches sp\u00e9cifiques, ce que les benchmarks actuels peinent \u00e0 faire. Dans un article intitul\u00e9 [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410\" \/>\n<meta property=\"og:site_name\" content=\"grossiste-batteries.com: batteries et adaptateurs\" \/>\n<meta property=\"article:published_time\" content=\"2025-06-14T04:15:40+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-06-14T04:15:41+00:00\" \/>\n<meta name=\"author\" content=\"bella\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"\u00c9crit par\" \/>\n\t<meta name=\"twitter:data1\" content=\"bella\" \/>\n\t<meta name=\"twitter:label2\" content=\"Dur\u00e9e de lecture estim\u00e9e\" \/>\n\t<meta name=\"twitter:data2\" content=\"5 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410\",\"url\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410\",\"name\":\"Pr\u00e9dire et expliquer les performances des mod\u00e8les d'intelligence artificielle : une nouvelle approche d'\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs\",\"isPartOf\":{\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/#website\"},\"datePublished\":\"2025-06-14T04:15:40+00:00\",\"dateModified\":\"2025-06-14T04:15:41+00:00\",\"author\":{\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/efe110de25e332fb734b54d4559503eb\"},\"breadcrumb\":{\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410#breadcrumb\"},\"inLanguage\":\"fr-FR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Accueil\",\"item\":\"https:\/\/grossiste-batteries.com\/fr\/blog\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Pr\u00e9dire et expliquer les performances des mod\u00e8les d&rsquo;intelligence artificielle : une nouvelle approche d&rsquo;\u00e9valuation\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/#website\",\"url\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/\",\"name\":\"grossiste-batteries.com: batteries et adaptateurs\",\"description\":\"grossiste-batteries.com: batteries et adaptateurs\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"fr-FR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/efe110de25e332fb734b54d4559503eb\",\"name\":\"bella\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"fr-FR\",\"@id\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/bebf3096a51ce7e2123b6e0fc60d24a5e67ee865894d2a376f0cd59eb487b2fa?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/bebf3096a51ce7e2123b6e0fc60d24a5e67ee865894d2a376f0cd59eb487b2fa?s=96&d=mm&r=g\",\"caption\":\"bella\"},\"sameAs\":[\"https:\/\/grossiste-batteries.com\/fr\/blog\"],\"url\":\"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/author\/bella\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Pr\u00e9dire et expliquer les performances des mod\u00e8les d'intelligence artificielle : une nouvelle approche d'\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410","og_locale":"fr_FR","og_type":"article","og_title":"Pr\u00e9dire et expliquer les performances des mod\u00e8les d'intelligence artificielle : une nouvelle approche d'\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs","og_description":"Avec le soutien du programme de subventions Accelerating Foundational Model Research (AFMR), une \u00e9quipe de chercheurs de Microsoft et de ses institutions partenaires a d\u00e9velopp\u00e9 une m\u00e9thode d&rsquo;\u00e9valuation des mod\u00e8les d&rsquo;IA capable de pr\u00e9dire et d&rsquo;expliquer leurs faibles performances sur des t\u00e2ches sp\u00e9cifiques, ce que les benchmarks actuels peinent \u00e0 faire. Dans un article intitul\u00e9 [&hellip;]","og_url":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410","og_site_name":"grossiste-batteries.com: batteries et adaptateurs","article_published_time":"2025-06-14T04:15:40+00:00","article_modified_time":"2025-06-14T04:15:41+00:00","author":"bella","twitter_card":"summary_large_image","twitter_misc":{"\u00c9crit par":"bella","Dur\u00e9e de lecture estim\u00e9e":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410","url":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410","name":"Pr\u00e9dire et expliquer les performances des mod\u00e8les d'intelligence artificielle : une nouvelle approche d'\u00e9valuation - grossiste-batteries.com: batteries et adaptateurs","isPartOf":{"@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/#website"},"datePublished":"2025-06-14T04:15:40+00:00","dateModified":"2025-06-14T04:15:41+00:00","author":{"@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/efe110de25e332fb734b54d4559503eb"},"breadcrumb":{"@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410#breadcrumb"},"inLanguage":"fr-FR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/1410#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Accueil","item":"https:\/\/grossiste-batteries.com\/fr\/blog"},{"@type":"ListItem","position":2,"name":"Pr\u00e9dire et expliquer les performances des mod\u00e8les d&rsquo;intelligence artificielle : une nouvelle approche d&rsquo;\u00e9valuation"}]},{"@type":"WebSite","@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/#website","url":"https:\/\/grossiste-batteries.com\/fr\/blog\/","name":"grossiste-batteries.com: batteries et adaptateurs","description":"grossiste-batteries.com: batteries et adaptateurs","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/grossiste-batteries.com\/fr\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"fr-FR"},{"@type":"Person","@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/efe110de25e332fb734b54d4559503eb","name":"bella","image":{"@type":"ImageObject","inLanguage":"fr-FR","@id":"https:\/\/grossiste-batteries.com\/fr\/blog\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/bebf3096a51ce7e2123b6e0fc60d24a5e67ee865894d2a376f0cd59eb487b2fa?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/bebf3096a51ce7e2123b6e0fc60d24a5e67ee865894d2a376f0cd59eb487b2fa?s=96&d=mm&r=g","caption":"bella"},"sameAs":["https:\/\/grossiste-batteries.com\/fr\/blog"],"url":"https:\/\/grossiste-batteries.com\/fr\/blog\/archives\/author\/bella"}]}},"_links":{"self":[{"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/posts\/1410","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/comments?post=1410"}],"version-history":[{"count":1,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/posts\/1410\/revisions"}],"predecessor-version":[{"id":1411,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/posts\/1410\/revisions\/1411"}],"wp:attachment":[{"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/media?parent=1410"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/categories?post=1410"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/grossiste-batteries.com\/fr\/blog\/wp-json\/wp\/v2\/tags?post=1410"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}