Ce qu’il faut vraiment pour intégrer l’IA à PowerPoint
- Page d'accueil
- Ressources
- Plateforme de contenus
- Ce qu’il faut vraiment pour intégrer l’IA à PowerPoint
5 lecture min — Alexander von Fritsch
On a beaucoup écrit sur ce que l’IA peut faire. On a moins écrit sur ce qui lui manque aujourd’hui, et sur les raisons pour lesquelles l’écart entre ce dont les utilisateurs ont besoin et ce que la technologie leur offre compte davantage que ne le laisse penser l’engouement.
Les diapositives PowerPoint sont l’un de ces cas où la technologie ne correspond pas aux besoins des utilisateurs avancés. Ceux qui s’appuient le plus sur PowerPoint ne sont pas des utilisateurs occasionnels à la recherche de solutions rapides et faciles. Ils entrent dans des salles où la qualité de leurs diapositives influence directement les décisions qui seront prises.
Pour eux, « suffisamment bien » ne suffit pas.
Le problème, avec l’utilisation de l’IA générative pour créer des présentations de tout premier plan, c’est que c’est réellement plus difficile qu’il n’y paraît, et que la barre de ce que signifie vraiment « résolu » est bien plus haute que ce que la plupart des personnes qui écrivent sur ce sujet semblent comprendre.
Dans cet article de blog, je souhaite examiner les obstacles techniques qui font des diapositives un problème difficile pour l’IA, ce dont les utilisateurs de PowerPoint les plus exigeants ont réellement besoin aujourd’hui, et là où je pense que se situe la véritable opportunité.
Obstacles techniques
Les diapositives sont multimodales
Les grands modèles de langage sont entraînés sur du texte et excellent dans son traitement. Mais une diapositive ne se résume pas au texte. Une diapositive est un objet multimodal, composé de texte, d’images et de données, agencés dans un espace bidimensionnel où les éléments individuels comme leur mise en page véhiculent du sens.
La position d’un encadré d’annotation par rapport à un graphique compte. La taille d’une étiquette par rapport aux données qu’elle décrit compte. Le fait que l’œil passe naturellement du titre de la diapositive au graphique compte.
Les LLM n’ont pas encore développé une capacité fiable et cohérente de raisonnement spatial et visuel. Ils peuvent traiter des descriptions textuelles d’une mise en page et générer des images à partir d’invites textuelles, mais comprendre comment les éléments visuels fonctionnent ensemble reste un défi majeur.
Probabiliste vs déterministe
Les LLM sont probabilistes. Ils prédisent la sortie la plus probable à partir des motifs présents dans leurs données d’entraînement. Les résultats peuvent donc être incohérents, et les sorties sont souvent globalement correctes la plupart du temps, mais pas toujours exactement correctes à chaque fois.
Certes, pour certaines tâches, « globalement correct » suffit. Mais pas pour des diapositives professionnelles.
Le travail sur les diapositives est déterministe : il exige donc cohérence et reproductibilité. Un premier jet doit être suffisamment abouti pour que l’utilisateur peaufine les diapositives, plutôt que de les reconstruire.
Une seule incohérence de mise en forme implique une modification. Des incohérences qui réapparaissent sans cesse créent davantage de travail pour l’utilisateur.
Lorsque vous présentez devant un conseil d’administration ou un client senior, le résultat dépend de la clarté, de l’exactitude et de la crédibilité de vos diapositives. Si un LLM ne peut pas maintenir des standards cohérents dans l’ensemble d’une présentation, alors il n’est pas prêt pour cette salle.
Manque de données d’entraînement
Les connaissances humaines existent sous forme de texte, auquel les LLM peuvent accéder pour s’entraîner. Pour les images, il existe aussi un énorme vivier de données d’entraînement.
Il n’existe rien de comparable pour les diapositives. Les données de diapositives de haute qualité ne sont tout simplement pas disponibles en ligne. Personne n’étiquette systématiquement les bonnes diapositives par rapport aux mauvaises pour alimenter un modèle d’entraînement. Des descriptions textuelles de ce à quoi devrait ressembler une bonne diapositive ne suffiront pas non plus, car le texte ne fournit pas à un LLM le même niveau d’information que l’apprentissage à partir des diapositives elles-mêmes.
À moins que cela ne change, les sorties d’IA pour la création de diapositives qui s’appuient sur l’étendue et la qualité actuelles des données d’entraînement continueront de passer à côté, d’une manière immédiatement évidente pour quiconque travaille professionnellement avec des diapositives.
Les exigences des utilisateurs de diapositives d’aujourd’hui
Exactitude et fiabilité
Les utilisateurs de PowerPoint du plus haut niveau, comme les consultants en management, les banquiers d’investissement et les équipes stratégie, ne peuvent pas se permettre des sorties peu fiables. Vous ne pouvez pas entrer en réunion de conseil avec de mauvais chiffres. Cela pourrait vous coûter votre carrière — et cela vous coûtera assurément votre carrière si vous accusez l’IA.
Tout ce que l’IA fait dans ce domaine doit être exact et fiable à chaque fois, pas seulement la plupart du temps.
Lisibilité
Les diapositives professionnelles existent pour transmettre un message, partager des informations et soutenir la prise de décision, souvent dans des réunions à forts enjeux où le temps est compté et l’attention limitée.
Elles doivent répondre à des exigences visuelles élevées, et pas seulement contenir un contenu correct.
Cela paraît si simple, mais en pratique, c’est là que les outils d’IA actuels échouent. Les utilisateurs avancés travaillent dans des contextes où la qualité d’une diapositive influence directement les décisions prises dans la salle. La barre est haute, et la génération actuelle d’outils d’IA ne la franchit pas.
Aujourd’hui, même les meilleures diapositives générées par IA ont tendance à ne pas atteindre ce qu’un consultant expérimenté jugerait acceptable. Et il faudra plus qu’une invite « pls fix » pour remettre tout cela au propre.
Productivité
Une solution d’IA pour PowerPoint doit s’intégrer aux flux de travail existants des utilisateurs, et non s’ajouter à côté. Copier-coller depuis ChatGPT vers PowerPoint, puis revenir en arrière, c’est une solution de contournement, pas une solution.
Il ne s’agit pas seulement de gagner du temps. Il s’agit de réduire la charge cognitive liée au passage d’un outil à l’autre, de maintenir un niveau professionnel d’exactitude et de cohérence, et de libérer de l’espace mental pour la réflexion stratégique qu’aucune IA ne peut faire à votre place.
Une solution qui ajoute des étapes, laisse passer des erreurs ou casse la concentration n’est pas productive, aussi impressionnante que soit la technologie sous-jacente.
L’opportunité
Malgré les défis, l’IA générative a indéniablement du potentiel pour soutenir le flux de travail de la présentation. Elle est efficace pour générer des insights, élaborer des storyboards, rédiger et affiner des textes, et aider les utilisateurs à réfléchir à la structure d’un argumentaire. Ce sont de réelles capacités qui peuvent produire un impact réel.
L’opportunité se présentera à celui qui saura combiner ces atouts avec ce avec quoi l’IA peine encore : l’exactitude, la précision visuelle et une intégration profonde dans les outils professionnels.
Cela exigera une combinaison rare : de solides capacités en IA et une compréhension profonde, éprouvée, de ce dont les utilisateurs de PowerPoint les plus exigeants ont besoin.
Conclusion
L’IA va changer notre façon de travailler avec PowerPoint. Ce n’est pas une prédiction qui mérite débat. La question la plus intéressante à laquelle je reviens est de savoir si les outils en cours de développement répondront aux standards des personnes qui accordent le plus de valeur à la qualité des diapositives : les utilisateurs de PowerPoint du plus haut niveau.
Pour eux, un jeu de diapositives est autant une déclaration professionnelle qu’un livrable. Et à mesure que l’IA rendra plus rapide et plus facile la création d’une présentation pour n’importe qui, c’est l’attention portée aux détails qui permettra aux utilisateurs avancés de continuer à se démarquer. Mais ils n’auront aucune chance sans des gains de productivité comparables.
Chez think-cell, cela fait 25 ans que nous nous concentrons sur la qualité et la productivité pour des utilisateurs qui refusent de faire des compromis sur l’une comme sur l’autre. Ce que nous construisons ensuite s’appuie sur ce même socle. Et je pense que cela vaudra la peine d’attendre.
Explorez ce sujet plus en détail avec l’IA:
Découvrez plus de 70 modèles de diapositives PowerPoint conçus pour vous aider à créer rapidement des présentations professionnelles courantes.