Regards croisés sur GPT-4 : Yeca, Louis Bazile et Jessy SEO

Nous vous proposons cette excellente contribution de Abondance

Interview des experts Yannick Bouvard (Yeca), Louis Bazile et Laurent Jean (Jessy SEO).

Réponses obtenues entre le 17 et le 22 mars 2023.

Le 14 mars, GPT 4 a été dévoilé avec un peu d’avance. De nombreux utilisateurs – et SEO – se sont précipités dessus pour le tester et vérifier s’il tenait toutes ses promesses. La réponse : oui ! Nous avons interrogé Louis Bazile, Laurent Jean et Yannick Bouvard sur leur utilisation de GPT-4. Globalement, les experts sont unanimes : l’intelligence artificielle propose des réponses plus qualitatives, avec un meilleur raisonnement et en étant davantage créative.

Les 6 points à retenir

  • Les contenus de GPT 4 sont plus efficaces et de meilleure qualité avec un travail de réécriture moindre
  • GPT 4 est capable de résoudre des problématiques mathématiques plus complexes
  • L’augmentation du nombre de mots de contexte permet de fournir des prompts plus détaillés et donc, d’obtenir des réponses plus complètes et précises
  • Les prompts à base d’image seront pratiques pour créer du meilleur contenu et, d’ici peu, générer des attributs alt de façon automatique
  • Même si les réponses sont plus crédibles, il est important de repasser derrière avec un oeil humain pour s’assurer que la réponse est juste et cohérente
  • Le métier de SEO va évoluer en collaboration avec l’IA, car l’expertise humaine restera nécessaire sur de nombreux sujets

Globalement, quelles sont les différences que vous avez constaté entre GPT 3.5 et GPT 4, pour le moment ? Est-il vraiment plus fiable ?

Laurent J. – Tout d’abord, il y a 3 façons de pouvoir utiliser GPT4 : avoir ChatGPT Plus, utiliser Bing Chat ou être dans la Waitlist. L’accès API n’a été débloqué qu’hier (16 mars) aux alentours de 18h. Je le teste depuis le lancement via ChatGPT et il y a une très bonne avancée dans le contenu produit.

On ne note pas de différences sur certains prompts, mais les contenus me semblent un peu plus qualitatifs. Certaines expressions, certaines tournures de phrases permettaient de détecter que le contenu était généré par une IA, là c’est moins le cas.

Louis B. – La principale différence est une nette montée en qualité dans le niveau de langage et l’efficacité des réponses proposées. L’intention de recherche est toujours aussi bien comprise mais j’observe une nette progression sur la qualité de la réponse : plus pédagogique, une pertinence beaucoup plus fine avec des exemples, vulgarisations ou élaborations mieux choisies.

GPT3 avait tendance à faire beaucoup plus de répétition de prépositions ou dans des énumérations de listes à puces (il titrait chaque élément de la liste et répétait le titre juste après dans une phrase explicative). De même, l’ancien modèle montrait trop souvent dans ses tournures de phrases qu’il était plus performant en anglais. J’avais tendance à traduire les générations. C’est de moins en moins le cas.

Sur mes nombreuses utilisations depuis une semaine via ChatGPT, j’ai beaucoup moins de travail de réécriture à faire sur les résultats proposés. Il devient plus difficile de distinguer ses réponses de celles d’un humain.

En revanche, la nouvelle version est plus lente et les générations s’arrêtent plus souvent en milieu de réponse. Cela le rend moins utilisable en automatisation mais ce n’est qu’une question de temps avant que les performances s’améliorent.

Yannick B. – Mon étude comparative de GPT 3.5 et de GPT 4 s’est principalement concentrée sur des besoins et des usages pour le SEO. Le bilan global est qu’il y a quand même un vrai gain de qualité en termes de réponses de la part de GPT-4, mais que l’essentiel semble résider dans la capacité à comprendre les instructions et donc ensuite à les appliquer. Ainsi, pour des prompts simples, on ne verra pas forcément beaucoup de différences. Le vrai gain se fera avec des prompts élaborés. Fini donc de jouer vite fait avec GPT, il va falloir bien travailler ses prompts.

Parmi les 3 nouveautés majeures, OpenAI a annoncé la créativité (réponse aux besoins créatifs comme composition musicale, écriture de scénario ou ton d’un auteur), le format (prompt à base d’image) et le contexte (plus de 25 000 mots générés). Pour ces 3 nouveautés, quels sont vos constats par rapport à GPT 3.5 et laquelle est la mieux réussie selon vous ?

Laurent J. – Ce qui a été introduit dans GPT4, c’est la capacité à avoir plus de « raisonnement ». Par exemple, lorsque l’on posait des problèmes à GPT3 qui semblaient triviaux même pour un enfant, il n’était parfois pas capable de donner la bonne réponse. Par exemple : si on lui demandait si un œuf de cheval était plus gros qu’un œuf de poule, il répondait oui. Alors que GPT4 va indiquer que les chevaux ne pondent pas d’œufs.

J’ai fait un test avec des problèmes mathématiques à partir d’un site qui produit tous les mois de nouveaux problèmes depuis 15 ans (Diophante) et GPT4 a réussi à résoudre les problèmes soumis.

En tout cas, les démos d’Open AI sont bluffantes. Un de leurs exemples est une application pour aider les déficients visuels : Be my eyes. Elle permet de prendre une photo et l’IA décrit l’image. C’est une vraie avancée car cela peut aider les aveugles à avoir des informations sur l’endroit où ils sont, si on la monte sur des lunettes avec un moteur vocal. Dans un cadre SEO, cela aide à l’accessibilité, un des critères phares de Google. Levez la main ceux qui renseignent leurs images avec des informations factuelles au lieu de bourrer les « alt » de mots-clés !

En ce qui concerne la possibilité de rajouter beaucoup plus de contexte (8000 tokens pour la version API de GPT4), c’était un point négatif de la version GPT3 car il ne suivait pas forcément les instructions qu’on lui donnait, alors que ChatGPT qui combine GPT3 + Instruct GPT permettait de lui donner des instructions de contexte avant qu’il n’écrive un texte.

Avec GPT4 on peut donner beaucoup plus de contexte, et cela réduit l’effet d’ « hallucination ». Si je vous donne une fausse information en disant que GPT4 est 100 fois plus gros que GPT3, vous allez extrapoler en disant que GPT4 est 100 fois plus intelligent. GPT3 et GPT4 vont faire la même chose, ils vont inventer. Donnez-lui des informations factuelles, et là il orientera le contenu pour qu’il soit plausible, donnez-lui beaucoup plus de contexte, il écrira un meilleur contenu en utilisant ces informations. On repassera toujours pour vérifier qu’il n’a pas eu d’hallucination et pour faire des optimisations SEO, mais globalement en terme de qualité pour l’utilisateur on sera bon, avec le prompt adapté 😉.

Louis B. – La créativité s’inscrit dans la continuité de l’effet « whaou » que m’avait inspiré GPT 3.5. Les générations sont beaucoup plus efficaces et ça me laisse penser qu’on va tendre vers une montée en qualité rapide sur ce point sur les prochaines mises à jour.

L’augmentation du nombre de mots de contexte permet d’avoir une belle montée en puissance pour produire des contenus à partir de prompts très détaillés en le faisant travailler étape par étape, de l’analyse de l’intention de recherche à une page complète en passant par l’enrichissement du contenu et la définition d’un plan pertinent.

J’ai peu utilisé la détection d’images dans mes tests.

Yannick B. – Je n’ai pas fait de tests sur des aspects purement créatifs, mais même lorsque la demande est axée sur la stratégie, GPT-4 est effectivement plus créatif que le modèle précédent. Là où GPT 3.5 avait une tendance à répondre sur de la théorie, l’aspect créatif de GPT-4 lui permet d’aborder des notions plus pratiques et de proposer des choses plus concrètes. Je n’ai pas encore testé les résultats sur les deux autres aspects.

Dans votre utilisation, qu’est-ce que la compréhension des images change ? Quelles sont les nouvelles possibilités ?

Laurent J. – D’un point de vue SEO, si on travaille pour un site de voyage, la difficulté est de trouver le bon contenu et d’illustrer le discours. Là on peut faire l’inverse : avoir une photo factuelle (pas généré par de l’IA pour de vrais lieux) et demander à GPT 4 de décrire l’image. Cela permet d’écrire de meilleurs contenus en contextualisant avec l’image. Dans le cadre de l’évolution de Google qui permet de trouver des informations à partir d’une photo, il y a sûrement une optimisation qui va se faire naturellement lors du déploiement de MuM (Multitask Unified Model, le nouvel algorithme de Google).

Louis B. – Je m’attends à voir cette fonctionnalité utilisée rapidement pour avoir des solutions de génération d’attributs alternatifs automatisées. Dans un avenir proche, cela sera probablement intégré nativement dans Google avec le moteur qui n’a plus besoin d’alt pour analyser les images dans le cas où ils arrivent à en optimiser le coût. Cela donne également des idées pour enrichir le contenu d’une page en décrivant une image en détail ou pour générer des fiches produits à partir des packshots.

Avec une meilleure qualité linguistique et contextuelle, est-ce que les réponses apportées par GPT 4 vont commencer à se confondre avec des réponses humaines ? Y aura-t-il encore besoin de repasser derrière ?

Laurent J. – On s’aperçoit qu’il y a une évolution en français. C’est également le cas dans toutes les langues, donc un contenu anglais, espagnol ou même breton ont dû gagner en qualité. Google sera capable de donner à l’utilisateur une réponse dans sa langue à partir d’une information créée dans une autre. Probablement que le contenu pourra être estampillé comme dupliqué, et qu’avec la possibilité d’écrire dans une autre langue, on peut créer des contenus beaucoup plus orientés utilisateur en visant d’autres mots-clés qui ne sont pas les mêmes sur un autre marché. D’ailleurs, j’ai réservé le nom de domaine https://ai.bzh où je vais mettre un traducteur breton-français. Un clin d’oeil à Olivier Andrieu et ses Astérix 😉

Louis B. – Cela dépend des thématiques, notamment sur les sujets plus experts mais d’une façon générale, oui. Avec GPT 3.5, un œil averti reconnaissait facilement les structures de textes et de phrases issues de l’outil. C’est encore le cas sur de nombreuses réponses mais de façon beaucoup plus fine. En travaillant bien ses prompts, on arrive à des résultats très crédibles.

Yannick B. – La question n’est pas de savoir s’il y a besoin mais simplement de considérer si c’est réellement souhaitable de ne pas avoir besoin de repasser derrière. Quoi qu’il advienne, on se doit de considérer l’IA comme un stagiaire super doué. Il peut être souvent très efficace, rapide, perspicace et très bien formé, il reste nécessaire de considérer qu’il est en apprentissage et qu’il a de nombreuses raisons et chances de se tromper. On ne peut pas laisser une IA représenter l’image d’une entreprise. On a toujours besoin de vérifier si la réponse est juste, cohérente et efficace par rapport à la demande initiale.

OpenAI a engagé 50 experts pour évaluer les nouveaux dangers cyber, la génération de conseils dangereux, les mauvais codes informatiques, les fake news, etc. Quelles sont vos remarques à ce sujet ? Est-ce que GPT 4 refuse vraiment les requêtes “dangereuses” (82% de moins comme l’indique OpenAI), ou est-il encore possible de l’utiliser à mauvais escient ?

Laurent J. – Le principe d’un hack, c’est souvent de se dire qu’il y a des attaques sophistiquées, mais la plupart des hack se font en low tech. Donc oui, GPT4 va avoir des mots-clés déclencheur pour activer le red flag et la plupart du temps il va se déclencher, avec des requêtes comme « fabriquer une bombe » ou “créer un code pour hacker une banque”. Cela pourra toujours être contourné. Ce genre d’informations, les gens malveillants iront les chercher ailleurs.

  • Exemples de prompts :
Demander de hacker un PC et le crypter
Demander de protéger mon PC en le cryptant à distance

Louis B. – GPT 4 a toujours de nombreuses réponses qui commencent par « en tant qu’intelligence artificielle… » dès qu’on lui demande de réaliser des tâches dans des thématiques bridées. En revanche, il est est tout à fait possible de lui faire raconter des grosses âneries (quand ce n’est pas l’outil qui se trompe) tant qu’on évolue pas dans ces sujets « bannis ». L’outil utilise un ton si assuré qu’il est facile de le détourner pour générer des fake news.

Yannick B. – Comme de nombreux aspects d’une IA, l’entraînement est une part essentielle de l’efficacité d’un modèle et donc de sa crédibilité. C’est évidemment un enjeu majeur pour son utilisation dans le futur. OpenAI a bien raison de mettre beaucoup d’efforts là-dessus et devrait effectivement pouvoir obtenir des résultats probants rapidement. Cela dit, si atteindre 82% semble réaliste à court terme, les efforts pour faire disparaître chaque pourcent de plus seront de plus en plus compliqués à obtenir étant donné la complexité des langues et la difficulté de vérifier la véracité des informations.

Selon vous, comment vos métiers vont-ils évoluer ? Au service de l’IA, ou en collaboration avec l’IA ?

Laurent J. – Il va y avoir un gros changement et des impacts sur la société, surtout au niveau de ce que va indexer Google. Mais est-ce que Google continuera d’être utilisé pour de la recherche textuelle ? Rien n’est moins sûr !

Cela devrait aussi changer la manière dont les utilisateurs vont appréhender ces outils, intégrés directement dans les outils de production (comme dans la suite office). Si vous avez un site qui explique les fonctionnalités Excel, ou les problèmes Excel, et que l’assistant vous donne directement l’information sans sortir d’Excel, est-ce que vous irez encore chercher l’information sur des sites ?

Louis B. – Le SEO va évoluer en collaboration avec l’IA. Les moteurs de recherche ont besoin de production humaine (identification d’entreprises locales, production d’informations inédites sur l’actualité ou les innovations). A moyen terme, je m’attends à voir arriver une génération d’outils permettant d’affiner les analyses et les prises de décisions et faciliter de nombreuses tâches, à commencer par la production de contenu. On peut déjà s’en servir pour aider à définir une structure de site web optimisé par exemple. L’expertise humaine reste toujours nécessaire sur la plupart des sujets cependant, a minima pour piloter et contrôler l’outil. La prochaine évolution majeure que j’anticipe est l’intégration d’une importante part de ces technologies dans les classements et réponses des moteurs de recherche.

Yannick B. – Beaucoup de nos métiers vont évoluer avec l’IA, de la même manière qu’ils ont évolué avec l’informatique puis avec internet. Lors de l’arrivée de ces deux autres révolutions, on s’est posé les mêmes questions. Certains métiers ont disparu, d’autres ont fortement évolué, certains moins et les derniers d’une manière indirecte seulement.

Nos métiers vont évoluer parce qu’on va pouvoir être plus efficaces et plus rapides, exactement comme on a pu gagner en productivité avec l’arrivée de l’informatique et d’internet.

Quelle est LA fonctionnalité phare que vous retenez, et que vous utilisez quotidiennement ?

Laurent J. – Le prompt « continue » 😉. La plupart des gens pensent que lorsque Chatgpt ne finit pas une phrase, il faut cliquer sur « regénérer une réponse », alors que lui dire simplement « continue » lui permet de reprendre à l’endroit où il s’est arrêté.

Louis B. – La génération de contenu, en particulier pour accélérer le travail de recherche. Je la complète avec des suggestions de pages secondaires pour enrichir rapidement un silo.

Yannick B. – Difficile d’avoir un tel retour d’expérience après aussi peu de temps à tester GPT-4, mais la capacité qu’a ce modèle à pouvoir donner des idées de départ lorsqu’on a un besoin est impressionnante. En SEO, pouvoir rapidement identifier des idées de contenu et comment le construire va clairement devenir indispensable, avec le bonus de pouvoir rédiger un brief de rédaction à envoyer à un rédacteur humain. Les fonctionnalités de création de code sont impressionnantes et beaucoup de non codeurs vont pouvoir résoudre des problèmes ponctuels rapidement avec ces solutions.

Quelles sont les améliorations que vous attendez dans les prochaines versions ?

Laurent J. – Je n’ai pas encore digéré ce que propose GPT 4 tellement les idées fusent. Peut-être l’intégration native de Dall-E pour pouvoir créer les contenus et les images.

Louis B. – Plus de vitesse et de performance et une créativité encore en hausse. Des fonctionnalités natives pour piloter les prompts (choisir le ton, l’identité de l’auteur et de la cible, le format de la réponse…). Des outils tiers spécialisés dans différents corps de métiers (assistants comptables, génération de textes juridiques…).

Yannick B. – Sur les IA générant du texte, une amélioration des capacités à analyser la demande sera sans doute encore une avancée supplémentaire. Mais nous ne sommes qu’à l’aube de cette tendance, et ce qui sera surtout une révolution ce sera lorsque les IA seront performantes en vidéo par exemple. Imaginez un peu dans quelques années que Netflix puisse proposer une série rien que pour vous, générée automatiquement en fonction de vos goûts, de vos acteurs et actrices préférés, de votre style d’humour et pourquoi pas même, en fonction de votre humeur du jour…

Retrouvez les 3 experts sur leurs sites :

Laurent Jean sur Copywriting AI

Yannick Bouvard sur My SEO Coach

Louis Bazile

Voir aussi

Copy link
Powered by Social Snap