Comment utiliser l’IA pour faire des choses pratiques : Un nouveau guide
Traduction via deepl de l’article en anglais de Ethan Mollick pour https://oneusefulthing.substack.com
Nous vivons à l’ère de l’IA pratique, mais de nombreuses personnes n’en ont pas encore fait l’expérience ou, si elles l’ont fait, elles se sont peut-être demandé ce qu’il en était. D’où ce guide. Il s’agit d’une version modifiée de celui que j’ai publié pour mes étudiants plus tôt dans l’année, mais beaucoup de choses ont changé. Il s’agit d’une vue d’ensemble des moyens d’amener l’IA à faire des choses pratiques.
Pourquoi les gens ne voient pas ce que l’IA peut faire.
Les grands modèles de langage comme ChatGPT sont extrêmement puissants, mais ils sont construits d’une manière qui encourage les gens à les utiliser de la mauvaise façon. Lorsque je parle à des personnes qui ont essayé ChatGPT mais ne l’ont pas trouvé utile, j’ai tendance à entendre une histoire similaire.
La première chose que les gens essaient de faire avec l’IA est ce pour quoi elle est la plus mauvaise ; ils l’utilisent comme Google : parlez-moi de mon entreprise, cherchez mon nom, etc. Ces réponses sont terribles. De nombreux modèles ne sont pas connectés à l’internet, et même ceux qui le sont inventent des faits. L’IA n’est pas Google. Les gens repartent donc déçus.
Deuxièmement, ils peuvent essayer quelque chose de spéculatif, en l’utilisant comme Alexa et en posant une question, souvent sur l’IA elle-même. L’IA va-t-elle prendre mon travail ? Qu’aimez-vous manger ? Ces réponses sont également terribles. À une exception près, la plupart des systèmes d’IA n’ont pas de personnalité, ne sont pas programmés pour être amusants comme Alexa et ne sont pas un oracle pour l’avenir. Les gens partent donc déçus.
Si les gens restent dans les parages, ils commencent à poser des questions plus intéressantes, soit pour s’amuser, soit en se basant sur des questions de dissertation universitaire dont ils se souviennent à moitié : Rédigez un article sur les raisons pour lesquelles les canards sont les meilleurs oiseaux. Pourquoi l’Attrape-cœurs est-il un bon roman ? Ces questions sont meilleures. En conséquence, les gens voient des blocs de texte sur un sujet qui ne les intéresse pas beaucoup, et c’est très bien. Ou bien ils voient un texte sur un sujet dont ils sont experts et remarquent des lacunes. Mais ce n’est pas très utile, ni incroyablement bien écrit. Ils abandonnent généralement à ce moment-là, convaincus que tout le monde va s’en servir pour tricher à l’école, mais pas grand-chose d’autre.
Toutes ces utilisations ne correspondent pas à l’utilité réelle de l’IA, ni à la manière dont elle peut être utile. Elles peuvent vous faire perdre de vue la véritable puissance de ces outils. Je vais essayer de vous montrer quelques-unes des raisons pour lesquelles l’IA est puissante, d’une manière à la fois excitante et anxiogène.
Les six grands modèles linguistiques
Pour commencer, présentons les six grands modèles linguistiques disponibles à l’heure actuelle, qui sont tous proposés à un prix compris entre 0 et 20 dollars par mois.
Les quatre premiers (y compris Bing) sont tous des systèmes OpenAI. Il existe essentiellement deux grandes IA OpenAI aujourd’hui : 3.5 et 4. Le modèle 3.5 a donné le coup d’envoi de l’engouement actuel pour l’IA en novembre, tandis que le modèle 4 vient d’être lancé et est beaucoup plus puissant. Une nouvelle variante utilise des plugins pour se connecter à l’internet et à d’autres applications, mais elle n’en est qu’au stade des premiers tests. Si vous n’avez jamais payé pour OpenAI, vous n’avez utilisé que la version 3.5. À l’exception de la variante avec plugins, aucun de ces modèles n’est connecté à l’internet.
Bing de Microsoft utilise un mélange de 4 et de 3.5. Il est connecté à l’internet. Bing est un peu bizarre à utiliser, mais puissant. Voici mon guide d’utilisation. En outre, Google a sorti une IA décevante appelée Bard (bien qu’il soit possible qu’ils nous montrent bientôt des modèles plus impressionnants) et Anthropic a sorti Claude, bien qu’il soit plus axé sur les utilisateurs professionnels. Que pouvez-vous faire avec ces outils ?
Écrire des choses
Option Open Source : Pas encore (mais restez à l’écoute)
Meilleure option gratuite : Bing et ChatGPT 3.5
Option payante : ChatGPT 4.0/ChatGPT avec plugins
Pour l’instant, aucun autre outil d’intelligence artificielle n’arrive à la cheville de GPT-4, auquel vous pouvez accéder gratuitement sur Bing ou en souscrivant un abonnement de 20 $ par mois à ChatGPT. GPT-3.5 est également performant en matière d’écriture et est beaucoup plus rapide. J’ai beaucoup expérimenté sur la manière d’utiliser l’IA pour faciliter la rédaction de documents, voici donc une liste de moyens qui pourraient vous être utiles :
Rédiger n’importe quoi.
- Articles de blog, essais, matériel promotionnel, discours, conférences, aventures à choisir, scripts, nouvelles – tout ce que vous voulez, elle le fait. Mais vous ne pouvez pas vous contenter de lui donner des instructions de base. Les messages-guides de base donnent lieu à des écrits ennuyeux. Obtenir de bons textes avec ChatGPT demande un peu d’entraînement, et voici un guide pour y parvenir. ChatGPT-4 est bien meilleur en matière d’écriture. Bing peut être incroyable à l’écrit, mais a besoin d’être convaincu.
- Améliorez votre écriture Collez votre texte dans ChatGPT. Demandez-lui d’améliorer le contenu ou de vous faire des suggestions sur la manière de l’adapter à un public particulier. Demandez-lui de créer 10 brouillons dans des styles radicalement différents. Demandez-lui de rendre les choses plus vivantes ou d’ajouter des exemples. (Notez toutefois qu’il ne se “souvient” que de quelques milliers de mots d’un texte).
- Vous aider dans vos tâches. L’IA peut rédiger des courriels, créer des modèles de vente, vous indiquer les prochaines étapes d’un plan d’affaires, et bien d’autres choses encore. Voici ce que j’ai pu accomplir avec elle en 30 minutes.
- Vous débloquer. Il est très facile de se laisser distraire d’une tâche par un défi difficile à relever. L’IA permet de se donner de l’élan.
Il y a des choses à craindre : Pour tenter de répondre à vos réponses, l’IA peut très facilement “halluciner” et générer des faits plausibles. Elle peut générer des contenus entièrement faux et tout à fait convaincants. Permettez-moi d’insister sur ce point : L’IA ment continuellement et bien. Chaque fait ou information qu’elle vous communique peut être erroné. Vous devrez tout vérifier. Il est particulièrement dangereux de lui demander des mathématiques, des références, des citations et des informations sur l’internet (pour les modèles qui ne sont pas connectés à l’internet). Bing et ChatGPT-4 sont plus performants à cet égard. Voici un guide pour éviter les hallucinations.
L’IA ne s’explique pas non plus, elle vous fait seulement croire qu’elle le fait. Si vous lui demandez d’expliquer pourquoi elle a écrit quelque chose, elle vous donnera une réponse plausible mais complètement inventée. Elle ne s’interroge pas sur ses propres actions, elle se contente de générer un texte qui en a l’air. Il est donc très difficile de comprendre les biais du système, même si ces biais existent très certainement.
Il peut également être utilisé de manière contraire à l’éthique pour manipuler ou tricher. Vous êtes responsable des résultats de ces outils.
Faire des images
Option Open Source : Télécharger Stable Diffusion
Meilleure option gratuite nécessitant une inscription : Bing ou Bing Image Creator (qui utilise DALL-E), Playgound (qui vous permet d’utiliser plusieurs modèles)
Meilleure option : Midjourney
Il existe trois grands générateurs d’images :
- Stable Diffusion, qui est une source ouverte et que vous pouvez utiliser à partir de n’importe quel ordinateur haut de gamme. Il faut un certain effort pour démarrer, car il faut apprendre à créer des invites correctement, mais une fois que c’est fait, il peut produire d’excellents résultats. Il est particulièrement efficace pour combiner l’IA avec des images provenant d’autres sources. Voici un bon guide sur la diffusion stable si vous optez pour cette solution (assurez-vous de lire les parties 1 et 2).
- DALL-E, d’OpenAI, qui est incorporé dans Bing (vous devez utiliser le mode créatif) et Bing image creator. Ce système est très bon, mais un peu moins puissant, pour l’instant, que…
- Midjourney, qui sera le meilleur système au début de l’année 2023. La raison pour laquelle je suggère MidJourney est qu’il a la courbe d’apprentissage la plus basse de tous les systèmes : il suffit de taper “thing-you-want-to-see –v 5” (le –v 5 à la fin est important, il utilise le dernier modèle) et vous obtenez un excellent résultat. Midjourney nécessite Discord. Voici un guide d’utilisation de Discord.
Quelques utilisations :
- Illustrer des présentations ou des rapports
- Créer des photos d’archives de votre produit en cours d’utilisation
- Créer des maquettes de dessins
- Créer des maquettes d’applications ou de sites web
- Créer des logos
- S’amuser
Il y a lieu de s’inquiéter : Ces systèmes sont construits autour de modèles qui ont des biais intégrés en raison de leur formation sur les données Internet (si vous lui demandez de créer une image d’un entrepreneur, par exemple, vous verrez probablement plus d’images d’hommes que de femmes, à moins que vous ne spécifiiez “femme entrepreneur”), vous pouvez utiliser cet explorateur pour voir ces biais à l’œuvre.
Ces systèmes sont également formés à partir d’œuvres d’art existantes sur l’internet, d’une manière qui n’est pas transparente et qui est potentiellement contestable d’un point de vue juridique et éthique. Même si, techniquement, vous possédez les droits d’auteur des images créées, les règles juridiques sont encore floues.
De plus, pour l’instant, ils ne créent pas de texte, juste un tas de choses qui ressemblent à du texte. Mais ils s’améliorent de plus en plus.
Trouver des idées
Option Open Source : Rien de très bon
Meilleure option gratuite : Bing et ChatGPT 3.5
Option payante : ChatGPT 4.0/ChatGPT avec plugins
Malgré (ou en fait, à cause de) toutes ses contraintes et bizarreries, l’IA est parfaite pour la génération d’idées. Il faut souvent avoir beaucoup d’idées pour avoir de bonnes idées. Tout le monde n’est pas doué pour générer beaucoup d’idées, mais l’IA est très douée pour le volume. Toutes ces idées seront-elles bonnes ou même sensées ? Bien sûr que non. Mais elles peuvent susciter une réflexion plus approfondie de votre part.
Comment procéder ? Il suffit de demander des idées, et l’IA en fournira. Mais il existe aussi des techniques plus avancées. En voici un guide.
Réaliser des vidéos
Meilleur outil d’animation : D-iD
Meilleur clonage de voix : ElevenLabs
Il est désormais possible de générer une vidéo avec un personnage entièrement généré par l’IA (vous pouvez utiliser les images générées à l’aide des techniques décrites dans le guide), lisant un script entièrement écrit par l’IA, parlant d’une voix créée par l’IA et animée par l’IA.
Il peut également simuler des personnes, comme vous pouvez le voir dans ce lien où je me suis moi-même simulé. Instructions et informations complémentaires ici. À utiliser avec précaution, mais cela peut être très utile pour les vidéos explicatives et les introductions. D’ici quelques mois, vous serez probablement en mesure de générer des vidéos à partir de textes, alors restez à l’écoute.
Quelques inquiétudes à avoir : Les “deep fakes” sont une préoccupation majeure, et ces systèmes doivent être utilisés de manière éthique.
Codage
Si vous savez coder : ChatGPT-3.5
Si vous ne savez pas : ChatGPT-4
GPT-3.5 est un puissant compagnon de codage. Mais GPT-4 est d’un niveau supérieur. Je l’ai utilisé pour écrire des programmes en Python et Unity (des langages de programmation que je ne connais pas du tout !) en lui disant simplement ce que je veux avec des mots : “J’ai besoin de créer une compétence Amazon Echo qui fera clignoter mes lumières hue en vert et en bleu lorsque je crie “party”. Peux-tu la créer ?” Il l’a fait, et maintenant mes lumières clignotent en bleu et en vert. Il m’a indiqué les fichiers à télécharger, les sites web à visiter et ce qu’il fallait faire. Lorsqu’il y avait des erreurs, je les ai simplement collées et il a corrigé le code et m’a indiqué comment résoudre les problèmes. Je n’avais pas besoin de savoir quoi que ce soit. Vous pouvez coder maintenant. Essayez-le.
Apprendre des choses
Option Open Source : Pas encore (mais restez à l’écoute)
Meilleure option gratuite : Bing et ChatGPT 3.5
Option payante : ChatGPT 4.0/ChatGPT avec plugins
L’IA peut être un outil puissant pour l’apprentissage et l’exploration. J’ai écrit sur la façon dont elle peut être utilisée pour l’enseignement et pour rendre la vie des enseignants plus facile et leurs leçons plus efficaces, mais elle peut aussi fonctionner pour l’apprentissage autoguidé. Voici quelques exemples d’utilisation de ChatGPT :
Résumer des textes. J’ai collé de nombreux articles académiques complexes et je lui ai demandé de résumer les résultats, et il fait du bon travail ! (mais n’oubliez pas les limites de taille). Mieux encore, vous pouvez ensuite interroger le matériel en posant des questions complémentaires : quelles sont les preuves de cette approche ? Quelles sont les conclusions des auteurs ? Et ainsi de suite… Aide pour les concepts. Vous pouvez demander à l’IA d’expliquer des concepts. Comme nous savons que l’IA peut avoir des hallucinations, vous seriez bien avisé de vérifier (soigneusement !) ses résultats en les comparant à ceux d’une autre source. Cela vous permet à la fois d’apprendre et de confirmer que les résultats de l’IA sont bons. Une fois que vous avez l’impression que l’IA a raison, demandez-lui de l’expliquer de différentes manières : “Comme si j’avais 10 ans”, “dans un scénario de The Office” ou “dans le contexte d’un examen médical”. Là encore, il s’agit d’un début d’apprentissage, car il se trompera souvent sur certaines subtilités. Expliquez les erreurs : Si vous vous trompez, collez le texte incorrect et demandez-lui d’expliquer l’erreur ou de vous guider pas à pas. Les résultats peuvent être étonnamment utiles.
Certaines choses à craindre : Si vous ne vérifiez pas la présence d’hallucinations, il est possible que l’on vous enseigne quelque chose d’inexact. Utilisez l’IA comme un point de départ pour vos propres recherches, et non comme une autorité définitive en la matière. De plus, si elle n’est pas connectée à l’internet, elle inventera des choses.
Et plus encore ?
Ce n’est qu’un début. L’IA s’améliore rapidement et les gens développent sans cesse de nouvelles utilisations. Mais n’oubliez pas deux points essentiels :
L’IA est un outil. Ce n’est pas toujours le bon outil. Réfléchissez bien pour savoir si, compte tenu de ses faiblesses, elle est adaptée à l’usage que vous envisagez d’en faire. Il existe de nombreuses préoccupations éthiques dont vous devez être conscient. L’IA peut être utilisée pour violer des droits d’auteur, tricher, voler le travail d’autrui ou manipuler. La manière dont un modèle d’IA particulier est construit et qui bénéficie de son utilisation sont souvent des questions complexes, qui ne sont pas particulièrement claires à ce stade. En fin de compte, c’est à vous qu’il incombe d’utiliser ces outils de manière éthique.
Nous n’en sommes qu’aux premiers jours d’une révolution qui progresse très rapidement. Avez-vous d’autres utilisations à partager ?