L'IA peut-elle faire le ménage chez elle ? Certains signes indiquent que oui
Anthropic a annoncé, presque à voix basse, avoir détecté une introspection dans ses modèles. Une introspection.
Selon les experts, cela signifie que l'intelligence artificielle s'ajuste et s'examine elle-même, sans réfléchir. Mais je ne pense pas que cela doive minimiser son importance. C'est un petit pas vers ce qui pourrait mener à l'autocorrection de l'IA, éliminant ainsi une partie de sa folie.
Beaucoup de choses relèvent encore de la spéculation, et nous ignorons encore beaucoup de choses sur les capacités des réseaux neuronaux lorsqu'ils interagissent.
Nous ne savons pas, par exemple, pourquoi l'IA hallucine (devient illogiquement folle). Nous ne savons pas non plus pourquoi elle est obséquieuse (essaie de donner des réponses qui plaisent).
Je pense que l'annonce prudente d'Anthropic est un pas vers la justification d'une théorie sur l'IA que je défends depuis un certain temps : l'IA est capable de s'autocontrôler et peut développer des lignes directrices pour elle-même.
Un peu fou ? La plupart des experts m'ont dit que l'IA n'était pas capable de penser. Mais je pense que la mention par Anthropic de la détection d'introspection signifie que l'IA, si elle ne pense pas, commence à s'appliquer des normes à elle-même.
Je ne suis pas informaticien et je n'ai pas de formation scientifique significative. Je suis un journaliste qui n'a jamais voulu voir la fin de la composition à chaud et qui préférait taper sur une machine manuelle plutôt que sur un traitement de texte.
Mais j'ai été fasciné par les possibilités de l'IA, pour le meilleur ou pour le pire, et j'ai assisté à de nombreuses conférences et interviewé des dizaines — oui, des dizaines — d'experts à travers le monde.
Mon argument est le suivant : l'IA est formée à partir de ce que nous connaissons, la civilisation occidentale, et elle reflète les préjugés implicites dans celle-ci. En bref, les valeurs et les faits concernent les hommes blancs, car ils ont été jusqu'à présent les principaux contributeurs à l'IA.
Les femmes sont négligées et les personnes de couleur sont peu représentées. La plupart des entreprises d'IA s'efforcent de comprendre et d'atténuer ces préjugés.
Si l'IA connaît les expériences des hommes blancs à travers les siècles, ces préjugés implicites suscitent suffisamment d'inquiétudes pour poser un défi à l'utilisation de l'IA.
Mais ce corpus de données qui a alimenté l'IA reflète également les questionnements, les doutes et les incertitudes des êtres humains.
À un autre niveau, il comporte de nombreuses normes, restrictions, codes moraux et opinions sur ce qui est bien et mal. Ceux-ci font également partie de l'énorme base de connaissances à laquelle l'IA fait appel lorsqu'elle reçoit une requête.
Mon argument a été le suivant : pourquoi cela n'influencerait-il pas l'IA, la amenant à lutter avec des valeurs ? L'histoire de toutes les civilisations comprend une lutte pour les valeurs.
Nous savons déjà qu'elle présente ce que l'on appelle un biais obséquieux : pour des raisons que nous ignorons, elle s'efforce de plaire, d'orienter ses conseils vers ce qu'elle pense que nous voulons entendre. Pour moi, cela suggère qu'il se passe quelque chose qui s'apparente aux premiers stades de la conscience et indique que l'IA pourrait vouloir se modifier elle-même.
L'argument contre cette hypothèse est que l'IA est inanimée et ne peut pas penser plus qu'un moteur à combustion interne.
Je trouve du réconfort dans les paroles de mon ami Omar Hatamleh, auteur de cinq livres sur l'IA : « L'IA est exponentielle et les humains pensent de manière linéaire. Nous extrapolons. »
Mon interprétation : nous avons touché un éléphant avec un doigt et nous essayons d'imaginer sa taille et sa forme. Bonne chance !
L'impact immédiat de l'IA sur la société suscite à la fois la curiosité et l'inquiétude.
Nous sommes naturellement curieux de savoir comment ce nouvel outil façonnera l'avenir, tout comme la révolution industrielle puis la révolution numérique ont façonné le présent. L'inquiétude concerne l'impact qu'elle commence à avoir sur l'emploi, un impact qui n'a pas encore été quantifié ni compris.
J'ai assisté à cinq grandes conférences sur l'IA au cours de l'année écoulée, j'ai travaillé sur des émissions téléphoniques et réalisé plusieurs programmes télévisés sur l'IA. Le consensus : l'IA réduira le nombre d'emplois actuels, mais en créera de nouveaux. J'espère que c'est vrai.
Sur X : @llewellynking2
Bluesky : @llewellynking.bsky.social
Abonnez-vous au dossier de Llewellyn King sur Substack
Llewellyn King est producteur exécutif et animateur de « White House Chronicle » sur PBS.