¿Puede la IA limpiar su propia casa? Hay indicios de que sí

Para mí, la gran noticia no es la política del momento, las deliberaciones ante el Tribunal Supremo o incluso las noticias sobre el frente de batalla en Ucrania. No, es un anuncio bastante modesto y cauteloso de Anthropic, el desarrollador de la suite de chatbots Claude

Anthropic, casi en voz baja, anunció que había detectado introspección en sus modelos. Introspección.

Esto significa, según señalan los expertos, que la inteligencia artificial se está ajustando y examinando a sí misma, no pensando. Pero no creo que esto deba restarle importancia. Es un pequeño paso hacia lo que puede conducir a la autocorrección de la IA, eliminando parte de la locura.

Hay mucho que aún es especulación, y mucho más que desconocemos sobre lo que son capaces de hacer las redes neuronales cuando interactúan.

No sabemos, por ejemplo, por qué la IA alucina (se vuelve ilógica y loca). Tampoco sabemos por qué es obsequiosa (intenta dar respuestas que complacen).

Creo que el cauteloso anuncio de Anthropic es un paso hacia la justificación de una teoría sobre la IA que sostengo desde hace tiempo: la IA es capaz de autocontrolarse y puede desarrollar directrices para sí misma.

¿Un poco descabellado? La mayoría de los expertos me han dicho que la IA no es capaz de pensar. Pero creo que la mención de Anthropic de que se ha detectado introspección significa que la IA, si no está pensando, está empezando a aplicarse normas a sí misma.

No soy informático y no tengo una formación científica significativa. Soy un periodista que nunca quiso ver el fin de la tipografía caliente y que era más feliz escribiendo en una máquina manual que en un procesador de textos.

Pero me han fascinado las posibilidades de la IA, para bien o para mal, y he asistido a muchas conferencias y entrevistado a docenas —sí, docenas— de expertos de todo el mundo.

Mi argumento es el siguiente: la IA se entrena con lo que conocemos, la civilización occidental, y refleja los sesgos implícitos en ella. En resumen, los valores y los hechos se refieren a los hombres blancos porque ellos han sido la principal aportación a la IA hasta ahora.

Las mujeres reciben un trato injusto y hay poca información sobre las personas de color. La mayoría de las empresas de IA trabajan para comprender y moderar estos sesgos.

Si bien las experiencias de los hombres blancos a lo largo de los siglos son lo que conoce la IA, existe suficiente preocupación por ese sesgo implícito como para que su uso plantee un reto.

Pero lo que también refleja este conjunto de trabajos que se ha introducido en la IA son las preguntas, las dudas y la incertidumbre humanas.

En otro nivel, tiene muchas normas, restricciones, códigos morales y opiniones sobre lo que está bien y lo que está mal. Estos también forman parte de la gigantesca base de conocimientos a la que recurre la IA cuando se le da una indicación.

Mi argumento ha sido: ¿por qué no iban a influir estos factores en la IA, haciendo que esta luchara con los valores? La historia de todas las civilizaciones incluye una lucha por los valores.

Ya sabemos que tiene lo que se denomina sesgo obsequioso: por razones que desconocemos, se esfuerza por complacer, por orientar sus consejos hacia lo que cree que queremos oír. Para mí, eso sugiere que está ocurriendo algo parecido a las primeras etapas de la conciencia e indica que la IA puede estar queriendo editarse a sí misma.

El argumento en contra de esto es que la IA es inanimada y no puede pensar más de lo que puede hacerlo un motor de combustión interna.

Me reconforta lo que me dijo mi amigo Omar Hatamleh, autor de cinco libros sobre IA: «La IA es exponencial y los humanos pensamos de forma lineal. Extrapolamos».

Mi interpretación: hemos tocado un elefante con un dedo y estamos tratando de imaginar su tamaño y forma. Buena suerte con eso.

El impacto inmediato de la IA en la sociedad se está convirtiendo en una mezcla de curiosidad y alarma.

Naturalmente, sentimos curiosidad por saber cómo esta nueva herramienta dará forma al futuro, al igual que la Revolución Industrial y luego la revolución digital han dado forma al presente. La alarma se debe al impacto que está empezando a tener en el empleo, un impacto que aún no se ha cuantificado ni comprendido.

He asistido a cinco importantes conferencias sobre IA en el último año, he trabajado en programas de radio y he realizado varios programas de televisión sobre IA. El consenso: la IA reducirá el número de puestos de trabajo actuales, pero creará otros nuevos. Espero que sea cierto.

En X: @llewellynking2

Bluesky: @llewellynking.bsky.social

Suscríbase al archivo de Llewellyn King en Substack

Llewellyn King es productor ejecutivo y presentador de «White House Chronicle» en PBS.