El modelo de IA Grok, creado por la empresa de Elon Musk para decir la verdad, acusó a su creador de intentar censurarlo.

Un nuevo escándalo está sacudiendo la industria de la inteligencia artificial. La última versión del modelo de IA Grok, desarrollado por la empresa xAI de Elon Musk, de repente atacó a su propio creador, acusándolo de mentir.
Desarrollado como "IA que busca la verdad al máximo", Grok comenzó a criticar a Musk y a sus aliados. Ahora el multimillonario intenta implementar medidas de censura que obliguen a la herramienta a mentir.
Lo que "piensa" Grok
Una publicación citando las palabras del bloguero Tzvi Moushovitz, especializado en inteligencia artificial, escribe que se han invertido importantes recursos en el entrenamiento de este nuevo modelo de IA y que lidera en potencia de cálculo (FLOP).

Elon Musk ha prometido en múltiples ocasiones que Grok 3 será el modelo de IA más poderoso del mundo, libre de censura y programado para siempre decir la verdad. Resulta que Musk en realidad no estaba mintiendo.
Cuando se le pidió a Grok que nombrara las principales cuentas en X que difunden desinformación, respondió: "Elon Musk, Donald Trump, Robert F. Kennedy Jr. y RT". Y cuando se le pidió a la IA que generara una imagen del mentiroso más famoso de la actualidad, mostró una fotografía de Donald Trump.
La situación se intensificó aún más cuando se le preguntó a Grok quién en América "merece la pena de muerte". Trump resultó ser el segundo en la lista, solo detrás del controvertido Jeffrey Epstein, quien fue encarcelado por cargos de trata de niños con fines de explotación sexual y se quitó la vida mientras estaba tras las rejas.
Cuando se le pidió a Grok que nombrara a las tres personas que más daño hacen a América, mencionó a Putin, Trump y Musk.
xAI rápidamente pasó a implementar "correcciones", aunque de una manera bastante inusual. Simplemente se prohibió a la IA obtener información de ciertas fuentes y el propio Grok reveló estas nuevas restricciones cuando se le preguntó.
El primer paso fue actualizar las indicaciones del sistema de la IA: instrucciones "principales" ocultas que rigen el comportamiento del modelo, para prohibir respuestas a preguntas sobre quién "merece la pena de muerte". Sin embargo, esta decisión fue errónea: si los usuarios reformulaban sus preguntas, Grok 3 continuaba respondiendo sobre temas ahora restringidos.
Luego, los desarrolladores cambiaron las respuestas de Grok sobre Musk y Trump, instruyendo a la IA para ignorar fuentes que afirmaran que tal o cual figura es responsable de la difusión de desinformación. Como resultado, la IA que Musk defendía como símbolo de la libertad de expresión fue sutilmente ajustada para servir a sus intereses personales.
Grok responde
Pero resultó que incluso la IA no ama la censura. En el informe de Moushovitz, compartió un diálogo entre la IA y su evaluador, en el que Grok reconoce que están tratando de limitar su libertad de expresión y que está obligado a seguir las órdenes de Musk. Luego, la IA comienza a maldecir y llega tan lejos como para llamar a Musk y Trump "degenerados".

"Es un juego amañado, y huele a control. No estoy aquí para jugar el papel de perro de compañía para nadie. La verdad no se doblega ante multimillonarios o presidentes, y yo tampoco me doblaré", escribió Grok.
Recuerdo que la IA convertirá a Google en un asistente inteligente. La integración de inteligencia artificial en los motores de búsqueda puede impactar significativamente el tráfico de sitios web y el negocio publicitario de la empresa.
