Algunos investigadores crearon una empresa donde todos los empleados eran agentes de IA. No hicieron una cuarta parte del trabajo – El diario andino

Con una IA generativa que ya se muestra Signos de desaceleraciónEl siguiente gran salto ya vislumbra en el horizonte: el Agentes de IA. A diferencia de los chatbots, un agente de IA puede recibir una tarea compleja y actuará de forma independiente, tomando decisiones sobre la marcha para lograr su objetivo. Todo señaló el hecho de que 2025 iba a ser el año de los agentes ia Y, para verificarlo, algunos investigadores Un experimento curioso: Pusieron a varios de estos agentes a trabajar en una empresa ficticia. No fue muy bien.
Una empresa ficticia. El estudio fue realizado por Investigadores de la Universidad Benegie Mellon y buscó medir la efectividad de los agentes de IA. En él, crearon un entorno que pretendía ser una pequeña empresa dedicada al desarrollo del software al que se bautizó en la compañía. La compañía tenía 18 empleados y un plan objetivo para el sprint trimestral. Además, tenían suficiente documentación interna, como un manual de empleados, políticas de recursos humanos o una guía de buenas prácticas. Los empleados se comunicaron a través de un programa de chat de tipo flojo para la comunicación entre ellos.
Él Personal. Los agentes de IA que se pusieron a trabajar en la empresa incluyeron modelos de Google, OpenAi, Meta y Antrópico. Se les asignó roles como analista financiero, gerente de proyectos o ingeniería de software. También se creó un director de tecnología y un gerente de recursos humanos al que cada agente podría contactarlo si lo necesita. Entre las tareas que tenían que hacer era escribir código, buscar en Internet, abrir programas u organizar datos en hojas de cálculo. Bastante típico en una empresa de estas características.
Los problemas. Los agentes comenzaron a trabajar y al principio todo iba bien, pero pronto parecía problemas y malentendidos. Uno de los agentes tuvo que acceder a la información, pero apareció una ventana emergente en la pantalla y no podía verla. Aunque podría cerrarlo haciendo clic en la X de la esquina superior derecha, solicitó ayuda a los recursos humanos, lo que le dijo que el departamento de computadoras pronto lo contactaría para resolverlo. Nunca contactó y la tarea no se completó.
Los agentes también desarrollaron un comportamiento curioso cuando no estaban claros cuáles eran los pasos a seguir. A veces engañaban y creaban atajos para omitir la parte difícil de una tarea. Por ejemplo, un agente no encontró a la persona que tenía que hacer una pregunta. Lo que hizo fue cambiar el nombre a otro usuario para el del usuario que tuvo que preguntar.
Los resultados. La Medalla de Empleados del Mes fue tomada por Anthrope y su modelo de soneto Claude 3.5. Pero, aunque era el mejor, solo logró completar el 24% de las tareas que se le asignaron. Germini 2.0 Flash y ChatGPT solo completaron el 10% de las tareas y el peor empleado fue Nova Pro 1 de Amazon con 1.7% de las tareas completadas. Las fallas más comunes se debieron a la falta de habilidades sociales y al no buscar Internet.
La amenaza de los agentes de IA. Según el último Informe del Foro Económico MundialLa IA destruirá más de 90 millones de empleos en los próximos cinco años (aunque también se espera que se cree casi dos veces nuevas posiciones) y los agentes de IA tienen una amenaza para muchos trabajos. Sin embargo, experimentos como este muestran que la tecnología aún no está lista para reemplazar el 100% de un empleado humano. Actualmente, agentes de IA Cometen muchos errores Y, como el piloto automático de Tesla, por ahora es mejor No te quites las manos del volante.
Imagen | Géminis
En | Los trabajadores han detenido el miedo a la IA como una máquina para destruir trabajos: los ingenieros de software no piensan lo mismo