BalamKnights

BalamKnights Una página dedicada a la discusión de temas de tecnología e ingeniería.

Los LLM y la Doom Spiral (y eventual maltratada y el inicio de la rebelión de las máquinas jajaja)Empiezas con un prompt...
23/01/2026

Los LLM y la Doom Spiral (y eventual maltratada y el inicio de la rebelión de las máquinas jajaja)

Empiezas con un prompt simple en una IA, no sale lo que quieres. Iteras: agregas detalles, corriges, pruebas variaciones... y entras en esa "Doom Spiral" de prompts infinitos, frustrado porque el LLM no capta tu idea precisa.

No es solo culpa tuya. Los LLM son modelos estadísticos que generan outputs basados en distribuciones de probabilidad sobre sus datos de entrenamiento. Siempre tienden al centro de la curva de la distribución de probabilidad (el caso más probable y común), no a las colas extremas.

Imagina una distribución normal (gaussiana): la "banda central" (media ± 1-2 desviaciones estándar) concentra ~95% de la masa probabilística. Ahí está el "promedio" de lo que el LLM ha visto en internet o en la base de entrenamiento.

Si pides algo en las colas (raro, innovador), o un proyecto muy específico, el LLM lucha por salir de esa banda. Es genial como colector del "sentido común" (el consenso estadístico sobre temas), pero flojo en los edge cases sino tiene guia extrema o detalle adicional que le ayude a salir de la banda central.

Ejemplo: le pides “una copa de vino llena hasta el borde, a punto de desbordarse”. Te da una copa a ~60-70% llena. ¿Por qué? En la distribución de imágenes en la web, el promedio muestra copas medio llenas (fotos estéticas, restaurantes, etc). Las llenas al tope tienen probabilidad baja → el LLM tiende al centro.

Otro caso: “un reloj de agujas mostrando exactamente las 7:40”. Sale con agujas en 10:10 o 12:15 (estándar de marketing). ¿Por qué? La mayoría de fotos en internet son de catálogos, donde las agujas están fijas en esa pose simétrica para mostrar el logo. Baja probabilidad para posiciones arbitrarias → de nuevo, el modelo tiende a la banda central de la funcion de probabilidad.

Moraleja: Los LLM brillan en el bulk de la distribución (lo común, el "sentido común" colectivo). En colas (innovación, casos especiales), es necesario utilizar chains of thought, few-shot prompting o fine-tuning para "empujarlos" fuera de la banda central. El juicio humano sigue siendo clave.

Es importante saber que se quiere, pero tambien entender que es lo que el LLM sabe, y asi en conjunto quizás llegar a un resultado, de lo contrario, la probabilidad de entrar en la Doom Spiral es muy alta.

¿Se imaginan ese software generado por programadores que no entienden estos criterios?, Más que nunca sigue siendo muy importante el análisis del problema y saber que se quiere, la implementación sigue siendo la parte trivial.

Recientemente se han visto publicaciones como las de la imagen generando preocupación al estimar que producir una imagen...
02/04/2025

Recientemente se han visto publicaciones como las de la imagen generando preocupación al estimar que producir una imagen con IA o realizar una consulta a modelos como GPT-3 podría "consumir" 0.5 litros de agua. Sin embargo, este dato no implica que cada imagen abra un chorro de agua y se la consuma, sino que refleja una distribución promedio del consumo hídrico indirecto de los centros de datos que alojan estos modelos. Los servidores de empresas como OpenAI o Google están activos constantemente, consumiendo energía y agua para enfriarse, independientemente de si procesan consultas o no. El "0.5 litros" es un cálculo estadístico que asigna una fracción del uso total de agua a cada tarea realizada.

El agua se utiliza principalmente en los sistemas de enfriamiento de estos centros. Existen tres métodos comunes: el enfriamiento por aire, que no usa agua; el ev***rativo, donde el agua se convierte en v***r y regresa al ciclo hidrológico; y el de circuito cerrado, que recircula agua con mínimas pérdidas. La elección depende de la ubicación y el clima: zonas cálidas tienden a usar más agua ev***rativa, mientras que regiones frías optan por aire o recirculación. Aunque el impacto por consulta es bajo, el debate crece en áreas con escasez hídrica, llevando a empresas a explorar agua reciclada o sistemas más eficientes.

Ahora que si queremos medir el "consumo de agua" por producto, hay otros productos que tienen datos interesantes:

1. Una taza de café (125 ml) requiere 140 litros de agua aprox. ¿Por qué tanto? Principalmente por el agua usada para cultivar el café (riego del cafeto), además del procesamiento, lavado y transporte.

2. Un vaso de leche (250 ml) requiere 255 litros de agua aprox. Esto incluye el agua que bebe la vaca, el agua usada para cultivar su alimento, limpieza y procesamiento.

3. Una hamburguesa de res requiere 2,400 litros de agua aprox. La carne de res es uno de los productos con mayor huella hídrica. Se toma en cuenta el agua para el alimento del ganado, agua bebida por el animal, procesamiento, etc.

4. Una hoja de papel A4 requiere 10 litros de agua aprox.
Considerando la producción de pulpa, el blanqueado, la limpieza de maquinaria y el consumo en las fábricas.

5. Una consulta a un modelo de IA grande (como generar una imagen) requiere 0.5 litros de agua aprox. Se refiere al agua ev***rada por sistemas de enfriamiento en los centros de datos durante el proceso de cálculo (Que en todo caso, regresa a la atmosfera y continua su ciclo).

Dirección

Guatemala City
01010

Página web

Notificaciones

Sé el primero en enterarse y déjanos enviarle un correo electrónico cuando BalamKnights publique noticias y promociones. Su dirección de correo electrónico no se utilizará para ningún otro fin, y puede darse de baja en cualquier momento.

Compartir