El 97% de los archivos llms.txt no recibe ninguna visita, según un estudio de 137K sitios

Resumen del contenido

Un estudio de Ahrefs sobre 137.000 dominios confirmó que el 97% de los archivos llms.txt no recibe ninguna visita de bots de IA relevantes. Los equipos que invirtieron tiempo en esta táctica lo hicieron sin respaldo empírico. La prioridad ahora es revisar los logs propios y redirigir esfuerzos hacia tácticas con evidencia real.

El 97% de los archivos llms.txt no recibe solicitudes. De 38.000 dominios con el archivo activo durante mayo de 2026, solo el 3% concentró todo el tráfico. Y del tráfico registrado, el 96% provino de bots genéricos, no de sistemas de AI search.
Ninguna plataforma de IA confirmó que lee llms.txt. ChatGPT, Perplexity y Google nunca se comprometieron a consumir este archivo. La adopción masiva —28% de los sitios analizados— fue impulsada por especulación de la industria, no por validación oficial de las plataformas.
Google lo dijo explícitamente: llms.txt no es necesario para AI search. Su guía oficial de mayo de 2026 incluyó una sección de "mythbusting" descartando estos archivos como factor de ranking o señal diferencial para respuestas generativas.
El único caso de uso validado es muy específico. Claude-Code de Anthropic sí lee llms.txt, pero solo en sitios de documentación técnica para desarrolladores. Para cualquier otro tipo de sitio, el valor empírico es marginal o inexistente.
El costo real no fue el tiempo, sino las decisiones desplazadas. Priorizar llms.txt significó, en muchos equipos, postergar tácticas con respaldo real: autoridad de dominio, contenido de calidad y presencia en fuentes que los sistemas de IA efectivamente citan.

Durante los últimos dos años, equipos de marketing y SEO de todo el mundo invirtieron horas en crear, estructurar y mantener archivos llms.txt. La promesa era clara: mejor visibilidad en ChatGPT, Perplexity o AI Overviews. Un nuevo estudio de Ahrefs sobre 137.210 dominios acaba de poner números concretos a lo que muchos sospechaban. Esa apuesta, en la mayoría de los casos, no tuvo ningún retorno.

137K sitios analizados. Los números no mienten

Ahrefs analizó los logs de servidor de 137.210 dominios activos durante mayo de 2026. Usaron sus herramientas Web Analytics y Bot Analytics. El objetivo era simple: determinar cuántos archivos llms.txt existían y cuántos recibían solicitudes reales.

Los resultados son contundentes:

De los aproximadamente 38.000 dominios con un archivo llms.txt válido, el 97% no recibió ninguna solicitud durante todo mayo de 2026.
Solo unos 1.100 dominios —el 3% restante— concentraron la totalidad del tráfico hacia estos archivos.
Del tráfico que sí llegó, el 96% provino de bots. No de humanos. No de sistemas de recuperación de IA en producción activa.

Fijate en este dato para dimensionar la situación: Slackbot —el bot de previsualización de enlaces del chat corporativo— accedió a más archivos llms.txt que PerplexityBot. Uno de los motores de AI search para los que supuestamente fue diseñado el archivo.

El estudio verificó que cada archivo fuera Markdown real y no un soft 404 disfrazado. Clasificó cada solicitud por respuesta HTTP y por user agent. La metodología es sólida. La muestra, la más grande analizada hasta la fecha sobre este tema.

El 28% de los sitios publicó un llms.txt. Ninguna IA confirmó que lo lee

Que uno de cada cuatro dominios en la muestra haya publicado un llms.txt dice mucho sobre el peso que tuvo la narrativa de la industria. Pero hay un dato que lo contextualiza todo: ninguna plataforma de IA —ni ChatGPT, ni Perplexity, ni Google— se comprometió jamás a consumir este archivo.

La adopción fue impulsada por especulación. No por confirmación oficial. La lógica circulaba en foros, newsletters y conferencias de SEO: "si los LLMs pueden leer un índice de tu sitio, van a entenderte mejor y van a citarte más". Era una hipótesis razonable. Nunca fue validada por las plataformas que supuestamente iban a beneficiar a quienes lo implementaran.

Además, ese 28% de adopción es probablemente un techo, no un promedio real. Los clientes de Ahrefs Web Analytics son, por definición, más técnicos y más orientados al SEO que el universo general de sitios web. En la web promedio, la adopción es casi con certeza menor.

Los bots de IA no van a buscar lo que no existe

Un dato adicional que el estudio deja en claro: los bots de IA no van a buscar el archivo si no existe. El análisis de solicitudes a rutas /llms.txt que devolvían error 404 mostró cero solicitudes provenientes de bots de IA. Los únicos que probaban esas URLs eran humanos —probablemente SEOs revisando a sus competidores.

Los sistemas de IA solo acceden al archivo cuando una instrucción, un enlace o un índice les indica que existe. Sin esa señal, no hay visita.

Lo que dijo Google: mythbusting oficial y una contradicción resuelta en menos de una semana

En menos de siete días, Google ocupó los dos lados del debate sobre llms.txt al mismo tiempo. La tensión entre ambas posiciones dice mucho sobre el estado actual del ecosistema.

La guía oficial que desmiente el mito

El 15 de mayo de 2026, Google publicó su primera guía oficial para optimizar la presencia en generative AI search. En una sección titulada literalmente "mythbusting", el documento fue directo: los archivos machine-readable como llms.txt no son necesarios para aparecer en AI search. No son un factor de ranking. No son una señal que Google procese de forma diferencial para sus respuestas generativas.

El equipo de Chrome que auditó lo contrario

Días antes de esa guía, el equipo de Chrome había lanzado Lighthouse 13.3 con una nueva categoría experimental llamada "Agentic Browsing". Entre sus auditorías: una verificación de la presencia de llms.txt. La documentación explicaba que sin el archivo, los agentes podrían necesitar más tiempo para entender la estructura de un sitio.

Dos mensajes contradictorios. Menos de una semana. La misma empresa.

John Mueller lo aclaró sin rodeos

Cuando la especialista en SEO Lily Ray presionó a John Mueller sobre esta contradicción, la respuesta fue clara: llms.txt "no está hecho para search". Mueller lo describió como un "soporte temporal, quizás para ahorrar algunos tokens", orientado a herramientas de coding que parsean documentación de desarrolladores. No algo que sitios no técnicos necesiten implementar.

La distinción que resuelve la aparente contradicción es de objetivo. La guía de Google habla de visibilidad en Search. La auditoría de Lighthouse apunta a la preparación para agentes de navegación. Son casos de uso diferentes. Confundirlos es exactamente lo que llevó a la industria a sobrestimar el valor del archivo para el SEO.

El costo real de apostar por una táctica sin evidencia empírica

El estudio de Ahrefs no es el primero en señalar que llms.txt no mueve la aguja en AI search. Un análisis previo de SE Ranking sobre 300.000 dominios tampoco encontró conexión estadística entre tener un archivo llms.txt y la frecuencia con la que una marca era citada por sistemas de IA.

Sin embargo, durante dos años la industria SEO construyó un ecosistema completo alrededor de tácticas AI-específicas. Archivos para LLMs. Reestructuración de contenido orientada a fragmentos. Schema markup especial para respuestas generativas. La guía oficial de Google desmantela buena parte de ese ecosistema en lenguaje llano.

El costo no es solo de tiempo, aunque ese también es real.

El costo más profundo son las decisiones de contenido y arquitectura tomadas sobre la base de una narrativa construida por la industria, no por las plataformas. Equipos que priorizaron crear y mantener llms.txt por encima de tácticas con respaldo empírico —autoridad de dominio, contenido de alta calidad, menciones en fuentes confiables— potencialmente dejaron sobre la mesa oportunidades reales de visibilidad en AI search.

La pregunta que importa

No es si llms.txt tiene algún valor. En contextos muy específicos, puede tenerlo. La pregunta es si ese valor justificó la prioridad que recibió en la agenda de tantos equipos de marketing.

Spoiler: los datos dicen que no.

Cómo verificar si tu llms.txt está recibiendo visitas reales

Antes de tomar cualquier decisión sobre mantener o eliminar el archivo, hay un paso previo. Revisá los logs de tu propio servidor.

El método que usó Ahrefs es replicable a nivel individual con Bot Analytics. La herramienta rastrea 12 categorías de bots —AI assistants, AI search bots, AI crawlers, SEO audit tools, entre otras— con datos server-side procesados vía Cloudflare, sin depender de JavaScript. Captura solicitudes que Google Analytics nunca registraría.

El flujo práctico, paso a paso

Accedé a Bot Analytics en el panel de Ahrefs.
Agregá un filtro por Page URL → Contains → llms.txt.
Revisá las visitas en el tiempo, la tabla de bots específicos y el último código de estado HTTP registrado.

Si el archivo devuelve 404: bots están buscando algo que no existe. Probablemente porque el dominio fue mencionado en algún índice o directorio de llms.txt. Si devuelve 200 pero no hay solicitudes de bots de IA relevantes: el archivo existe. Nadie que importe lo está leyendo.

Un detalle que el estudio subraya y que no podés ignorar: que un bot haya fetched el archivo no significa que lo haya leído ni actuado sobre él. Cada cifra del estudio es un techo. No una garantía de consumo real.

Qué hacer ahora si ya publicaste un llms.txt

La buena noticia: el costo de mantenimiento es bajo. Es un archivo Markdown en el root del sitio. Si ya existe y está bien estructurado, mantenerlo no implica esfuerzo significativo.

Pero los datos son claros sobre lo que no hay que hacer: no priorices este archivo como táctica de AI search.

Lo que el estudio valida y lo que no

Caso de uso	¿Validado por datos?
Mejorar citas en ChatGPT o Perplexity	❌ No
Aparecer en AI Overviews de Google	❌ No
Ayudar a agentes de coding en sitios de documentación técnica	✅ Sí (Claude-Code lo lee)
Preparar el sitio para un futuro agentic web	⚠️ Posible, sin evidencia actual

El único caso de uso validado empíricamente hoy es la legibilidad para agentes de coding —específicamente Claude-Code de Anthropic— en sitios con documentación técnica. Si tu sitio no es ese tipo de plataforma, el archivo tiene valor marginal.

Las recomendaciones concretas

Revisá los logs antes de invertir más esfuerzo. Si el archivo existe y no recibe solicitudes de bots de IA relevantes, no hay evidencia de que esté generando valor.
No elimines el archivo si ya existe y está bien estructurado. El costo de mantenerlo es bajo y el escenario agentic podría cambiar en los próximos meses.
No crees el archivo desde cero esperando un boost en AI search. Los datos de 137.000 sitios dicen que ese boost no está llegando.
Redirigí los recursos hacia tácticas con respaldo empírico: presencia en fuentes citadas por los sistemas de IA, autoridad temática, contenido que responde preguntas específicas con profundidad real.
Si tu CMS —Wix, Framer u otro— genera el archivo automáticamente, dejá que lo haga sin invertir tiempo adicional en optimizarlo para AI search.

En resumen: los números que cambian la conversación

El estudio de Ahrefs es el análisis más grande realizado hasta la fecha sobre el comportamiento real de los archivos llms.txt en producción. Sus conclusiones son difíciles de ignorar.

El 97% de los archivos no recibe ninguna visita. Los bots de AI search apenas los tocan. Google confirmó oficialmente que no son necesarios para aparecer en generative AI search.

Pero lo que este estudio revela va más allá del archivo en sí. Revela el mecanismo por el cual la industria SEO puede construir consenso alrededor de una táctica antes de que exista evidencia de que esa táctica funciona. Esa dinámica es la que merece atención de los equipos de marketing que quieren tomar decisiones basadas en datos reales.

El próximo paso no es abandonar la optimización para AI search. Es hacerla con evidencia.

Preguntas frecuentes

¿Qué es un archivo llms.txt y para qué fue diseñado originalmente?

Es un archivo de índice en formato Markdown ubicado en el root de un sitio web, propuesto en 2024 por Jeremy Howard, cofundador de Answer.AI. Su propósito original era ayudar a los LLMs y agentes a orientarse en un sitio sin necesidad de rastrear todo su contenido. La industria SEO lo adoptó después bajo la hipótesis —nunca confirmada por las plataformas— de que mejoraría la visibilidad en AI search.

¿Por qué el 97% de los archivos llms.txt no recibe ninguna visita?

Porque los bots de IA no buscan el archivo de forma especulativa: solo lo acceden cuando una instrucción, un enlace o un índice les indica que existe. Si el archivo no está referenciado activamente, ningún sistema de IA va a buscarlo. Además, las plataformas de AI search como ChatGPT o Perplexity nunca confirmaron que consumen este archivo como señal de ranking.

¿Google considera el llms.txt como un factor para aparecer en AI Overviews o generative AI search?

No. En su guía oficial publicada en mayo de 2026, Google aclaró explícitamente en una sección de "mythbusting" que los archivos machine-readable como llms.txt no son necesarios para aparecer en generative AI search. John Mueller precisó además que el archivo está orientado a herramientas de coding para documentación técnica, no a la visibilidad en Search.

¿Tiene algún caso de uso válido el llms.txt en 2026?

Sí, pero muy específico. El único caso de uso validado empíricamente es la legibilidad para agentes de coding —especialmente Claude-Code de Anthropic— en sitios con documentación técnica. Para sitios de contenido, e-commerce o marketing general, los datos no muestran beneficio medible en términos de citas o visibilidad en AI search.

¿Cómo puedo saber si mi llms.txt está recibiendo visitas de bots de IA?

Con Bot Analytics de Ahrefs, filtrando por Page URL que contenga "llms.txt". La herramienta clasifica las solicitudes por categoría de bot —incluyendo AI assistants, AI search bots y AI crawlers— con datos server-side vía Cloudflare, sin necesidad de JavaScript. Si no hay solicitudes de bots de IA relevantes, el archivo no está generando valor en ese canal.

Fuentes

ahrefs
»Un estudio con 137K sitios pone números a una intuición que muchos tenían
Search Engine Journal
»Qué dice Google: mythbusting oficial y una contradicción resuelta en menos de una semana
Search Engine Journal
»El costo real de apostar por una táctica sin evidencia
ahrefs
»Qué hacer ahora si ya publicaste un llms.txt

Autor

Dante Llanos

CEO & Founder at rubica.io

X / Twitter Quora GitHub Behance Foro 2.0 LinkedIn Foro Beta Instagram Pinterest Quién es Dante?

Dante Llanos es especialista en SEO B2B con más de 14 años de experiencia en Latinoamérica. Dirige rubica.io, una agencia enfocada en que las empresas sean encontradas por los compradores correctos, en Google y en las IAs que hoy influyen en las decisiones de compra.

Ver todas las notas de Dante Llanos →