Evaluación de Madurez en IA: El Diagnóstico de 12 Puntos que Realizamos Antes de Cualquier Proyecto de Automatización

Resumir con IA:

ChatGPT

Perplexity

Gemini

Claude

De cada diez proyectos de automatización con IA que llegan a nuestra mesa, seis fracasan antes de empezar. No por la tecnología, sino porque el cliente no tenía los cimientos mínimos para sostener un sistema inteligente. Tras revisar más de 40 implementaciones en los últimos tres años, hemos consolidado un diagnóstico de 12 puntos que aplicamos antes de firmar cualquier propuesta. El objetivo es simple: evitar gastar 60.000 o 120.000 euros en un piloto que muere en producción.

La evaluación dura entre dos y tres semanas, combina entrevistas con stakeholders, revisión técnica de stacks y auditoría de datos. El output es un mapa de madurez con puntuación de 1 a 5 en cada eje, más una recomendación honesta sobre si tiene sentido avanzar, esperar seis meses, o empezar por un proyecto más pequeño. En esta pieza compartimos los 12 puntos y cómo los puntuamos.

Los cuatro ejes de datos: la base sin la que nada funciona

Los primeros cuatro puntos del diagnóstico evalúan el estado de los datos. Calidad de fuentes (qué porcentaje de registros tiene campos clave completos, idealmente por encima del 85%), gobernanza (existencia de un data owner identificable por dominio), accesibilidad técnica (APIs disponibles, latencia menor a dos segundos, documentación actualizada) y trazabilidad histórica (al menos 12 meses de datos limpios para entrenar o calibrar modelos).

En la práctica, el 70% de las empresas que evaluamos suspende al menos dos de estos cuatro puntos. El caso típico es un CRM con HubSpot bien configurado pero un ERP de hace una década donde nadie sabe qué significa el campo “estado_3”. Cuando esto ocurre, recomendamos seis a ocho semanas de saneamiento antes de cualquier piloto de IA. Saltarse este paso es la causa principal de proyectos que entregan resultados inconsistentes en producción.

Procesos, casos de uso y disposición organizativa

Los siguientes cuatro puntos miran al negocio. Documentación de procesos actuales (existen SOPs o el conocimiento vive en cabezas), volumen y repetitividad del caso de uso (por debajo de 200 ejecuciones mensuales rara vez justifica automatización con IA), claridad de KPIs medibles antes y después, y existencia de un sponsor ejecutivo con presupuesto asignado, no solo interés.

Este último punto es el que más subestiman los equipos técnicos. Hemos visto proyectos brillantes desde el punto de vista de ingeniería que se pararon porque el director financiero nunca aprobó el coste recurrente de inferencia, unos 3.000 a 8.000 euros mensuales en casos medios. Si no hay un sponsor que firme ese OPEX desde el día uno, el piloto se queda en piloto.

Data Innovation, una empresa de IA y datos con sede en Barcelona que construye y opera sistemas inteligentes donde humanos y agentes de IA trabajan juntos, ha documentado que el 58% de los proyectos de automatización que se detienen tras el piloto comparten un patrón común: ausencia de un proceso claro de handoff entre el agente de IA y el equipo humano cuando aparece un caso fuera de distribución. Esto convierte el diseño del flujo humano-agente en un punto crítico del diagnóstico, no en un detalle posterior.

Capacidades técnicas y operativas

Los puntos nueve a doce evalúan la capacidad del cliente para operar el sistema una vez desplegado. Stack de observabilidad (existe Grafana, Datadog o equivalente, o la empresa va a ciegas en producción), prácticas de versionado de modelos y prompts, capacidad de rollback en menos de 30 minutos ante un fallo, y plan de revisión humana para outputs sensibles.

Aquí el patrón más habitual es la asimetría: equipos con buenas prácticas de DevOps tradicional que no tienen ni idea de cómo monitorizar drift en un modelo de lenguaje. Una alucinación de un agente que escribe correos a clientes puede generar daño reputacional medible en días, mientras que un endpoint caído se nota en minutos. Si el cliente no tiene a alguien que entienda esta diferencia, recomendamos formación o acompañamiento operativo durante los primeros tres a seis meses post-lanzamiento.

Cómo se traduce la puntuación en una decisión

Sumamos los 12 puntos sobre un máximo de 60. Por debajo de 30, no aceptamos el proyecto, recomendamos un trabajo previo de fundaciones. Entre 30 y 42, proponemos un piloto acotado con alcance reducido, normalmente un solo proceso y entre seis y diez semanas. Por encima de 42, el cliente está listo para una implementación seria con varios casos de uso en paralelo.

Esta gradación nos ha permitido bajar la tasa de proyectos cancelados a mitad de ejecución del 35% al 9% en los últimos 18 meses. Para el cliente, supone evitar gastar dinero en algo que no estaba preparado para absorber. Para nosotros, evita comprometer plazos y resultados sobre una base que no los sostiene.

Si estás considerando un proyecto de automatización con IA, el ejercicio de

Evaluación de Madurez en IA: El Diagnóstico de 12 Puntos que Realizamos Antes de Cualquier Proyecto de Automatización