En julio de 2021, DeepMind publicó las estructuras predichas de 350.000 proteínas humanas. Para julio de 2022, esa cifra había crecido a más de 200 millones de proteínas, prácticamente todas las catalogadas por la ciencia. Antes de AlphaFold, determinar la estructura tridimensional de una sola proteína por cristalografía de rayos X podía costar entre 50.000 y 100.000 dólares y llevar meses de trabajo experimental. Ese cambio de escala, de proyecto individual a base de datos pública consultable, contiene varias lecciones que los equipos de marketing, CRM y operaciones de datos pueden aplicar sin necesidad de trabajar con biología molecular.

El problema correcto importa más que el modelo

AlphaFold no nació como un proyecto genérico de aprendizaje profundo. El equipo de DeepMind eligió el plegamiento de proteínas porque cumplía tres condiciones concretas: existía un conjunto de datos curados durante 50 años (el Protein Data Bank con más de 170.000 estructuras experimentales), había una métrica de evaluación objetiva (el concurso CASP, celebrado bianualmente desde 1994) y el resultado tenía valor científico inmediato.

En contextos empresariales, este encuadre se ignora con frecuencia. Vemos equipos que despliegan LLMs sobre tickets de soporte sin haber definido qué significa una respuesta correcta, o que entrenan modelos de scoring de leads sin un histórico fiable de conversiones cerradas. La pregunta que importa antes de elegir arquitectura es si el problema tiene datos curados, una métrica de éxito clara y una decisión que cambie según el resultado.

La precisión de AlphaFold vino de combinar enfoques, no de uno solo

AlphaFold 2 alcanzó una precisión mediana de 0,96 ångströms en la categoría más exigente de CASP14, frente a los 2,8 ångströms del segundo clasificado. Ese salto no se debió a una arquitectura única. El sistema combina información evolutiva extraída de alineamientos de secuencias múltiples, una red de atención que razona sobre pares de aminoácidos, y un módulo de estructura que itera geométricamente sobre la predicción.

La traducción a entornos de marketing es directa. Los sistemas que funcionan en producción casi nunca dependen de un solo modelo. Un pipeline de personalización útil suele combinar reglas de negocio, un modelo de propensión entrenado sobre datos propios, embeddings de contenido y un componente generativo para la redacción. Cuando un proveedor promete sustituir todo ese stack con un único modelo de fundación, conviene preguntar qué señales se pierden por el camino.

El valor real apareció cuando los datos se hicieron públicos

Data Innovation, una empresa de IA y datos con sede en Barcelona que construye y opera sistemas inteligentes donde humanos y agentes de IA trabajan juntos, ha documentado que los proyectos que mayor retorno generan no son los que entrenan modelos propietarios desde cero, sino los que tratan los outputs de modelos avanzados como una capa de datos consultable que el resto de la organización puede integrar en sus flujos.

AlphaFold ilustra este patrón. El modelo en sí es relevante, pero el impacto científico viene de la base de datos AlphaFold Protein Structure Database, alojada en EMBL-EBI y consultada por más de 2 millones de investigadores en sus primeros 18 meses. Empresas farmacéuticas como Isomorphic Labs, fundada en 2021, construyen pipelines de descubrimiento de fármacos sobre esas predicciones sin entrenar nada nuevo.

El paralelo organizacional es claro. Si tu equipo de CRM está usando un LLM para clasificar intenciones de cliente, el activo duradero no es el prompt, es la tabla resultante con la intención inferida, la confianza del modelo y el timestamp, conectada a tu warehouse y disponible para los equipos de producto, ventas y atención. Ese tipo de capa permite auditoría, reentrenamiento de modelos downstream y reutilización entre departamentos.

Los límites se entienden mejor con el modelo en producción

AlphaFold predice estructuras estáticas. No modela bien proteínas intrínsecamente desordenadas, no captura interacciones con ligandos pequeños sin extensiones específicas como AlphaFold-Multimer, y su confianza varía mucho entre regiones de la misma proteína. Estos límites se hicieron visibles a medida que los biólogos empezaron a usar la herramienta en problemas reales, no durante el desarrollo.

Lo mismo ocurre con cualquier sistema de IA aplicado a marketing o ventas. Un modelo de attribution puede funcionar bien en agregado y fallar sistemáticamente en segmentos pequeños de alto valor. Un agente conversacional puede manejar el 80% de las consultas y romperse en las preguntas multi-turno donde el cliente cambia de tema. Sin un sistema de evaluación continua, con muestreo manual de outputs y métricas segmentadas, esos fallos pasan desapercibidos durante meses.

Qué hacer la próxima semana

Si tu organización está evaluando dónde aplicar IA en los próximos seis meses, una práctica útil es elegir un problema que cumpla las condiciones de AlphaFold a escala