octa: nuestro modelo fundacional agentic para GTM

octa. Un modelo fundacional agentic para marketing, GTM y CRM.

Construido sobre una base open-source sólida y desarrollado completamente in-house. Un harness y un LLM trabajan en tándem. Ambos son críticos. El corpus de entrenamiento reúne una década de campañas reales de 1,000+ marcas B2B en los archivos de CIENCE y Tenbound. Desde aquí, cada campaña de cliente afina la siguiente fase de entrenamiento.

Leer el deck de progreso
octa
Microsoft
Uber
Google
Okta
Airbnb
Shutterstock
La ventaja de datos

Una década de campañas reales, estructurada para entrenamiento.

Los foundation models están limitados por sus datos de entrenamiento. La web pública les enseña prosa. octa se entrenará con resultados GTM reales. Ese es el moat.

10+ años De datos de entrenamiento

Telemetría continua de campañas desde 2015. Multi-región, multi-industria y multicanal.

1,000+ Marcas en el corpus

Cuentas B2B reales en SaaS, finanzas, salud, manufactura, medios y sector público.

Millones De toques multicanal

Email, voz, SMS, social, chat y landing pages. Cada variante queda registrada con el resultado que obtuvo.

Cientos de miles Respuestas calificadas etiquetadas

Los reps etiquetaron el porqué detrás de cada conversión y descalificación. octa aprenderá de esas etiquetas.

La brecha

Por qué los LLM genéricos fallan en GTM.

GPT-5, Claude y Gemini son excelentes con la prosa. No están construidos para GTM. Nunca han visto a un rep manejar una objeción real, nunca han visto qué 3 líneas de follow-up convierten una respuesta en una reunión y nunca han aprendido la cadencia que supera la alternativa por 11% en un segmento específico.

octa se está construyendo al revés. El modelo parte de resultados reales de campañas: emails, llamadas, respuestas, reuniones, landing pages y cierres de deals. Luego aprende a razonar y escribir encima de eso. Cada output se basa en un toque que históricamente funcionó o no funcionó.

  • LLM genérico: entrenado en la web pública. Sabe cómo se ve un email en frío.
  • octa: entrenado con campañas reales. Sabrá qué email en frío consiguió la reunión.
El origen

De mil SDRs a un modelo.

Una década de campañas de CIENCE y años de investigación de Tenbound generaron la señal base. Capchase aportó ambos archivos a graph8 en 2025. graph8 está convirtiendo el corpus combinado en octa.

  1. 2015

    Se funda CIENCE

    Lanza el servicio de campañas outbound. Desde el primer día: registrar cada toque, cada respuesta, cada reunión agendada y cada motivo de descalificación.

  2. 2015 a 2024

    Mil SDRs, 1,000+ marcas

    Campañas diarias de CIENCE en SaaS, finanzas, salud, manufactura y sector público. Los reps etiquetan el porqué detrás de cada victoria y pérdida. Se acumula una década de resultados GTM etiquetados.

  3. 2025

    Lanza la plataforma graph8

    La plataforma de ventas con IA sale con el harness, los agentes y las integraciones. octa entra al roadmap.

  4. 2025

    David Dulany se une a graph8

    David Dulany se une a graph8 con su amplia experiencia en investigación GTM, marcos de sales development y conocimiento de categoría construido en Tenbound.

  5. 2025

    Capchase se convierte en accionista de graph8

    Capchase se une como accionista de graph8 y aporta a la empresa los archivos de campañas de CIENCE y Tenbound. Las dos líneas complementarias de datos GTM ahora viven dentro de graph8, listas para entrenar a octa.

  6. 2026

    Comienza el entrenamiento de octa

    El preentrenamiento empieza sobre una base open-source sólida, usando el corpus combinado de CIENCE + Tenbound. Los primeros heads del modelo apuntan a copy, calificación y páginas. octa Bench se construye con campañas reales anonimizadas.

  7. En marcha

    octa-mini, octa, octa-reasoning

    Tres tamaños de modelo en desarrollo: redacción de baja latencia, ejecución agentic balanceada y razonamiento profundo. La señal inicial muestra lift medible sobre el LLM base. Publicaremos benchmarks cuando sobrevivan la evaluación.

El corpus de entrenamiento

Las marcas cuyas campañas entrenarán a octa.

Más de 1,000+ marcas B2B ejecutaron campañas con CIENCE entre 2015 y 2024. Los resultados, las respuestas, las objeciones, las reuniones agendadas y las landing pages que convirtieron se vuelven el corpus de entrenamiento de octa. Aquí mostramos el top 5 por segmento como contexto. Ver la biblioteca completa de casos en cience.com

Enterprise

1,000+ empleados
Microsoft
Google
IBM
Uber
Airbnb

Mercado medio

200 a 999 empleados
Okta
Shutterstock
Nasdaq
Dolby
Events.com

SMB

50 a 199 empleados
Bambora
Igenomix
Sunlight
Harris
ICUC

Startups

Menos de 50 empleados
Segment
Wrike
Sendbird
Instapage
CosmosID

Y 1,000+ marcas más en el archivo de CIENCE. Explorar la biblioteca completa de casos

Cómo aprende octa

Ingerir. Etiquetar. Preentrenamiento continuo. RL de horizonte largo. Evaluar + publicar.

Un loop continuo. Entran eventos reales de campañas. Reps humanos etiquetan el porqué. octa se reentrena. octa Bench califica. Nuevos pesos se publican en cada org cliente. La siguiente campaña alimenta el siguiente loop.

Ingerir
Paso 1

Ingerir

Entra cada evento de campaña: envíos, aperturas, respuestas, llamadas, reuniones, etapas de deal, sesiones en landing page y envíos de formularios. Multicanal, estructurado y con marca de tiempo.

Etiquetar
Paso 2

Etiquetar

SDRs y AEs humanos etiquetan el porqué: qué líneas funcionaron, qué objeciones mataron el deal, qué variante de landing page convirtió un clic en una reunión.

Preentrenar
Paso 3

Preentrenamiento continuo

Elegir un modelo base open-source sólido. Ejecutar una fase de preentrenamiento continuo a gran escala sobre el corpus GTM. Objetivo: conocimiento profundo del trabajo específico, no fluidez genérica de chatbot.

RL
Paso 4

RL de horizonte largo

Rollouts de tareas GTM realistas: escribir el siguiente mensaje, planear la secuencia, generar la landing page, calificar la respuesta. La penalización por longitud y la autosíntesis mantienen encaminadas las sesiones largas.

Publicar
Paso 5

Evaluar + publicar

octa Bench reproduce campañas históricas reservadas de punta a punta. Nuevos pesos se publican en cada org de graph8. Los resultados vuelven al corpus. El loop se cierra.

El flywheel

Cada campaña afina la siguiente.

El día que un cliente activa graph8, sus campañas empiezan a contribuir al entrenamiento de octa. Las objeciones de esta semana se convierten en etiquetas para el fine-tune de la próxima. Cada respuesta, cada reunión y cada conversión de landing page es un voto que actualiza el modelo.

Los prompts estáticos se deterioran. octa compone aprendizaje. Un modelo entrenado con resultados GTM reales hoy es más preciso que el mismo modelo hace un trimestre y mucho más preciso que un LLM genérico que nunca ha ejecutado una campaña.

La línea de modelos

Tres tamaños de modelo, una sola base.

El mismo corpus de entrenamiento, tres formas de despliegue. Elegimos el modelo correcto para la tarea. La latencia importa en el inbox. El razonamiento importa en la revisión de deals. Ambos importan al generar landing pages.

Modelo

octa-mini

Head de redacción de baja latencia

Pequeño, rápido y siempre activo. Redacta emails, completa variables de secuencia y califica intención de respuesta en milisegundos dentro del inbox y el marcador.

Modelo

octa

Ejecución agentic balanceada

El modelo operativo predeterminado. Planea secuencias, califica respuestas, genera landing pages, escribe follow-ups y agenda reuniones.

Modelo

octa-reasoning

Razonamiento profundo de varios pasos

Para trabajo GTM complejo: estrategia a nivel cuenta, orquestación multicanal, manejo de objeciones edge-case y forecast por etapa de deal.

El deck de progreso

Cómo estamos construyendo octa.

Cinco slides breves sobre el trabajo en curso. Seguimos una ruta de investigación que refleja el campo en general: elegir una base open-source sólida, ejecutar preentrenamiento continuo sobre el dominio, usar reinforcement learning de horizonte largo para moldear comportamiento, construir un benchmark interno con consultas realistas y publicar. Esto es lo que estamos haciendo para GTM. Nada de esto está terminado. Los slides describen el plan.

01 Tres subobjetivos

Conocimiento GTM profundo. Tareas difíciles hasta completarse. Movimientos realistas.

octa se está construyendo alrededor de tres objetivos. Conocimiento real del dominio de marketing, ventas y CRM, no fluidez genérica de chatbot. Capacidad de ejecutar tareas GTM difíciles de punta a punta hasta una reunión agendada o una landing page generada. Y ganar en movimientos realistas que nuestros clientes ejecutan todos los días, no en benchmarks públicos contaminados.

02 Conocimiento

Preentrenamiento continuo sobre una base open-source sólida.

Empezamos con un modelo base open-weight sólido. Ejecutamos una fase de preentrenamiento continuo a gran escala sobre el corpus de CIENCE y la telemetría viva de graph8. El punto no es agregar pulido general de chatbot. El punto es empujar el modelo hacia el trabajo específico que se le pedirá hacer todos los días dentro de un equipo GTM. Primero contexto corto, después extensión a contexto largo y fine-tuning supervisado para completar la forma agentic.

03 RL de horizonte largo

Rollouts de campañas reales. Penalización por longitud. Autosíntesis.

La fase principal de entrenamiento será reinforcement learning de horizonte largo. Reunimos un conjunto grande de problemas GTM realistas: escribir el siguiente toque, recuperar la respuesta estancada, planear la cadencia multicanal, generar la landing page, calificar el inbound. Ejecutamos muchos rollouts por problema, los calificamos con resultados reales y actualizamos hacia los ganadores. Una penalización no lineal por longitud mantiene cortas las tareas cortas y deja que las difíciles corran más tiempo. La autosíntesis permite que el agente supere la ventana de contexto en tareas que lo necesitan.

04 Evaluación

octa Bench: consultas reales anonimizadas de campañas, no leaderboards públicos.

Los benchmarks públicos de LLM miden trivia y acertijos de código. Ninguno mide si el siguiente mensaje consigue la reunión. octa Bench se está construyendo con consultas reales anonimizadas tomadas del corpus, mal estructuradas como las solicitudes GTM reales, con ambigüedad realista que el agente debe resolver. Calificamos contra el resultado que el humano realmente obtuvo. El bench separará los modelos buenos en GTM de los modelos que solo suenan plausibles.

05 Roadmap

octa-mini hoy, octa después, octa-reasoning pronto y más canales luego.

Los primeros tres tamaños de modelo apuntan a las formas GTM más comunes: redacción rápida (octa-mini), ejecución agentic balanceada (octa) y razonamiento profundo (octa-reasoning). La siguiente fase de preentrenamiento ampliará el corpus para incluir transcripciones de voz a escala, árboles DOM completos de landing pages y creatividades publicitarias vivas. Las metas vienen antes que los benchmarks. Publicaremos números cuando sobrevivan la evaluación.

El trabajo, los datos y el modelo son propios de graph8. No vamos a citar números que no hayamos ganado.

Metas + señal inicial

Para qué estamos optimizando octa.

No vamos a publicar benchmarks que no hayamos ganado. Las evaluaciones internas de hoy muestran que octa-mini, octa y octa-reasoning entregan lift medible sobre el LLM open-source base en tareas GTM. Los números son pequeños, pero consistentes, y tienden al alza a medida que crecen el corpus y las etiquetas. Resultados completos cuando octa Bench esté listo para producción.

Qué medimos
Meta
Tasa de respuesta en outbound en frío
Materialmente por encima de líneas base de LLM genéricos
Tasa de reuniones desde respuesta positiva
Convertir más interés inbound en invitaciones de calendario
Precisión de calificación
Enrutar correctamente respuestas con fit y sin fit
Conversión de landing page
Generar páginas que convierten clics en pipeline

Los números se mantienen privados hasta que sobrevivan una evaluación reservada contra el corpus. Habla con nuestro equipo sobre el segmento que coincide con tu motion. Reproduciremos una de tus campañas pasadas y te mostraremos qué habría enviado octa.

Lado a lado

octa vs LLMs generales, por tarea GTM.

Mismo input, entrenamiento distinto. Los LLMs genéricos leen la web pública. octa observará una década de campañas y aprenderá a publicar páginas, no solo párrafos.

Email en frío
octa

Elige el opener al que esta persona realmente respondió en campañas históricas.

Genérico

Escribe prosa plausible sin vínculo con una tasa real de respuesta.

Respuesta de calificación
octa

Reconoce el patrón de objeción y redacta la respuesta que reabrió la conversación en datos pasados.

Genérico

Se disculpa de forma genérica. Pierde el hilo.

Plan de secuencia
octa

Sabe la cadencia que supera la alternativa en este segmento y qué canal cambiar a mitad de secuencia.

Genérico

Vuelve por defecto a un drip genérico de 5 emails. Igual que cualquier otro vendor.

Landing page
octa

Genera layout, headline, formulario y bloque de prueba basados en lo que convirtió para ofertas similares.

Genérico

Genera copy. Todavía contratas a un diseñador y a un builder.

octa

Seis heads especializados, un solo modelo.

octa no es un único modelo de chat envuelto en un prompt. Cada trabajo GTM tiene su propio head, entrenado con la parte del corpus que importa para ese trabajo y reforzado con su propia señal de resultado. Las landing pages son de primera clase: se generan como páginas completas, no solo como copy.

Research

Research

Construye briefs de cuenta, documentos de persona y mapas de competidores desde la web abierta más tu contexto privado.

head de octa
Copy

Copy

Redacta emails, ads y secuencias con la voz de tu marca. Se califica contra tasas históricas de respuesta del corpus.

head de octa
Pages

Pages

Genera landing pages completas: layout, headline, formulario y prueba. No solo texto. Entrenado con lo que convirtió.

head de octa
Qualify

Qualify

Lee respuestas inbound y transcripciones de reuniones. Califica fit. Enruta al rep correcto con contexto adjunto.

head de octa
Coach

Coach

Revisa grabaciones de llamadas e hilos de respuestas. Muestra qué funcionó. Da a los reps la siguiente mejor acción.

head de octa
Forecast

Forecast

Predice conversión de pipeline desde señales de etapa. Marca deals en riesgo antes de la fecha de cierre.

head de octa
En producción

Qué está haciendo octa ahora mismo.

Activo en cada org cliente de graph8. Cada interacción suma al corpus que entrena la siguiente versión.

24 / 7

El pipeline de octa redacta, genera y califica dentro de cada org cliente de graph8

6 heads

Cada uno especializado en un trabajo GTM. Cada uno se reentrena cuando llegan nuevos resultados.

Cada respuesta

Registrada, puntuada y reincorporada al siguiente ciclo de entrenamiento.

Ver octa en acción

Trae tu motion. octa ya conoce los patrones.

Habla con nuestro equipo. Reproduciremos una de tus campañas pasadas con octa y te mostraremos las líneas, la cadencia, la landing page que habría publicado y las reuniones que el modelo habría agendado.

Leer sobre octa² ->

Esta es la historia del modelo. La historia del proceso vive en octa²: la infraestructura de seis algoritmos que corren alrededor del modelo. Las dos páginas van en par.

Las marcas mencionadas arriba contrataron a CIENCE o Tenbound para servicios de campaña entre 2015 y 2024. Ambos archivos de campañas se aportaron a graph8 en 2025 vía Capchase, cuando Capchase entró como accionista. David Dulany se unió a graph8 el mismo año con su expertise construido en Tenbound. Los logos se usan como referencia histórica del corpus de entrenamiento bajo fair use o con permiso. La referencia no implica respaldo de graph8 como plataforma actual. Hay 1,000+ casos adicionales en cience.com/case-studies.