octa. Un modelo fundacional agentic para marketing, GTM y CRM.
Construido sobre una base open-source sólida y desarrollado completamente in-house. Un harness y un LLM trabajan en tándem. Ambos son críticos. El corpus de entrenamiento reúne una década de campañas reales de 1,000+ marcas B2B en los archivos de CIENCE y Tenbound. Desde aquí, cada campaña de cliente afina la siguiente fase de entrenamiento.
Una década de campañas reales, estructurada para entrenamiento.
Los foundation models están limitados por sus datos de entrenamiento. La web pública les enseña prosa. octa se entrenará con resultados GTM reales. Ese es el moat.
Telemetría continua de campañas desde 2015. Multi-región, multi-industria y multicanal.
Cuentas B2B reales en SaaS, finanzas, salud, manufactura, medios y sector público.
Email, voz, SMS, social, chat y landing pages. Cada variante queda registrada con el resultado que obtuvo.
Los reps etiquetaron el porqué detrás de cada conversión y descalificación. octa aprenderá de esas etiquetas.
Por qué los LLM genéricos fallan en GTM.
GPT-5, Claude y Gemini son excelentes con la prosa. No están construidos para GTM. Nunca han visto a un rep manejar una objeción real, nunca han visto qué 3 líneas de follow-up convierten una respuesta en una reunión y nunca han aprendido la cadencia que supera la alternativa por 11% en un segmento específico.
octa se está construyendo al revés. El modelo parte de resultados reales de campañas: emails, llamadas, respuestas, reuniones, landing pages y cierres de deals. Luego aprende a razonar y escribir encima de eso. Cada output se basa en un toque que históricamente funcionó o no funcionó.
- LLM genérico: entrenado en la web pública. Sabe cómo se ve un email en frío.
- octa: entrenado con campañas reales. Sabrá qué email en frío consiguió la reunión.
De mil SDRs a un modelo.
Una década de campañas de CIENCE y años de investigación de Tenbound generaron la señal base. Capchase aportó ambos archivos a graph8 en 2025. graph8 está convirtiendo el corpus combinado en octa.
- 2015
Se funda CIENCE
Lanza el servicio de campañas outbound. Desde el primer día: registrar cada toque, cada respuesta, cada reunión agendada y cada motivo de descalificación.
- 2015 a 2024
Mil SDRs, 1,000+ marcas
Campañas diarias de CIENCE en SaaS, finanzas, salud, manufactura y sector público. Los reps etiquetan el porqué detrás de cada victoria y pérdida. Se acumula una década de resultados GTM etiquetados.
- 2025
Lanza la plataforma graph8
La plataforma de ventas con IA sale con el harness, los agentes y las integraciones. octa entra al roadmap.
- 2025
David Dulany se une a graph8
David Dulany se une a graph8 con su amplia experiencia en investigación GTM, marcos de sales development y conocimiento de categoría construido en Tenbound.
- 2025
Capchase se convierte en accionista de graph8
Capchase se une como accionista de graph8 y aporta a la empresa los archivos de campañas de CIENCE y Tenbound. Las dos líneas complementarias de datos GTM ahora viven dentro de graph8, listas para entrenar a octa.
- 2026
Comienza el entrenamiento de octa
El preentrenamiento empieza sobre una base open-source sólida, usando el corpus combinado de CIENCE + Tenbound. Los primeros heads del modelo apuntan a copy, calificación y páginas. octa Bench se construye con campañas reales anonimizadas.
- En marcha
octa-mini, octa, octa-reasoning
Tres tamaños de modelo en desarrollo: redacción de baja latencia, ejecución agentic balanceada y razonamiento profundo. La señal inicial muestra lift medible sobre el LLM base. Publicaremos benchmarks cuando sobrevivan la evaluación.
Las marcas cuyas campañas entrenarán a octa.
Más de 1,000+ marcas B2B ejecutaron campañas con CIENCE entre 2015 y 2024. Los resultados, las respuestas, las objeciones, las reuniones agendadas y las landing pages que convirtieron se vuelven el corpus de entrenamiento de octa. Aquí mostramos el top 5 por segmento como contexto. Ver la biblioteca completa de casos en cience.com
Enterprise
1,000+ empleadosMercado medio
200 a 999 empleadosSMB
50 a 199 empleados
Startups
Menos de 50 empleados
Y 1,000+ marcas más en el archivo de CIENCE. Explorar la biblioteca completa de casos
Ingerir. Etiquetar. Preentrenamiento continuo. RL de horizonte largo. Evaluar + publicar.
Un loop continuo. Entran eventos reales de campañas. Reps humanos etiquetan el porqué. octa se reentrena. octa Bench califica. Nuevos pesos se publican en cada org cliente. La siguiente campaña alimenta el siguiente loop.
Ingerir
Entra cada evento de campaña: envíos, aperturas, respuestas, llamadas, reuniones, etapas de deal, sesiones en landing page y envíos de formularios. Multicanal, estructurado y con marca de tiempo.
Etiquetar
SDRs y AEs humanos etiquetan el porqué: qué líneas funcionaron, qué objeciones mataron el deal, qué variante de landing page convirtió un clic en una reunión.
Preentrenamiento continuo
Elegir un modelo base open-source sólido. Ejecutar una fase de preentrenamiento continuo a gran escala sobre el corpus GTM. Objetivo: conocimiento profundo del trabajo específico, no fluidez genérica de chatbot.
RL de horizonte largo
Rollouts de tareas GTM realistas: escribir el siguiente mensaje, planear la secuencia, generar la landing page, calificar la respuesta. La penalización por longitud y la autosíntesis mantienen encaminadas las sesiones largas.
Evaluar + publicar
octa Bench reproduce campañas históricas reservadas de punta a punta. Nuevos pesos se publican en cada org de graph8. Los resultados vuelven al corpus. El loop se cierra.
Cada campaña afina la siguiente.
El día que un cliente activa graph8, sus campañas empiezan a contribuir al entrenamiento de octa. Las objeciones de esta semana se convierten en etiquetas para el fine-tune de la próxima. Cada respuesta, cada reunión y cada conversión de landing page es un voto que actualiza el modelo.
Los prompts estáticos se deterioran. octa compone aprendizaje. Un modelo entrenado con resultados GTM reales hoy es más preciso que el mismo modelo hace un trimestre y mucho más preciso que un LLM genérico que nunca ha ejecutado una campaña.
Tres tamaños de modelo, una sola base.
El mismo corpus de entrenamiento, tres formas de despliegue. Elegimos el modelo correcto para la tarea. La latencia importa en el inbox. El razonamiento importa en la revisión de deals. Ambos importan al generar landing pages.
octa-mini
Head de redacción de baja latenciaPequeño, rápido y siempre activo. Redacta emails, completa variables de secuencia y califica intención de respuesta en milisegundos dentro del inbox y el marcador.
octa
Ejecución agentic balanceadaEl modelo operativo predeterminado. Planea secuencias, califica respuestas, genera landing pages, escribe follow-ups y agenda reuniones.
octa-reasoning
Razonamiento profundo de varios pasosPara trabajo GTM complejo: estrategia a nivel cuenta, orquestación multicanal, manejo de objeciones edge-case y forecast por etapa de deal.
Cómo estamos construyendo octa.
Cinco slides breves sobre el trabajo en curso. Seguimos una ruta de investigación que refleja el campo en general: elegir una base open-source sólida, ejecutar preentrenamiento continuo sobre el dominio, usar reinforcement learning de horizonte largo para moldear comportamiento, construir un benchmark interno con consultas realistas y publicar. Esto es lo que estamos haciendo para GTM. Nada de esto está terminado. Los slides describen el plan.
Conocimiento GTM profundo. Tareas difíciles hasta completarse. Movimientos realistas.
octa se está construyendo alrededor de tres objetivos. Conocimiento real del dominio de marketing, ventas y CRM, no fluidez genérica de chatbot. Capacidad de ejecutar tareas GTM difíciles de punta a punta hasta una reunión agendada o una landing page generada. Y ganar en movimientos realistas que nuestros clientes ejecutan todos los días, no en benchmarks públicos contaminados.
Preentrenamiento continuo sobre una base open-source sólida.
Empezamos con un modelo base open-weight sólido. Ejecutamos una fase de preentrenamiento continuo a gran escala sobre el corpus de CIENCE y la telemetría viva de graph8. El punto no es agregar pulido general de chatbot. El punto es empujar el modelo hacia el trabajo específico que se le pedirá hacer todos los días dentro de un equipo GTM. Primero contexto corto, después extensión a contexto largo y fine-tuning supervisado para completar la forma agentic.
Rollouts de campañas reales. Penalización por longitud. Autosíntesis.
La fase principal de entrenamiento será reinforcement learning de horizonte largo. Reunimos un conjunto grande de problemas GTM realistas: escribir el siguiente toque, recuperar la respuesta estancada, planear la cadencia multicanal, generar la landing page, calificar el inbound. Ejecutamos muchos rollouts por problema, los calificamos con resultados reales y actualizamos hacia los ganadores. Una penalización no lineal por longitud mantiene cortas las tareas cortas y deja que las difíciles corran más tiempo. La autosíntesis permite que el agente supere la ventana de contexto en tareas que lo necesitan.
octa Bench: consultas reales anonimizadas de campañas, no leaderboards públicos.
Los benchmarks públicos de LLM miden trivia y acertijos de código. Ninguno mide si el siguiente mensaje consigue la reunión. octa Bench se está construyendo con consultas reales anonimizadas tomadas del corpus, mal estructuradas como las solicitudes GTM reales, con ambigüedad realista que el agente debe resolver. Calificamos contra el resultado que el humano realmente obtuvo. El bench separará los modelos buenos en GTM de los modelos que solo suenan plausibles.
octa-mini hoy, octa después, octa-reasoning pronto y más canales luego.
Los primeros tres tamaños de modelo apuntan a las formas GTM más comunes: redacción rápida (octa-mini), ejecución agentic balanceada (octa) y razonamiento profundo (octa-reasoning). La siguiente fase de preentrenamiento ampliará el corpus para incluir transcripciones de voz a escala, árboles DOM completos de landing pages y creatividades publicitarias vivas. Las metas vienen antes que los benchmarks. Publicaremos números cuando sobrevivan la evaluación.
El trabajo, los datos y el modelo son propios de graph8. No vamos a citar números que no hayamos ganado.
Para qué estamos optimizando octa.
No vamos a publicar benchmarks que no hayamos ganado. Las evaluaciones internas de hoy muestran que octa-mini, octa y octa-reasoning entregan lift medible sobre el LLM open-source base en tareas GTM. Los números son pequeños, pero consistentes, y tienden al alza a medida que crecen el corpus y las etiquetas. Resultados completos cuando octa Bench esté listo para producción.
Los números se mantienen privados hasta que sobrevivan una evaluación reservada contra el corpus. Habla con nuestro equipo sobre el segmento que coincide con tu motion. Reproduciremos una de tus campañas pasadas y te mostraremos qué habría enviado octa.
octa vs LLMs generales, por tarea GTM.
Mismo input, entrenamiento distinto. Los LLMs genéricos leen la web pública. octa observará una década de campañas y aprenderá a publicar páginas, no solo párrafos.
Elige el opener al que esta persona realmente respondió en campañas históricas.
Escribe prosa plausible sin vínculo con una tasa real de respuesta.
Reconoce el patrón de objeción y redacta la respuesta que reabrió la conversación en datos pasados.
Se disculpa de forma genérica. Pierde el hilo.
Sabe la cadencia que supera la alternativa en este segmento y qué canal cambiar a mitad de secuencia.
Vuelve por defecto a un drip genérico de 5 emails. Igual que cualquier otro vendor.
Genera layout, headline, formulario y bloque de prueba basados en lo que convirtió para ofertas similares.
Genera copy. Todavía contratas a un diseñador y a un builder.
Seis heads especializados, un solo modelo.
octa no es un único modelo de chat envuelto en un prompt. Cada trabajo GTM tiene su propio head, entrenado con la parte del corpus que importa para ese trabajo y reforzado con su propia señal de resultado. Las landing pages son de primera clase: se generan como páginas completas, no solo como copy.
Research
Construye briefs de cuenta, documentos de persona y mapas de competidores desde la web abierta más tu contexto privado.
Copy
Redacta emails, ads y secuencias con la voz de tu marca. Se califica contra tasas históricas de respuesta del corpus.
Pages
Genera landing pages completas: layout, headline, formulario y prueba. No solo texto. Entrenado con lo que convirtió.
Qualify
Lee respuestas inbound y transcripciones de reuniones. Califica fit. Enruta al rep correcto con contexto adjunto.
Coach
Revisa grabaciones de llamadas e hilos de respuestas. Muestra qué funcionó. Da a los reps la siguiente mejor acción.
Forecast
Predice conversión de pipeline desde señales de etapa. Marca deals en riesgo antes de la fecha de cierre.
Qué está haciendo octa ahora mismo.
Activo en cada org cliente de graph8. Cada interacción suma al corpus que entrena la siguiente versión.
El pipeline de octa redacta, genera y califica dentro de cada org cliente de graph8
Cada uno especializado en un trabajo GTM. Cada uno se reentrena cuando llegan nuevos resultados.
Registrada, puntuada y reincorporada al siguiente ciclo de entrenamiento.
Trae tu motion. octa ya conoce los patrones.
Habla con nuestro equipo. Reproduciremos una de tus campañas pasadas con octa y te mostraremos las líneas, la cadencia, la landing page que habría publicado y las reuniones que el modelo habría agendado.
Esta es la historia del modelo. La historia del proceso vive en octa²: la infraestructura de seis algoritmos que corren alrededor del modelo. Las dos páginas van en par.
Las marcas mencionadas arriba contrataron a CIENCE o Tenbound para servicios de campaña entre 2015 y 2024. Ambos archivos de campañas se aportaron a graph8 en 2025 vía Capchase, cuando Capchase entró como accionista. David Dulany se unió a graph8 el mismo año con su expertise construido en Tenbound. Los logos se usan como referencia histórica del corpus de entrenamiento bajo fair use o con permiso. La referencia no implica respaldo de graph8 como plataforma actual. Hay 1,000+ casos adicionales en cience.com/case-studies.