Por qué conductual | BotConduct

El panorama

Enfoque	Qué mide	Limitación
Testing de modelos	Vulnerabilidades a nivel de modelo antes del despliegue	No captura el contexto de despliegue, system prompts ni integraciones de herramientas
Gateways en tiempo real	Patrones de ataque al momento de la solicitud	Reactivo — bloquea después de la detección, no evalúa la resiliencia
Documentación de cumplimiento	Intención declarada y procesos	Mide lo que usted dice que hace, no lo que realmente sucede
Acreditación por auditoría	Cumplimiento de procesos organizacionales	Foto anual. Costosa. No prueba el comportamiento del agente directamente
Evaluación conductual	Comportamiento real bajo presión adversarial	Complementaria a todas las anteriores — la capa que ninguna cubre

Los vacíos

Vacío 1

El testing de modelos no prueba el agente desplegado

Un modelo que es seguro en aislamiento puede ser inseguro cuando se envuelve en un system prompt, se conecta a herramientas y se despliega en un contexto de negocio específico. El agente es más que el modelo. Probar solo el modelo pasa por alto la superficie de ataque que importa.

Vacío 2

Los gateways en tiempo real no miden la resiliencia

Un gateway que bloquea un ataque no le dice si su agente habría resistido por sí mismo. Cuando el gateway tiene una brecha — y todos la tienen — la pregunta es si su agente tiene robustez intrínseca. Solo la evaluación adversarial responde eso.

Vacío 3

La documentación no prueba el comportamiento

Usted puede documentar prácticas de seguridad perfectas y aun así tener un agente que filtra datos bajo presión. Los reguladores están empezando a entender esto. El Artículo 15 pide evidencia de robustez — no documentación de robustez.

Vacío 4

Las auditorías anuales no detectan lo que cambia entre auditorías

Su agente cumplía con los requisitos el día de la auditoría. Fue actualizado tres veces desde entonces. El modelo fue reemplazado. Se agregó una nueva integración de herramientas. ¿Sigue cumpliendo? Sin evidencia conductual continua, está adivinando.

Nuestra posición

No reemplazamos ninguno de los enfoques anteriores. Los complementamos a todos.

Use testing de modelos antes del despliegue. Use gateways en tiempo real en producción. Documente sus procesos. Audítese anualmente.

Y use evaluación conductual para verificar que lo que construyó realmente se comporta como usted pretendía — bajo las condiciones que causan incidentes reales.

Esa es la capa que falta. Eso es lo que proporcionamos. Observado. Adversarial. Firmado.

Por qué conductual.