Challenge
APROPO contaba con un chatbot basado en NLP que ofrecía un bajo nivel de comprensión y un alto coste de mantenimiento, debido al entrenamiento constante que requería. El proyecto buscaba brindar orientación a jóvenes en temas de educación sexual, bienestar emocional y relaciones personales, lo que exigía un sistema con un riesgo mínimo de alucinación y una sensibilidad especial en la comunicación.
El contenido existente estaba diseñado para un entorno NLP tradicional, por lo que fue necesario reconstruir todo el contexto junto a psicólogos y expertos en educación sexual. Además, el sistema debía ser capaz de detectar posibles situaciones de riesgo emocional o psicológico expresadas por los usuarios, activando protocolos específicos de respuesta.
Otro desafío fue la adaptación de las respuestas según la edad y el tono del usuario, incluso cuando esta información no se proporcionaba explícitamente, lo que requería razonamiento generativo adicional. Finalmente, el rendimiento debía mantenerse dentro de los 5 segundos de latencia, pese a la complejidad de un Sistema Multi-Agéntico
Solution
Se desarrolló una arquitectura Agentic RAG compuesta por múltiples Agentes de IA especializados, cada uno con un rol específico dentro del flujo conversacional:
Comprender: detectar la intención, el tono emocional y el nivel de urgencia del usuario.
Planificar: limpiar la consulta y seleccionar la información relevante a recuperar.
Actuar (RAG): ejecutar la búsqueda vectorial y, en caso de baja confianza, reformular y reintentar.
Sintetizar: generar respuestas empáticas, claras e inclusivas en español.
Adaptar: ajustar la respuesta al género y edad del usuario, o inferirlo si no se indica.
Controlar sesgos y seguridad: detectar sesgos o respuestas inapropiadas y reformularlas.
Cerrar: ofrecer seguimiento o recursos adicionales, manteniendo la continuidad de la conversación.
Además, se crearon Evaluadores de IA capaces de medir métricas críticas como alucinación, relevancia, adaptación de tono y context recall. El sistema se integró con WhatsApp, Web e Instagram, adaptando la experiencia a cada canal.
También se diseñaron procesos seguros para la creación y ampliación del contexto, junto con un mecanismo de evolución continua automatizada, que mejora dinámicamente el prompting y la capa de recuperación según los aprendizajes del sistema.
The Results
El nuevo sistema logró un 92% de mejora en la comprensión conversacional y una adherencia al contexto del 97%, lo que se traduce en una tasa de alucinación mínima y una experiencia altamente confiable.
A pesar de llevar solo un mes en producción, el proyecto ha demostrado un rendimiento estable, manteniendo la latencia media por debajo de los 5 segundos y estableciendo una base sólida para medir métricas avanzadas de impacto emocional, precisión temática y satisfacción de usuario en las siguientes fases de despliegue.