Descripción del cargo: Equipo reducido, autodirigido, con sentido de propiedad, iteración rápida y sin burocracia.Responsabilidades clave Optimizar la inferencia de voz basada en transformers para lograr latencias ultrabajas. Ajustar modelos para la comprensión y síntesis de emociones. Identificar cuellos de botella y optimizar canalizaciones de ML en streaming. Diseñar y desarrollar SDKs para integrar voz en aplicaciones de consumo. Colaborar con los fundadores en arquitectura y validación con usuarios. Ser responsable de todo el sistema de ML: desde diseño de modelos hasta despliegue de infraestructura. Stack Tecnológico PyTorch CUDA vLLM SGLang Streaming Docker Kubernetes Requisitos para el cargo: Educación / Titulo: Administrador de sistemas de informacion Administrador de sistemas e informática Administrador de sistemas y de oficina bilingüe Ingeniero de sistemas Ingeniero de sistemas con énfasis en administración e informática Idiomas: Inglés Nivel de estudio: Universitaria Meses de experiencia: 24