Members-Only
Recent Talks & Demos are for members only
You must be an AI Tinkerers active member to view these talks and demos.
Real-Time LLaMA Voice Assistant
Learn to build a real‑time voice AI assistant for English practice using React, Whisper transcription, LLaMA 3.2 generation, Edge TTS, and Ollama API.
Esta aplicación de asistente de voz basada en IA permite una conversación en tiempo real entre los usuarios y un modelo de inteligencia artificial. Diseñada para practicar los contenidos del curso de inglés de manera interactiva, la aplicación emplea tecnologías avanzadas de procesamiento de audio y lenguaje natural para ofrecer una experiencia fluida y natural.
La aplicación funciona conectando un frontend diseñado con React para la interfaz gráfica del usuario con un backend que utiliza el modelo Whisper para la transcripción de audio en tiempo real, LLaMA 3.2 1B para la generación de respuestas, y Edge TTS para la síntesis de voz. Además, el backend se conecta directamente a la aplicación Ollama a través de su API utilizando un localhost, lo que facilita el procesamiento eficiente de las interacciones.
Los usuarios pueden iniciar una conversación a través de su micrófono, y el sistema convierte su voz en texto, procesa la información y devuelve una respuesta auditiva utilizando tecnologías de síntesis de voz. Esto permite una comunicación fluida donde el modelo responde a preguntas y refuerza el aprendizaje de los temas vistos en el curso.
Esta herramienta representa un enfoque innovador para apoyar el desarrollo de habilidades lingüísticas, utilizando modelos de machine learning para crear una práctica interactiva, personalizada y completamente automatizada.