CLOSED
S&PNASDAQDOWR2KVIXAAPLMSFTNVDAGOOGLMETAAMZNTSLAAVGOGOLDWTIUSDPEN
Yahoo · 60s · delay ~15min
LIVE
BTCETHSOLXRPADABNBDOGE
CoinGecko · 30s
Alibaba Lanza Qwen3.5: Traducción en Tiempo Real en 60 Idiomas
Papers

Alibaba Lanza Qwen3.5: Traducción en Tiempo Real en 60 Idiomas

MarkTechPost (AI/ML News)20 de mayo de 2026Cortesia de MarkTechPost (AI/ML News)

Segun MarkTechPost (AI/ML News), el equipo de Alibaba Qwen ha presentado una nueva tecnología de inteligencia artificial que permite la traducción en tiempo real de múltiples idiomas con una latencia de solo 2.8 segundos. Esta capacidad, denominada Qwen3.5-LiveTranslate-Flash, permite interpretar hablantes en simultáneo, sin esperar que finalice una oración. El avance supera notablemente la versión anterior, que solo soportaba 18 idiomas con una latencia de alrededor de tres segundos. La nueva versión amplía su cobertura a 60 idiomas en entrada y añade como salida la generación de voz en 29 idiomas, lo que representa una expansión de más de tres veces en el número de idiomas admitidos.

La mejora en el tiempo de respuesta se logra mediante un algoritmo que divide el flujo de diálogo en unidades significativas, conocidas como "unidades de lectura". En lugar de esperar que el hablante termine una frase, el modelo evalúa en tiempo real si se ha acumulado suficiente sentido para emitir una traducción. Así, la salida se genera de forma continua mientras el hablante sigue hablando. Este enfoque se basa en la predicción semántica, pero con una optimización técnica que elimina hasta 200 milisegundos de retraso. Este proceso permite una interacción más fluida y natural, especialmente en entornos donde el ritmo del hablante es rápido o donde hay interrupciones frecuentes.

Además, Qwen3.5-LiveTranslate-Flash introduce el análisis visual como una señal de entrada principal, no solo el audio. Esto incluye el reconocimiento de textos escritos en pantalla, objetos visibles, movimientos de labios y gestos corporales. En entornos reales como salas de conferencias, mesas de trading o espacios urbanos con ruido, donde las voces se superponen, esta capacidad permite una interpretación más precisa y robusta. En condiciones de baja calidad acústica, la combinación de audio y visuales actúa como un mecanismo de validación, mejorando significativamente la fiabilidad del sistema.

Para el lector peruano, este avance tiene un impacto directo en el acceso a servicios multilingües. En un país donde el idioma oficial es el español, pero donde coexisten comunidades de habla inglesa, china, africana o indígena, herramientas que permiten traducir en tiempo real con precisión pueden transformar la comunicación en espacios públicos, comerciales o educativos. Las empresas locales que operan en múltiples regiones podrían integrar esta tecnología para mejorar la experiencia de sus clientes, sin necesidad de contar con equipos de traducción humanos. Así, la innovación en inteligencia artificial no solo es relevante para el ámbito tecnológico, sino que también puede ser un catalizador para la inclusión y el acceso equitativo a servicios globales.