La programación por voz, la próximo generación de desarrollo de software

Html code here! Replace this with any non empty raw html code and that's it.

La programación es una actividad donde pocos se atreven a incursionar. Para algunos podría ser sencillo, para otros no tanto, Existen programas donde te prometen aprender de 0 a experto en tan solo 20 horas cosas semejantes, pero la realidad es que la programación requiere años de experiencia para poder ser un programador decente, que desarrollo código optimizado, adaptado a la plataforma, bien documentado… en fin, para ser un buen programador no solo hay que dedicarle 20 horas, se requiere mucho más que eso.

La programación o el desarrollo de software es un área en constante evolución. Un día puede salir un nuevo framework y al otro día nuevos lenguaje. pero esto es algo diferentes, al final de cuentas es parte de la evolución , en este caso la variable es la voz.

Esta nota salió en en un artículo de spectrum.ieee.org, donde se mencionan dos plataformas que realizan el paso de voz a código:

Serenade, Esta plataforma es un asistente digital que escribe los comandos sin ser necesario que dictemos cada instrucción palabra por palabra. Serenade tiene un motor de conversión de voz a texto desarrollado específicamente para código, algo muy diferente a la API de voz a texto de Google, que está diseñada para voz conversacional. Esta plataforma cuenta con modelos de aprendizaje automático entrenados para identificar y traducir construcciones de programación comunes en código sintácticamente válido. Recaudó 2,1 millones de dólares en una ronda de financiación inicial en 2020.

Talon, esta plataforma ofrece más control sobre cada línea, y requiere que tengamos más comprensión sobre cada tarea que se programa en la máquina. Talon ofrece varios componentes: reconocimiento de voz, seguimiento ocular y reconocimiento de ruido. El motor de reconocimiento de voz de Talon se basa en el sistema de reconocimiento de voz automático Wav2letter de Facebook, mientras que las capacidades de seguimiento ocular y reconocimiento de ruido simulan la navegación con un mouse, el movimiento del cursor por la pantalla según los movimientos de los ojos y los clics basados ​​en los ruidos de la boca.

Si comparamos, Serenade con Talon, el primero sigue una forma más natural de hablar código, mientras que el segundo parece otro idioma, requiere más esfuerzo.

Existen otras plataformas de codificación de voz de código abierto, como Aenea y Caster, que son gratuitas, pero ambas dependen del motor de reconocimiento de voz Dragon, que los usuarios tendrán que comprar. Caster ofrece soporte para Kaldi, un kit de herramientas de reconocimiento de voz de código abierto, y Windows Speech Recognition, que viene preinstalado en Windows.

De cualquier manera, la codificación por voz está aun en sus inicios, más orientada a quien tiene algún límite a la hora de teclear, ya que de momento no es posible hablar de forma natural sobre lo que queremos y ver el código correspondiente en pantalla.

Ernesto Mota
Nací en el d.f., sigo siendo defeño, hoy radico en la hermosa ciudad de Cuernavaca, Morelos, soy Ing. en Sistemas computacionales, con un posgrado en Tecnologías de información, Doctorando en ambientes virtuales de aprendizaje y realidad aumentada, Tecnólogo es mi categoría laboral, y mi linea de investigación es la realidad aumentada aplicada a nuevos entornos de aprendizaje.

Últimos artículos

a

Publicasciones relaciodadas