G A C E T A   D E   L I N U X
...haciendo a Linux un poco más divertido!
Reconocimiento de Voz Basado en Linux
Por Janine M Lodato
Traducción al español por Ricardo Frydman
el día 12 de Febrero 2003, para La Gaceta de Linux

 

Veamos los programas de reconocimiento de voz basados en Linux desde la perspectiva de China. Sería apropiado que los fabricantes de computadoras Linux comenzaran a fabricarlas en China, porque allí ofrecen menores costos de producción y les ofrece un gran mercado para sus equipos, que además pueden ser exportados a otros mercados importantes del mundo.

Las computadoras Linux tienen la capacidad de adaptar sistemas de reconocimiento de voz, tales como IBM ViaVoice. Esto es especialmente ventajoso para quienes hablan chino porque tanto el Mandarín como el Cantonés, son muy complejos de manera escrita, así los documentos pueden ser producidos mas fácilmente por éste método bajo plataforma Linux. Utilizar un teclado es casi imposible para los lenguajes Chinos porque existen demasiados caracteres para tipear un documento.

Otros lenguajes también se beneficiarían de usar programas de reconocimiento de voz con fines de ganar velocidad. Manos ocupadas, profesionales de mirada ocupada, se pueden beneficiar altamente con el reconocimiento de voz, ya que no necesitas usar un ratón y teclado para documentar sus necesidades. Los sistemas de fácil uso, activados por voz, beneficiarán todos los aspectos de la vida. Cualquiera que conduce autos, encontrará que el reconocimiento de voz una manera muy efectiva de conducir y comunicarse desde el vehículo.

El mercado de la salud por sí sólo justifica el proyecto de reconocimiento de voz basado en Linux. Los servicios de salud es el mayor gasto del Grupo de las Diez naciones, y es el sector de más rápido crecimiento además. Los trabajadores de la salud se beneficiarían del uso de su voz para documentar la descripción del tratamiento de los pacientes. El reconocimiento de voz les permite un entorno de manos libres para analizar, tratar y escribir los casos fácil y rápidamente.

Los dispositivos médicos conectados electrónicamente vía red inalámbrica puede beneficiar:

En éste campo de la ciencia de la vida, la simplicidad, confiabilidad y bajo costo de Linux para los servidores, tabletas, dispositivos embebidos y PCs de escritorio es preponderante. Sólo cerca del 10% de los documentos en el campo de la Salud en EEUU son producidos electrónicamente debido a la naturaleza gigantesca y poco confiable de los entornos Windows. El 30% de los costos es resultado directo de la creación manual de documentos y muchos casos de mala praxis son debido a la imprecisión de transcripciones garabateadas de registros y directivas médicas, cómo cualquiera puede atestiguar al observar las recetas.

Obviamente, existe un mercado para éstas tecnologías. Lo que resta es una compañía hambrienta con vendedores agresivos dispuestos a salir a dar batalla. Una vez distribuida la tecnología por los vendedores, se satisfarán las necesidades de muchos y se abrirá un nuevo mercado masivo que Micosoft no está llenando: tecnología de asistencia (AT). Actualmente, ya existe el campo pero debe ser agrandado para incluir tanto los discapacitados fisiológicos como funcionales.

Si, el reconocimiento de voz ofrece una gran promesa para el futuro. Sin embargo, no es perfecto y debe ser mejorado. Una mejora sería el reconocimiento de labios para suavizar la efectividad. Otra es el ingreso multi-tonal de voces. El uso de micrófonos direccionales. Cada generación de programas de reconocimiento de voz mejorará a medida que el harwdare para Linux crezca y se refuerce.

 

[BIO]


Copyright © 2003, Janine M Lodato. Copying license http://www.linuxgazette.com/copying.html
Publicado en Edición número 87 de Linux Gazette, Febrero 2003