Número Anterior | Buscar en TidBITS | TidBITS Home Page | TidBITS-es | Siguiente número

TidBITS Logo

TidBITS-es#544/21-Ago-00

¿Quieres un monitor mayor? Continúa leyendo para saber cómo ampliar la imagen visible en la mayoría de las pantallas basadas en tubos de rayos catódicos (TRC). También en este número, el análisis de Matt Neuburg pasa revista al programa de reconocimiento del habla ViaVoice de IBM. Los lanzamientos más importantes de esta semana incluyen Interarchy 3.8, una versión actualizada y renombrada de Anarchie, y Adobe Golive 5.0, la última versión del potente paquete de diseño Web. La encuesta de esta semana: ¿Que tecnologías futuristas querrías que se hiciesen realidad?

Temas:

Copyright 2000 TidBITS Electronic Publishing. Derechos reservados.
Información: <info@tidbits.com> Comentarios: <editors@tidbits.com>


Este número de TidBITS está patrocinado en parte por:


El equipo de TidBITS-es ha traducido este número de manera voluntaria y desinteresada, y esta compuesto por:

Coordinadores del equipo


MailBITS/21-Ago-00

Anarchie, actualizado y renombrado como Interarchy 3.8 -- Starways Software lanzó hoy una importante actualización de su popular cliente FTP de libre distribución Anarchie. En el proceso, Stairways decidió renombrar Anarchie como Interarchy y usar Interarchy como la nueva identidad de la compañía después del intento fallido de recuperar el dominio anarchie.com de las manos de un ciberocupa. Interarchy 3.8 soporta listados FTP, carga y descarga de archivos, y copia completa de sitios (mirroring); listados HTTP, descarga y copia completa; Whois, Finger, y búsquedas DNS; traceroutes (trazado de la ruta seguida por los paquetes de información); y pruebas TCP, ICMP, y UDP. Interarchy también puede mostrar el estado de tu red, vigilar todo el tráfico de red en tu Mac, y mostrar una lista de las conexiones actuales. Por último, Interarchy ofrece ahora démones - daemons - (pequeños servidores) para Finger, Whois, eco TCP, eco UDP, Ident, Daytime (fecha), Time (hora) y NTP (todos activados con el ítem de menú Safe Daemons), así como un démon Telnet que acepta y excluye guiones AppleScript. Todos están desactivados por defecto. Lo más interesante, sin embargo, son las "varitas mágicas" (wand) tipo pieles de Interarchy, que son interfaces gráficas totalmente configurables con las funcionalidades de Interarchy. Para darte una idea de como se puede usar una varita mágica, estoy planeando crear una que me ayude a encontrar problemas de conexión a Internet con botones para hacer pruebas de ping y traceroute a varios de mis servidores. Globalmente, Interarchy 3.8 es una potente y flexible colección de herramientas de Internet que inicialmente parecen no tener orden ni concierto; está por ver si las varitas mágicas de Interarchy serán capaces de poner orden. Interarchy 3.8 supone una descarga de 3.9 MB y cuesta 50 US$, pero es gratuito para los usuarios de Anarchie 3.x (toma el número de serie existente) y para los usuarios registrados de los programas de libre distribución de Stairways a los que Interarchy sustituye. [ACE]

NOTA -- Daemon, en castellano démon. La palabra existe en nuestro idioma. En la religión y filosofía griegas los démones son seres entre los hombres y la divinidad. Como transmiten los mensajes de los dioses, tienen que moverse bastante rápido, pero no es ese su único rasgo relevante para la traducción: son también seres que hacen que las cosas "pasen" sin ser vistas. Aunque en el mundo Unix estos pequeños servidores son conocidos habitualmente como demonios, consideramos, por lo explicado anteriormente, que una traducción más correcta del termino es la de démon-- [Daniel Riaño].

<http://www.interarchy.com/>

Adobe GoLive 5 disponible -- Adobe ha comenzado la distribución de Adobe Golive 5, su paquete estrella de diseño Web. La nueva versión añade varias caraterísticas orientadas a reflejar de una manera mejor la forma actual de diseñar y desarrollar los sitios Web. La función Design (Diseño) posibilita esquematizar rápidamente un sitio Web y realizar un prototipo. Dinamic Link (Enlace Dinámico) hace muy sencillo enlazar la información almacenada en una base de datos con una página Web; 360Code (Código 360) se asegura de que el código HTML preexistente no sea reformateado por GoLive, y la implementación de WebDAV (Web Distributed Authoring and Versioning -- Creación y Modificación Distribuida en la Web) posibilita el control de modificaciones y la gestión activa por equipos de diseño que trabajen en un mismo proyecto. GoLive tambien incluye Smart Objects, herramienta que posibilita arrastrar archivos de Photoshop, Illustrator o LiveMotion sobre una página, y su actualización dinámica a posteriori, sin tener que recorrer todo el proceso de exportar una y otra vez copias en formato compatible Web. Golive ya está disponible para descargar de la red por 299 US$. Los propietarios de pageMill o versiones previas de GoLive se pueden actualizar por 99 US$; está disponible también una actualización para los propietarios de Macromedia Dreamweaver o Microsoft FrontPage por 149 US$. El programa requiere un Mac Power PC con sistema 8.6 o posterior y al menos (aunque sería preferible más) 48 MB de RAM disponibles. [JLC]

<http://www.adobe.com/products/golive/main.html>

¡Somos los quintos! -- Nuestra enhorabuena al editor de TidBITS, Adam Engst por su quinto lugar en la clasificación de MacDirectory "Las Figuras más Influyentes de la Industria Mac", realizada con los votos de más de 200 lectores. Al igual que en la encuesta de MDJ, publicada el mes pasado, sobre los 25 personajes mas influyentes, el iCEO de Apple, Steve Jobs ganó el primer lugar por un amplio margen. Pero esta vez, el Presidente de Microsoft, Bill Gates, quedó en segundo lugar, seguido por Steve Wozniak, cofundador de Apple y el inefable Guy Kawasaky (actualmente consejero delegado de Garage.com). [GD]

<http://www.macdirectory.com/4u/wire.fm$RETRIEVE?value=8403&field=Serial&html=NewsDetail.html>
<http://db.tidbits.com/getbits.acgi?tbart=06045>

Presentación de la encuesta: La manzana mas deseada -- Matt Neuburg examina más abajo ViaVoice, el programa de reconocimiento de habla para Macintosh de IBM, y su revisión nos hizo pensar en otros aspectos futuristas del diseño del sistema. Ha habido tentativas de diferente éxito con el reconocimiento de la escritura, la eliminación de molestos cables entre los componentes de los ordenadores y la miniaturización; e incluso hemos visto hitos de la alta tecnología tales como interfaces virtuales, seguridad biométrica (como la contraseña por voz del Mac OS 9), monitores integrados en gafas y hasta reconocimiento de las ondas cerebrales (de IBVA Technologies). Pero el éxito de estas tecnologías que-modifican-los-conceptos se ha visto a menudo estorbado no por su implementación, sino por la falta de aceptación del usuario. Por tanto, en la encuesta de esta semana, ayúdanos a identificar la senda de investigación adecuada, contándonos que tecnologías querrías ver en los actuales o futuros Macs. Vota en nuestra página principal, y si se nos ha olvidado alguna tendencia de futuro importante en el diseño del sistema, cuentanoslo en el foro de discusión de TidBITS, TidBITS Talk, en <tidbits-talk@tidbits.com>. [ACE]

<http://www.tidbits.com/>
<http://www.ibva.com/>


Maximiza tu monitor

por Adam C. Engst y Geoff Duncan <editors@tidbits.com>

La pregunta de la semana pasada mostraba diferentes posibilidades para poder visualizar más superficie en el escritorio de tu Mac. La respuesta correcta era que todas las opciones te permiten una mayor visualización, sólo que lo hacen de distintas maneras. Echemos un vistazo a cada respuesta, aunque muchos probablemente ya sepáis sobre esto (casi dos terceras partes de los que respondieron a la pregunta lo hicieron correctamente), siempre está bien transmitírselo a amigos o parientes menos experimentados con el Mac.

<http://db.tidbits.com/getbits.acgi?tbpoll=53>

Ajustar la resolución del monitor -- quiere decir cambiar el número de píxels que conforman el alto y ancho de tu pantalla. Puedes ver más en tu escritorio con una resolución de 1024 x 768 que con otra de 640 x 480 - sin embargo, dependiendo de tu monitor, una resolución menor puede ser más cómoda para leer texto u otras tareas. Utiliza el panel de control "Monitores" o el módulo para ajustar la resolución del monitor que hay en la Barra de Controles. Puedes ajustar la resolución del monitor sobre la marcha, aunque los objetos de tu escritorio pueden desordenarse si eliges un tamaño menor (y además, si cambias de resolución a menudo, échale un vistazo a "Tools We Use: Desktop Resetter" en TidBITS-466 para ver detalles sobre esta utilidad que "recuerda" la posición de los iconos del escritorio). Muchos usuarios novatos no se dan cuenta de que, al cambiar la resolución de la pantalla, pueden acabar trabajando a una resolución que no es la ideal para el tipo de tarea que están haciendo, o que no es buena para su vista. Cuando ajustamos Macs para amigos o parientes, siempre les mostramos diferentes resoluciones de pantalla, y les preguntamos cuál prefieren.

<http://db.tidbits.com/getbits.acgi?tbart=05273>

Añadir otro monitor -- ésta es una de las mejores pero más desconocidas características del Mac: Muchos Macs pueden llevar dos o más monitores, que combinados forman un escritorio más amplio. El usar varios monitores es una buena manera de aumentar la productividad: Imagínate el estar investigando sobre un asunto dentro de un navegador Web con un monitor, mientras en otro escribes en tu procesador de texto. No todos los Macs pueden llevar varios monitores, pero casi todos los modelos que admiten múltiples tarjetas de vídeo pueden manejar varios de ellos. Ten en cuenta que algunos de los Macs que admiten físicamente varios monitores, sólo lo hacen duplicando la salida de vídeo, de modo que ambas pantallas muestran la misma imagen, en vez de combinarse ambos para crear un único escritorio más grande. En el pasado hemos tratado ampliamente el asunto de los monitores múltiples (lee nuestra serie de artículos "Multiple Monitors!" para ver detalles y también consejos), y es un tema que se ha tocado frecuentemente en TidBITS Talk, nuestro foro de discusión.

<http://db.tidbits.com/getbits.acgi?tbser=1033>
<http://db.tidbits.com/getbits.acgi?tlkthrd=18+977+1102+1122+1123+1129>

Escritorios virtuales -- Se parecen a los monitores múltiples en que ponen a tu disposición un tamaño mayor de escritorio y se diferencian en que el escritorio ampliado no se muestra en otra pantalla, como ocurre en los monitores múltiples; para hacer visible el espacio adicional de escritorio tienes que desplazar o cambiar la(s) pantalla(s) primaria(s). Algunas placas de video ofrecen escritorios virtuales por medio de sus controladores (driver); otras mejoras del sistema, provistas sólo mediante programas, como "Virtual Desktop" ("Escritorio Virtual") de AWOL y "Virtual" de Pierre-Luc Paour, ofrecen también escritorios virtuales, aunque ninguno de los programas ha sido actualizado recientemente (además el autor de Virtual no recomienda su utilización con el Mac OS 9).

<http://www.magma.ca/~awolsp/>
<http://www.bok.net/~paour/VirtualF/>

Ajustar la geometría de la pantalla -- Esta era nuestra respuesta con truco (que podrías haber deducido, puesto que como la lógica deductiva es todavía de uso corriente en la mayoría de los países, una vez que comprendieras que por lo menos dos de las otras respuestas eran correctas, se seguía que todas lo eran). Cuando decimos "ajustar la geometría de la pantalla" nos referimos a la experimentación con los controles de tamaño y posición, tanto horizontal como vertical del área de la imagen, intentando reducir o eliminar el borde negro que rodea la pantalla de tu ordenador. Se puede eliminar media pulgada o más de negro en cada uno de los bordes de la mayoría de las pantallas, aumentando realmente su área física.

Agrandar el tamaño de la imagen en el monitor eliminando la banda negra tiene la ventaja, en lo inmediato, de aumentar el tamaño de los pixeles (pero no su número), y hace que en esencia la imagen del escritorio aparezca más grande y sea más fácil de ver. Luego, buscando un mayor provecho, podrías cambiar a la resolución mayor inmediata (que sí incrementa el número de pixeles); y como una resolución mayor hace que se vea más información a la vez, habría en consecuencia un aumento en la productividad.

Este truco sólo funciona en monitores con tecnología de rayos catódicos (CRT), no en las pantallas basadas en cristal líquido (LCD), que usan siempre todos los pixeles disponibles. Y funciona porque el cañón electrónico que dibuja los pixeles en la pantalla puede controlarse para encender la capa de fósforo en la, de otro modo, oscura banda que bordea la pantalla. Ahora bien, si éste es un gran truco, podrías preguntarte porqué en principio existe la banda negra. La respuesta se encuentra en el aspecto negativo que tiene el aumento del tamaño de la imagen de la pantalla - es probable que se deforme un poco la pantalla a consecuencia de la experimentación necesariamente involucrada para aumentar el tamaño, colocar otra vez en posición la imagen y eliminar la distorsión (si los bordes no son paralelos, o si se comban hacia adentro o hacia afuera). ¿Notarías esta deformación? Quizá, pero es probable que no te preocupe, a menos que te dediques a las artes gráficas y te importe la precisión de las dimensiones de una imagen. En mi opinión personal, el beneficio que resulta del aumento en el tamaño de la imagen supera la desventaja de la apenas perceptible distorsión de la dimensión de los pixeles.

NOTA -- CRT: siglas en inglés de Cathode Ray Tube - tubo de rayos catódicos. LCD: siglas en inglés de Liquid Crystal Display - pantalla de cristal líquido -- [Ric]

Hacer los cambios lleva unos cuantos minutos de ensayos, y probablemente tendrás que consultar el manual de tu monitor. (Para aquellos que tienen un iMac, los controles del monitor estan todos basados en el sistema operativo y accesibles en el panel de control Monitores). Los controles importantes estan etiquetados (normalmente con abreviaturas) como Tamaño Horizontal y Tamaño Vertical (o a veces Zoom) junto con Posición Horizontal y Posición Vertical. Primero, aumenta el tamaño horizontal para llenar la mayoría de tu pantalla. La imagen puede que no este centrada al comenzar, asi que puede que tengas que ajustar la posición horizontal también. Entonces, repite el proceso con los controles de tamaño y posición vertical. Después de cambiar la posición y tamaño de la imagen, mira los bordes de la pantalla. Si son concavos o convexos, o no están paralelos, usa los controles de geometría (que pueden tener varios nombres distintos) para enderezar los bordes, rotar la imagen, y conseguir dejar todos los bordes paralelos.

Tu monitor debería recordar los nuevos ajustes, pero he visto algunos cambiar con el tiempo. Así que si notas algo que no se vea correcto, vas tener que ajustar los controles de geometría para volverlo a poner tal y como a ti te gusta. Te recomiendo que tomes esta información - las intrucciones de como eliminar la inútil banda negra y los trucos sobre resolución del monitor, el uso de varios monitores, y los escritorios virtuales - y se la pases a usuarios con menos experiencia para que se puedan beneficiar de una mayor imagen en su monitor o de una mejora en la resolución del mismo.


Hablar es barato - ViaVoice Enhanced Edition

por Matt Neuburg <matt@tidbits.com>

[Nota: Le doy las gracias a mi padre, Ned Neuburg, por la ayuda técnica para este artículo. El fue parte del comité director de ARPA en los años 70. También mi gratitud a Erik Sea, el Jefe de Desarrollo de ViaVoice para Mac en IBM, por contestarme varias preguntas].

La ciencia ficción clásica, en su gran mayoría, ha sufrido de miopía y de optimismo en relación a su visión de los ordenadores. El aumento del poder de proceso fue una predicción obvia, pero pocos autores previeron que los ordenadores serían pequeños, económicos, y ubicuos, con todas las implicaciones sociales que esto conllevaría. Por otra parte, según la ciencia ficción, hace mucho tiempo que tendríamos que estar hablando con nuestros ordenadores. ¿Dónde está HAL 9000? El teclado QWERTY es un dinosaurio; lo ideal sería que el ordenador te leyera los pensamientos, pero en lo que llegamos a eso, ¿por qué no al menos decirle que hacer? Bueno, en gran medida, puedes hacerlo. Quizás no debas pasar todavía el control de sistemas críticos a un ordenador controlada por voz, pero tu ordenador tampoco tiene porqué ser sordo.

NOTA -- HAL 9000, personaje de "2001, Una Odisea del Espacio". Novela de Arthur C. Clarke y película basada en dicha novela dirigida por Stanley Kubrick. HAL era el ordenador de a bordo de la nave "Discovery", que había partido en misión a Júpiter para investigar una señal que un monolito extraterrestre de 4.000 millones de años había enviado allí tras ser desenterrado en la Luna, en el crater de Tycho. HAL era un prodigio de inteligencia artificial, y por supuesto era capaz de entender el lenguaje hablado. Pero era tan humano que el conflicto entre su necesidad de decir la verdad y la de mantener en secreto la auténtica naturaleza de la misión a la tripulación "secundaria" (humana) de la nave, le llevó a tratar de deshacerse de los tripulantes, cuando creyó que podían ser un impedimento para la correcta realizacion de dicha misión. Se dice que Clarke escogió las siglas HAL (Heuristic ALgorithmic computer - Ordenador Heurístico y ALgorítmico) para el ordenador de la "Discovery" porque eran las letras precedentes a IBM. Así, se suponía que HAL estaba un paso por delante de IBM. En la URL más abajo puedes consultar más información sobre HAL y su "nacimiento" -- [Equipo de TidBITS-es]

<http://www.u.arizona.edu/~hectors/hal9000.html>

Observemos primero el bello paisaje -- Probablemente hayas oído hablar de ARPA, el brazo del Departamento de Defensa de los EE.UU. encargado de la investigación avanzada durante la Guerra Fría; y seguro que una de sus creaciones te resulta familiar: Internet. Otro proyecto del ARPA consistió en hacer que los ordenadores comprendieran lo que la gente decía; recibió el nombre de "reconocimiento del habla". (En una ocasión propuse la denominación "autoanálisis glosemático", pero no cuajó por alguna razón.) A principios de los 70, ARPA dedicó enormes cantidades de dinero para financiar estos desarrollos. El principal obstáculo era el modelo acústico, que es lo mismo que decir el análisis de los fonemas. ¿Cómo puede distinguir un ordenador si una vocal es una "a" o una "i", o si una consonante es una "p" o una "t", o simplemente apreciar los límites de cada fonema? La mayor parte de los científicos esperaban que los ordenadores interpretarían las características de la alocución, es decir, la forma en que la boca produce sonidos: "Esto es una pausa gutural sonora, esto es una vocal anterior redondeada, etc.". Sin embargo, la investigación sufragada por ARPA demostró que se podían lograr mayores avances prácticos haciendo algo mucho más rudimentario. Primero, caracterizar el sonido en bruto mediante un conjunto mínimo de números; después, comparar esos números con un patrón. Por ejemplo: Este sonido es una "p" porque numéricamente se parece a una "p" pregrabada.

El truco está en el "se parece". James Baker, entonces un estudiante graduado en la Universidad Carnegie-Mellon, aplicó un proceso matemático probabilístico llamado "Modelo Oculto de Markov" (Hiden Markov Model - HMM en inglés) a la comparación de patrones para reconocimiento del habla. Los resultados demostraron ser tan superiores a los de esos primeros experimentos auspiciados por ARPA, que aún hoy todos los sistemas modernos de reconocimiento del habla usan el HMM. Este hecho impresiona por dos razones. La primera es que el HMM no es sólo rudimentario, sino que casi con toda seguridad es erróneo: sea como sea la manera en que nuestros oídos y cerebros analizan el habla, es obvio que no tiene nada que ver con la del HMM. En segundo lugar, es asombroso que hayamos llevado a cabo el reconocimiento del habla de la misma manera durante tanto tiempo. Es cierto que el HMM actual es mucho más sofisticado que el original, y que no deberos infravalorar la importancia de la progresiva optimización de los programas, inicialmente liderada (de nuevo) por James Baker, que acabaría fundando Dragon Systems. Pero los desarrollos más importantes han ocurrido en el terreno de los sistemas físicos. Los ordenadores son hoy mil veces más rápidos, con recursos mil veces mayores y con un precio y un tamaño mil veces más pequeños que los de aquella época. Gracias a ello, al fin comienzan a acercarse a la gran potencia de cálculo necesaria para el reconocimiento del habla.

<http://www.dragonsystems.com/about/>

A principios de los 90, Apple creó PlainTalk, su propio componente dedicado al reconocimiento del habla e integrado en el sistema operativo. Pero la genialidad de PlainTalk reside en sus limitaciones: no necesita entrenarse para un usuario en particular, pero sólo efectúa reconocimiento discreto del habla, comparando una frase con una lista finita de posibilidades predeterminadas. El Santo Grial es hoy el reconocimiento contínuo del habla (Continuous Speech Recognition - CSR en inglés). Dicho de otra forma: tú hablas y el ordenador escribe. Por fin, el CSR ha llegado, gracias a ViaVoice Enhanced Edition de IBM.

<http://www-4.ibm.com/software/speech/mac/newmac/>
<http://www-4.ibm.com/software/speech/support/faqmacenh.html>

Ave, CSR -- A pesar del HAL 9000, los obstáculos para el reconocimiento contínuo del habla son serios, tal como ilustra la historia de la investigación por parte de IBM. Su inicio se remonta a los años 50, cuando se contaban entre los beneficiarios de la temprana provisión de fondos de la ARPA; sólo entre los últimos cinco años, IBM ha puesto en el mercado un software de dictado a nivel de consumo. Sólo ten esto en cuenta: el modelo acústico tiene que hallar tus fonemas al margen de cómo los sonidos se confundan con los límites de las palabras y la entonación de las frases. Al contrario que el reconocimiento del habla discreto, tu "instrucción" no tiene un final claro, por lo que el modelo acústico también debe ser extremadamente rápido, para seguir tu ritmo. Además, este no es el único modelo involucrado: debe haber un modelo lingüístico para agrupar tus fonemas en palabras, comparándolos no con una pequeña lista, sino con un léxico que puede ser de decenas de miles de palabras.

<http://www.research.ibm.com/hlt/html/history.html>

Así, para ser práctico de alguna manera, el reconocimiento contínuo del habla requiere hoy por hoy que el modelo acústico se prepare según la calidad de voz y pronunciación de la persona que vaya a hablar y las características del micrófono y del ambiente. ViaVoice lo resuelve haciéndote leer unos relatos que te ofrece al arrancar por primera vez el programa (más tarde, puedes repetir este procedimiento para refinar tu modelo, y ViaVoice gestiona los múltiples modelos de forma que los puedan usar diferentes personas, o la misma en entornos distintos). El modelo lingüístico, entretanto, requiere un diccionario: ViaVoice incluye un diccionario por defecto y, en teoría, calcula las pronunciaciones iniciales basándose en tu modelo acústico; también incluye cinco diccionarios por especialidades, como cocina o finanzas, entre los que puedes activar uno a la vez.

NOTA -- En el momento de cerrar la traducción, nos consta la existencia de versiones en español en varias ediciones para Windows, con un diccionario de 100.000 palabras, pero no nos consta que haya versión para Mac. -- [Equipo de TidBITS-es]

Aun así, está claro que ViaVoice no puede conocer cada palabra que puedas decir o cada rasgo de tu pronunciación, de modo que ofrece tres funciones para ampliar y refinar los modelos:

ViaVoice también amplía tu vocabulario por medio de macros y comandos. Las macros son expresiones escritas de manera diferente a como se pronuncian, tales como signos de puntuación ("coma" y "punto") y frases modelo como "matt@tidbits.com" (cuya frase pronunciada puede ser "mi dirección de correo"). Las macros pueden ejecutar acciones para interactuar automáticamente en sus contextos; de ésta manera se asegura, por ejemplo, que un punto vaya delante de la palabra a la que precede, que después haya un espacio, y que la siguiente palabra empieze por mayúscula. Los comandos lanzan acciones, pero no escriben; están integrados en el programa, y los que haya disponibles depende del entorno en que se esté en el momento.

Siete, son siete -- La funcionalidad de ViaVoice está dividida entre siete aplicaciones principales (y unas doce mas pequeñas). Esto puede parecer confuso, pero su implementación no lo es: los "paquetes" (carpetas bloqueadas) ocultan las diversas aplicaciones bajo el Finder, abriéndolas y cerrándolas automáticamente a medida que se necesitan. En la descripción que sigue a continuación indico la RAM requerida aproximadamente con la memoria virtual desconectada, ya que ViaVoice es mucho más rápido de ese modo.

Comienzas una sesión abriendo el SpeakPad (12 MB); acto seguido se inicia el Background Engine - Motor interno del programa - (3 MB, invisible) y VoiceCenter (3 MB).

VoiceCenter aparece como una ventana flotante siempre activa en el ordenador, y es el centro principal de gestión de ViaVoice. Tiene algunos botones y un menú desplegable, en donde conectas y desconectas el micrófono, inicias y manejas los macros, el diccionario y el modelo acústico, asi como la activación de la ventana de corrección.

SpeakPad se parece a un rudimentario procesador de textos, pero acepta dictado y puede obedecer a una gran cantidad de comandos vocales relativos a selecciones y movimientos de cursor, copiar y pegar, etc. Puesto que se puede manejar la ventana de corrección vocalmente, una sesión de dictado, si se tiene paciencia, puede ser ejecutada sin emplear las manos. Además SpeakPad es guionizable y ViaVoice tiene una agradable característica similar a la de PlainTalk: puedes ampliar el conjunto de comandos a través de AppleScript, en donde un guión es lanzado al pronunciar su nombre. Lo he empleado para incrementar la cohesión de ViaVoice con otros programas; por ejemplo estando escribiendo partes de esta reseña, le dicté a SpeakPad y a continuación le dije "trasnfiérelo a Nisus" para lanzar un guión hecho a medida el cual copiara el texto de SpeakPad y lo pegara en Nisus Writer.

Aparte de SpeakPad, también se puede dictar en Microsoft Word, Internet Explorer, Outlook Express, ó AppleWorks. Para recurrir a ésta característica, se lanza la aplicación Direct Dictation - Dictado Directo - (1 MB, invisible), la cual llama al Dictation Manager - Gestor de Dictado - (4 MB, invisible), asi como al Background Engine y el VoiceCenter si todavía no están activos. Una vez que VoiceCenter flota por encima (vamos a decirlo) de Microsoft Word, se conecta el micrófono y se dice "empieza Dictado directo (beguin direct dictation)", con lo que ya se puede hablar para escribir en Word.

Para establecer el nivel de volumen del micrófono y comprobar el ruido de fondo, abres el Setup Assistant - Asistente de Configuración - (9 MB), una simple ventana que consiste en una sucesión de paneles por los que navegas a través de botones con flechas. También usas el Setup Assistant para analizar tus documentos o crear tu modelo de voz, con un grupo distinto de paneles para cada caso. El archivo de usuario y la gestión del modelo de voz se realizan a través de ViaVoice Settings - Ajustes de ViaVoice - (6 MB), que presenta una ventana tipo panel de control y te permite editar tus macros o vocabulario, nuevamente a través de una ventana diferente en cada caso. Cada uno de estos programas se cierra automáticamente cuando cierras su ventana.

Vengo a sepultar el CSR... -- Desde la instalación en adelante, he encontrado ViaVoice problemático, raro, o francamente irritante. No se dejó instalar en uno de mis ordenadores; en el otro, pude instalarlo, pero se colgó cuando intenté crear mi modelo acústico. Así que furtivamente lo instalé en el segundo ordenador y lo copié en el primero, donde funciona perfectamente; desde allí preparé el modelo y copié los datos de vuelta al segundo. Direct Dictation también falla en ese ordenador (ambos fallos son debidos a la manera - a demasiado bajo nivel - en que ViaVoice trata de decirle a tu ordenador que no entre en reposo durante el dictado); pero no lo echo de menos, puesto esta característica es poco efectiva de todas formas - es mucho más lento que dictar con SpeakPad, y ViaVoice fácilmente se desincroniza con lo que hay en el documento.

Mientras lees una historia para crear tu modelo acústico, ViaVoice destaca palabras para mostrar dónde piensa el ordenador que estás, pero a veces destaca la palabra equivocada y no puedes deducir lo que quiere que hagas. Las preferencias que pusiste, a veces son olvidadas incluso antes de que le des al botón de OK. Tu menú Teclas puede terminar ajustado en un teclado incorrecto después de usar Direct Dictation. A menudo, el micrófono no funciona, o ViaVoice no te deja salir del programa. Si dictas con un montón de texto seleccionado, un diálogo te pregunta si realmente quieres sobrescribir la selección; si le dices que sí, ¡las palabras dictadas aparecen al revés!

En SpeakPad, ViaVoice insiste en controlar las mayúsculas y el espaciamiento, y frecuentemente los pone mal. A veces aparecen misteriosamente espacios extras u otros caracteres. El decir un signo de puntuación a veces ocasiona que varias palabras precedentes se omitan del texto mecanografiado. Pequeñas cosas como hacer doble clic y arrastrar palabras seleccionadas no funcionan demasiado bien. No puedes examinar ninguno de los diccionarios incluidos, así que no puedes añadir inteligentemente un vocabulario por adelantado: tienes que esperar hasta que ViaVoice falle.

ViaVoice requiere en principio unos 80Mb de espacio en el disco, y supone cientos de archivos de cuyo objeto nada te dicen. Además, la carpeta Temp (Temporal) crece y crece (me han dicho que el programa hace una limpieza cuando alcanza los 250 MB). El manual es cutre, feo y poco informativo. La hoja de referencia rápida es inexacta e incompleta. En resumen, este es un programa mastodóntico e inflexible que se hace con tu ordenador a la vez que demuestra un pobre sentido del diseño, escaso conocimiento de la interfaz del Mac y sus convenciones y poca idea de qué es lo que el ususario necesita.

...y a alabarlo -- Y sin embargo, salvo que seas absolutamente ingenuo, tengas menos de doce años o te hayas criado solo a base de ciencia ficción, ver ViaVoice en acción parece algo casi milagroso. Uno habla y de alguna manera tus palabras aparecen en la pantalla -¡y casi siempre las palabras que has pronunciado! Es cierto que el motor de reconocimiento tiene sus limitaciones, pero esto es algo que afecta a todos los motores de reconocimiento hasta la fecha. Por ejemplo, y a pesar de los ejemplos de homófonos que en la demo del programa se detectan correctamente (por ejemplo: "Write the right letter to Mr. Wright" [="escribe (write) la carta al señor Wright"]) ViaVoice comete errores que podrían evitarse con unos conocimientos básicos de gramática o sintaxis. Y es que el programa carece de tales instrucciones: ViaVoice reconoce algunos de los contextos probables para ciertas palabras, pero no sabe inglés. Además, como me señala mi padre, el peor problema con el reconocimiento del habla es que cuando algo va mal el ordenador no te puede decir la causa ("habla más alto, o más claro" o cualquier cosa) por la sencilla razón de que no tiene ni idea de cuál puede ser. Puesto que se trata de modelos automáticos y probabilísticos, los podemos construir y constatar su eficiencia, pero no sabemos cómo funcionan en realidad (¡Como con HAL 9000!).

Para obtener una mayor fidelidad son útiles algunas sencillas precauciones. Cuando enseñas por primera vez a reconocer tu modelo acústico, lee bastante material, y utiliza el mismo tono de voz que usarías para dictar. He comprobado que una cadencia monótona funciona mejor (¡como con HAL 9000!). Cada vez que arrancas ViaVoice, ajusta el audio, que solo lleva un minuto. Cuando ViaVoice se equivoque, corrígele, porque así es como aprende. Y finalmente, deja que ViaVoice te adiestre a ti: debes hablar sin pausa pero sin prisa; con naturalidad pero sin atropellarte; con cuidado pero sin exagerar: si exageras las consonantes finales, por ejemplo, ViaVoice no reconocerá una consonante más clara sino una palabra extra. ¡Recuerda que es sólo una máquina!

Quizá lo más difícil de todo para mí ha sido aprender a dictar bien. Cuando comienzo a hablar, tengo sólo una vaga idea de lo que voy a decir; así que tiendo a ahogarme bajo la presión de improvisar un flujo constante de frases lentas, claras y bien formadas. He encontrado que leer en voz alta es una buena práctica; y una de las utilidades de ViaVoice ha sido transcribir algunas antiguas cartas manuscritas. Sin embargo, a menudo lo utilizo para componer mensajes de correo electrónico, y lo utilicé para hacer el borrador de algunos trozos de ésta revisión.

La última palabra -- El reconocimiento automático del habla ya está aquí, y aunque no me gustaría tener que predecir cómo, creo que cambiará todo. Quizás ciertas confusiones comunes del reconocimiento automático entre palabras homófonas creen nuevas normas ortográficas. Quizás nuestras comunicaciones con los ordenadores sean pronto una mezcla de ratón, teclado y voz. En cualquier caso, estamos en el umbral de una nueva era, y cualquiera puede cruzarlo y pisar más allá. Ahora - abre la puerta de la cámara de las cápsulas, HAL.

ViaVoice Enhanced necesita el Mac OS 9.0.4 y un Power Mac G3/300 o mejor; cuanto más rápido el procesador y cuanta más RAM, mejor - aunque esto sólo mejorará la velocidad, no la precisión. Cuesta 130 US$ y viene con unos auriculares con micrófono integrado (diadema) Andrea USB, aunque sirve cualquier micrófono con cancelación de ruidos, como el iParrot o la diadema Andrea PlainTalk que venía con la versión anterior.

<http://www.macsense.com/Product/iParrott103_b.html>

Si sucede que tu ordenador no llega a satisfacer estos requerimientos, puede que quieras probar la versión anterior, ViaVoice Millennium. Como que no es tan buena, pero funciona decentemente, sólo necesita el Mac OS 8.5.1 y por lo menos un Power Mac G3/233, y por 75 US$, que no es mucho más caro que lo que cuesta la diadema incluida, podemos decir que es una ganga.


Las publicaciones no comerciales y sin ánimo de lucro tienen permiso para reproducir los artículos, siempre y cuando se de completa noticia del autor y la publicación originales. Para la reproducción en otro tipo de publicaciones, sírvanse en contactar con nosotros previamente. No se garantiza la exactitud del contenido de los artículos. Avertencia al lector!. Los nombres de cada publicación, producto o compañía pueden ser marcas registradas de sus respectivas compañías. TidBITS ISSN 1090-7017.

Número Anterior | Buscar en TidBITS | TidBITS Home Page | TidBITS-es | Siguiente número