MacInTalkPlainTalk es el nombre colectivo de varias tecnologías de síntesis de voz (MacinTalk) y reconocimiento de voz desarrolladas por Apple Inc. En 1990, Apple invirtió mucho trabajo y dinero en tecnología de reconocimiento de voz y contrató a muchos investigadores en el campo. El resultado fue "PlainTalk", lanzado con los modelos AV de la serie Macintosh Quadra de 1993. Se convirtió en un componente estándar del sistema en System 7.1.2 y desde entonces se ha incluido en todos los PowerPC y algunos otros Macintosh de 68K. SoftwareSíntesis del hablaTecnologíaLa conversión de texto a voz de Apple utiliza difonos. En comparación con otros métodos de síntesis de voz, no requiere muchos recursos, pero limita la naturalidad que puede ser la síntesis de voz. Las versiones en inglés americano y español están disponibles, pero desde la llegada de Mac OS X, Apple solo ha enviado voces en inglés americano, confiando en proveedores externos como Acapela Group para suministrar voces en otros idiomas (en OS X 10.7, Apple concedió licencia muchas voces de terceros y las puso a disposición para su descarga desde el panel de control de voz). Una interfaz de programación de aplicaciones conocida como Speech Manager permite a los desarrolladores externos utilizar síntesis de voz en sus aplicaciones. Hay varias secuencias de control que se pueden utilizar para afinar la entonación y el ritmo. También se pueden configurar el volumen, el tono y la velocidad del discurso. La entrada al sintetizador se puede controlar explícitamente mediante un alfabeto de fonemas especial. MacinTalk originalEl motor inicial de conversión de texto a voz de Macintosh, MacinTalk (bautizado así por Denise Chandler), fue utilizado por Apple en la introducción del Macintosh en 1984, en el que la computadora se anunció al mundo (y se burló del peso de una computadora IBM). Si bien se incorporó al sistema operativo Macintosh, Apple no lo admitía oficialmente (aunque la información de programación estuvo disponible a través de una Nota técnica de Apple). MacinTalk fue desarrollado por Joseph Katz y Mark Barton, quienes luego fundaron SoftVoice, Inc., que actualmente comercializa motores TTS para Windows, Linux y plataformas integradas. MacinTalk 2Finalmente, Apple lanzó un sistema de síntesis de voz compatible, llamado MacinTalk 2. Es compatible con cualquier Macintosh que ejecute System Software 6.0.7 o posterior. Siguió siendo la versión recomendada para máquinas más lentas incluso después del lanzamiento de MacinTalk 3 y Pro. MacinTalk 3, ProMacinTalk 3 introdujo una gran variedad de voces. Además de las voces estándar de adultos "Ralph", "Fred" y "Kathy", y de las voces infantiles como "Princess" y "Junior", se incluyeron varias voces novedosas, como "Whisper", "Zarvox" (una voz robótica con sonidos de fondo, con una voz similar llamada "Trinoids" también incluida), "Cellos" (una voz que cantaba su texto con una melodía de Edvard Grieg, con voces de canto similar como "Good News", "Bad News", "Pipe Organ"), "Albert" (una voz ronca), "Bells", "Boing", "Bubbles" y otros. Cada una de estas voces venía con su propio texto de ejemplo, que se decía cuando se presionaba el botón "Prueba" en el panel de control de voz. Algunos simplemente decían su nombre, idioma y la versión de MacinTalk que les presentaron. Otros decían cosas divertidas, como "seguro que me gusta estar dentro de esta computadora tan elegante", "tengo una rana en la garganta... ¡No, quiero decir una rana de verdad!", "Debemos alegrarnos de esta voz morbosa" (una parodia de un himno religioso occidental con música de órgano) o "La luz que ves al final del túnel es el faro de un tren que se acerca rápidamente". Estas voces, así como sus textos de prueba, todavía se encuentran hoy en Mac OS X. Con el aumento de la potencia informática que proporcionaban los Mac AV y los Macintosh basados en PowerPC, Apple podía permitirse el lujo de aumentar la calidad de la síntesis. MacInTalk 3 requería un procesador 68030 de 33 MHz y MacinTalk Pro requería un 68040 o mejor y al menos 1 MB de RAM. Cada sintetizador admitía un conjunto diferente de voces. Texto a voz en Mac OS XLa conversión de texto a voz ha sido parte de todas las versiones de Mac OS X. La voz de Victoria se mejoró significativamente en Mac OS X v10.3 y se agregó como Vicki (Victoria no se eliminó). Su tamaño era casi 20 veces mayor debido a las muestras de dífonos de mayor calidad utilizadas. Se agregó una nueva voz con un sonido mucho más natural, llamada "Alex", a la lista de conversión de texto a voz de Mac con el lanzamiento de Mac OS X 10.5 Leopard.[1] Con Mac OS X 10.7 Lion, las voces están disponibles en inglés de EE. UU. adicional y otros acentos de inglés, así como en otros 21 idiomas.[2] La función Leer el texto seleccionado al presionar una tecla permite leer el texto seleccionado de cualquier aplicación mediante una combinación de teclas. Desde Mac OS X 10.1 hasta Mac OS X 10.6, la función copiaría el texto seleccionado al portapapeles y lo leería desde allí. Desde Mac OS X 10.7 hasta Mac OS X 10.10, una nueva implementación de la función requirió que los desarrolladores de software implementaran una API de síntesis de voz en sus aplicaciones.[3][4] Esto evitó que se sobrescribiera el portapapeles, pero también significó que, para las aplicaciones que no usaban la API, la función no funcionaría como se esperaba, leyendo la barra de título en lugar del texto seleccionado.[5][6] Reconocimiento de vozApple contrató a muchos investigadores de reconocimiento de voz en 1990. Después de aproximadamente un año, demostraron una tecnología con el nombre en código Casper. Fue lanzado como parte del paquete PlainTalk en 1993. Aunque estaba disponible para todas las máquinas PowerPC Macintosh y AV 68k (era una de las pocas aplicaciones que utilizaba el DSP en Centris 660AV y Quadra 840AV), no formaba parte de la instalación predeterminada del sistema antes de Mac OS X, por lo que requería la usuario para realizar una instalación personalizada del sistema operativo para obtener capacidades de reconocimiento de voz. En Mac OS X 10.7 Lion y versiones anteriores, el reconocimiento de voz de Apple estaba orientado únicamente a comandos de voz, es decir, no estaba destinado al dictado. Se puede configurar para escuchar comandos cuando se presiona una tecla de acceso rápido, después de haber sido dirigido con una frase de activación como "Computadora" o "Macintosh", o sin que se le solicite. Un monitor de estado gráfico, a menudo en forma de personaje animado, proporciona información visual y textual sobre el estado de escucha, los comandos disponibles y las acciones. También puede comunicarse con el usuario mediante síntesis de voz. Las primeras versiones del reconocimiento de voz brindaban acceso completo a los menús. Este soporte se eliminó más tarde, ya que requería demasiados recursos e hizo que el reconocimiento fuera menos confiable, sólo para volver a agregarse en Mac OS X 10.3 como una "tecnología de acceso universal" llamada interfaz de usuario hablada. El usuario puede iniciar elementos ubicados en una carpeta especial, llamada "Elementos que se pueden hablar", simplemente diciendo su nombre (mientras el sistema está en modo de escucha). Apple envió varios AppleScripts en esta carpeta, pero los alias, los documentos y las carpetas se pueden abrir de la misma manera. Las aplicaciones individuales proporcionan funcionalidad adicional. Una interfaz de programación de aplicaciones permite a los programas definir y modificar un vocabulario disponible. Por ejemplo, el Finder proporciona un vocabulario para manipular archivos y ventanas. En OS X 10.8 Mountain Lion, Apple introdujo el "Dictado",[7] destinado a texto general. Originalmente, requería el envío de datos de audio a los servidores de Apple para su procesamiento. En OS X 10.9 Mavericks, Apple agregó la opción de descargar soporte para dictado sin conexión a Internet. A partir de OS X 10.9.3, se admiten ocho idiomas (19 dialectos). En cultura popularEn la radioLa síntesis de voz MacinTalk se puede escuchar en algunos programas de radio: En músicaLa síntesis de voz de MacinTalk se puede escuchar en algunas canciones:
En la película
En televisión
En videojuegos
HardwareApple produjo dos micrófonos bajo el nombre de "Apple PlainTalk Microphone". El primero se envió inclusive con Macintosh LC y los primeros modelos Performa, y tenía apariencia circular. Fue diseñado para colocarse en un soporte adjunto al costado de una pantalla CRT y levantarse y sostenerse con la boca al hablar. El segundo modelo se introdujo junto con los modelos AV de la serie Macintosh Quadra en 1993, pero también se vendió por separado. Fue diseñado para colocarse encima de la pantalla y ser sensible al sonido del frente. Ambos modelos tenían un conector más largo, cuya punta se usaba para proporcionar voltaje de polarización al micrófono. Referencias
Enlaces externos |