Jeanine Heck, vicepresidenta de productos de IA de Comcast, explica cómo Comcast ha integrado el aprendizaje profundo en su propio control remoto de voz de IA, llevando su producto a un nuevo nivel de éxito.
Cómo el aprendizaje profundo y el poder de la IA en el control remoto de voz de ComcastJeanine Heck, vicepresidenta de productos de IA en Comcast, analiza cómo Comcast ha integrado el aprendizaje profundo en su propio control remoto de voz de IA, llevando su producto a un nuevo nivel de éxito.
La vicepresidenta de AI de Comcast, Jeanine Heck, habla con Tonya Hall de ConsejoTecnologico.com sobre el éxito de un producto de voz remota de AI, integrado con el aprendizaje profundo. La siguiente es una transcripción editada de la entrevista.
Tonya Hall: Es empujar para hablar, y no siempre escuchar. Bienvenida, Jeanine.
Jeanine Heck: Gracias, Tonya.
Más información sobre la inteligencia artificial
Hall: Entonces, ¿en qué consiste tu papel, exactamente?
Heck: Mi papel es realmente ser un gerente de producto, y eso implica trabajar con el equipo de ingeniería para asegurar que estamos construyendo productos que son valiosos para nuestros clientes, por lo que es importante para mí en mi papel entender las necesidades de los clientes, cómo utilizan nuestros productos hoy en día, cómo pueden querer utilizar nuestros productos mañana, y también asegurarse de que los productos son muy competitivos en el mercado. Así que estoy analizando todo esto e interpretándolo para nuestros equipos de ingeniería, de modo que podamos priorizar nuestro trabajo de ingeniería de acuerdo con lo que mejor se adapte a las necesidades del cliente.
Hall: ¿Cómo ha implementado el aprendizaje automático y la inteligencia artificial en todo Comcast?
Heck: Bueno, en muchos sentidos, en realidad. Pero yo diría que el más emocionante ha sido nuestro control remoto de voz. Así que estamos usando nuestra propia inteligencia artificial en el control remoto para hacer reconocimiento de voz y procesamiento natural de imágenes. Y también hemos utilizado el aprendizaje profundo en los últimos años para mejorar realmente la precisión de nuestros resultados de voz a distancia, y esto los ha llevado a un nivel completamente diferente de precisión, debido a lo que se puede hacer con el aprendizaje profundo.
Hall: Ahora, tu control remoto de voz, ¿se llama X1?
Heck: Sí, nuestra plataforma de TV, nuestra plataforma de entretenimiento, se llama X1, y el control remoto de voz se llama control remoto de voz X1.
Hall: ¿Qué lo hace tan especial?
Heck: Aplana la interfaz de usuario, la forma en que expresamos el beneficio. Es un botón. Puede hacer de todo en la televisión. Así que no necesitas saber ningún otro truco, excepto presionar el botón y decir lo que quieras. Y nuestro equipo de ingeniería ha pasado años desarrollando los componentes de procesamiento en lenguaje natural para que realmente pueda entender cuál es su intención, y usted no tiene que ir por todas partes en la guía si sabe exactamente lo que quiere. Puede llevarte directamente allí sin tener que pulsar muchos botones o saltar a través de un montón de pantallas.
¿Al cambiar el mundo? Quizás eventualmente, pero definitivamente no hoy (ConsejoTecnologico.com)
Hall: ¿Qué tipo de problemas estaba tratando de resolver, o qué tipo de experiencia mejorada estaba tratando de ofrecer?
Heck: Bueno, cuando nos pusimos en marcha, realmente pensamos que estábamos construyendo una mejor manera de encontrar una película o un programa cuando sabíamos exactamente cuál era el programa. Y ese sigue siendo realmente el mayor beneficio que podemos dar. Así que si sabes que quieres ver Modern Family, dices «Modern Family», y te lleva directamente allí. O si sabes que quieres ver comedias en HBO, puedes decir, «comedias en HBO», y te lleva directamente allí.
Sin embargo, una de las cosas que más nos ha sorprendido, que no nos propusimos hacer, es la capacidad de cambiar de canal con sólo decir el nombre. Eso fue algo de lo que no estábamos realmente seguros hasta que lo pusimos frente a los clientes en las pruebas, y vimos que cuando la gente dijo «CNN», querían que el canal cambiara directamente a CNN. En realidad se ha convertido en uno de nuestros casos de mayor uso, y creo que esos dos problemas, sin necesidad de recordar los números de canal, y sin necesidad de ir marcando letra por letra el nombre de un programa en el teclado del televisor, esos dos problemas que se están resolviendo son probablemente las cosas más grandes que hemos logrado con el control remoto de voz. He estado trabajando en la industria de la televisión durante mucho tiempo, y especialmente en la parte de descubrimiento de contenido de la casa. Esos son problemas que existían en la guía, ya que como hemos estado haciendo guías, y el control remoto de voz realmente resuelve esos problemas y ayuda a la gente a obtener su contenido más rápidamente. Es como un gran salto adelante desde donde estábamos.
Hall: ¿Qué otro tipo de cosas aprendiste a través de la experiencia del usuario que no esperabas?
Heck: Yo diría que una cosa realmente genial es que la gente aprecia que sus palabras aparezcan en la pantalla del televisor. Es una pequeña característica de usabilidad, pero cuando veas tus propias palabras …. Así que si digo «ver ESPN», y veo las palabras «ver ESPN» en la televisión…. Parece muy sencillo, pero para nosotros era… Ayudó a hacer el producto muy utilizable, pero creo que también creó un poco de magia. Por primera vez, podías ver en un instante que tu televisor te escuchaba. Así que realmente fue esta nueva y emocionante experiencia, y había algo de magia en ella, así como alguna utilidad real, porque si te escuchaba mal o te malinterpretaba, podías ver de inmediato lo que escuchaba.
Hall: ¿Se realiza el análisis de voz AI en la nube, o en la red, o de alguna manera se almacena localmente en el dispositivo?
VER Informe especial: Cómo implementar la IA y el aprendizaje automático (ConsejoTecnologico.com PDF gratuito)
Heck: Todo está sucediendo en la nube. En realidad, X1 es una plataforma basada en la nube para la televisión, y eso es algo que nos entusiasma a todos en el lado de la ingeniería, porque una vez que llegamos a una vibración basada en la nube, podíamos desplegarnos cuando quisiéramos. Podríamos desplegar, lanzar una nueva guía de la noche a la mañana para todos nuestros clientes. Y antes de eso, tuvimos que ir mercado por mercado, porque todo el código de un decodificador se descargaba literalmente a la propia caja, por lo que era un proceso muy intensivo de control de calidad, de garantía de calidad, sólo para asegurarnos de que el código estaba listo para entrar en la caja, porque era algo difícil de deshacer. Así que hoy en día, con la nube, las soluciones de nube y la capacidad de volver a actuar con mucha más facilidad, podemos asumir muchos más riesgos.
Hall: ¿Cuáles fueron algunos de los mayores desafíos que se encontraron al desplegar esto?
Heck: El mayor desafío, yo diría, conseguirlo en un dispositivo físico remoto, fue uno de los mayores desafíos. Fue muy sencillo iniciar el control por voz en una aplicación, así que lo hicimos desde el principio. Lo pusimos en marcha en 2012, lo lanzamos inmediatamente a principios de 2013 como una aplicación para iOS y Android, para que pudieras ir a la aplicación y tocar el micrófono y hablar con tu televisor, y hacer todas las cosas que puedes hacer hoy en día en el mando a distancia. El control remoto nos llevó un poco más de tiempo, y creo que nos adelantamos a nuestro tiempo con la necesidad de enviar audio a través de un control remoto al decodificador, así que no todos los protocolos estaban ahí para usar la radiofrecuencia, o RF, para enviar el audio al decodificador, por lo que nuestra sincronización fue un poco más temprana cuando construimos la primera versión del control remoto, pero para el momento en que construimos la segunda, ya teníamos este grandioso protocolo, llamado RF4CE, que nos permite enviar audio desde el control remoto directamente al decodificador y luego a la nube.
Hall: Sí, fuiste el primero en vender con esto, ¿verdad?
Heck: Lo estábamos. Ciertamente la primera compañía de cable, la MSO como nos llamamos nosotros mismos, en lanzar un control remoto de voz.
Hall: ¿Y es más importante ser el primero en llegar al mercado, o es más importante tener una especie de espera, un análisis de investigación aplicada, y luego desplegarlo?
Heck: Creo que es más importante hacerlo bien. Así que no lanzaría nada sólo para ser el primero. Pero cuando estás desarrollando algo dentro de una empresa y ves a otras empresas lanzarse, tal vez antes que tú, te sientes como si dijeras:»Ojalá fuéramos nosotros». Pero al mismo tiempo, cada vez que veía a alguien lanzando un producto de voz, antes de que lanzáramos nuestro control remoto de voz, esto reforzaba realmente lo emocionado que estaba con nuestro producto, porque creo que el nuestro es superior a lo que se ha lanzado.
Hall: Entonces, ¿dices que Comcast entonces tal vez toma grandes riesgos, o emplea más bien una especie de esperar a ver qué pasa?
Heck: Creo que Comcast se arriesga mucho. Con el control remoto de voz, nuestro equipo de liderazgo decidió poner un control remoto de voz con cada set-top box que se apagó. Desde el día en que lanzamos el control remoto de voz, que se convirtió en el control remoto predeterminado, y el otro control remoto, dejamos de implementarlo. Así que fue una gran decisión, una gran inversión financiera por parte de la empresa para poner un mando a distancia que tiene voz. Corrimos un gran riesgo porque creíamos que el producto estaba a la altura y que teníamos una precisión muy alta con nuestro reconocimiento de voz, así que realmente aceptamos la apuesta y dijimos de inmediato: «Este es el mando a distancia para todos».
VER: Por qué la colaboración humano-AI dominará el futuro del trabajo (Tech Republic)
¿Cuántas unidades ha colocado en su casa hasta ahora?
Heck: Hoy en día tenemos más de 20 millones de mandos a distancia de voz en los hogares.
¿Cómo se aproxima a la seguridad y la privacidad?
Heck: Bueno, nos tomamos la privacidad muy en serio. Nuestros ingenieros en realidad …. No combinamos la información de la cuenta con la información de uso, así que desde nuestro punto de vista, todo es anónimo, y si la usamos, generalmente es en conjunto, y realmente tratamos de separar cualquier información que sea personal. Realmente no hay nada en el control remoto de voz que sea…. Separamos totalmente cualquier información de su cuenta o su factura de lo que ve en la televisión. En realidad no nos importa mucho quién dice qué. Se trata más bien de observar las tendencias y los mayores patrones de uso de los agregados, y en realidad las máquinas pueden hacer gran parte del análisis allí, por lo que normalmente estamos…. Nos lo tomamos muy en serio con la privacidad, y nos aseguramos de tratar las cuentas por separado.
¿Cómo se está enfrentando a la competencia?
Heck: Yo diría que siempre estamos tratando de mantenernos por delante de la competencia. Creo que Comcast ha sido muy bueno siendo competitivo con nuestros productos. Con X1, hemos estado por delante. Hicimos una gran apuesta por hacer una guía basada en la nube, comenzando a incorporar Internet o TV IP en la guía muy pronto. Con voz, yo diría que definitivamente nos hemos asegurado de, número uno, ver cómo la gente está usando el control remoto. Podemos entender si nuestras características no satisfacen sus necesidades observando de cerca lo que la gente está diciendo y cómo podemos mejorar su experiencia. Yo diría que nosotros, debido a nuestra escala y a nuestro uso hoy en día, debido a que tenemos tanta gente que usa este mando a distancia a diario, que realmente somos muy proactivos a la hora de mejorar la experiencia, y pensamos que en realidad aprendemos más viendo lo que nuestros usuarios están haciendo que lo que está haciendo la competencia.
Hall: De acuerdo.
Heck: Eso nos ayuda a seguir siendo competitivos.
Hall: ¿Te responde a ti? ¿Alguna vez te contestará?
Heck: No te responde, y en realidad es por elección propia. Probamos la capacidad del guía para responderle. Así que le dije: «Muéstrame películas en HBO», y decía: «Mostrar películas en HBO», y me pareció redundante, y nos dimos cuenta de que en su mayoría era molesto. En realidad no estaba añadiendo a la experiencia, sino que era una especie de estorbo, así que lo que hemos hecho con nuestro control remoto de voz, y creo que realmente hemos diferenciado el producto de muchas maneras, pero una de ellas es que realmente se sale del camino». Es una interfaz de voz que te lleva directamente a lo que quieres, y luego se vuelve a callar. Así que hemos hecho un montón de cosas como esa que lo hacen diferente, así que no le damos personalidad a nuestro control remoto de voz. Se llama Voice Remote, y no intenta ser tu amigo o conectarte emocionalmente, sólo intenta que puedas interactuar con tu televisor usando la voz, porque creemos que esa es la mejor manera de llegar a tu contenido.
Hall: Sabes, puede que quiera que se conecte conmigo emocionalmente. ¿Por qué no puede ser un robot, verdad?
Heck: Bueno, lo bueno de la televisión y el X1 es que te conectas con tu contenido. Así que para nosotros, una de las cosas que hicimos fue que podías hablar con los súbditos con el control remoto de voz, así que cuando la película de los súbditos se lanzaba, podías decir «Banana», y el control remoto de voz respondía con, en primer lugar, una lista de contenido que era todo acerca de la comida, porque para los súbditos banana significa que están hambrientos. Y también oirías a los súbditos contestarte y decir: «¡Banana!» Y fue bastante divertido, pero cuando hacemos que la voz del mando a distancia sea interactiva, normalmente se trata de conseguir que el contenido o la marca interactúe con el usuario, no tanto con el mando a distancia en sí mismo.
Hall: Vale, Comcast adquirió Fandango en 2007. Recientemente ha lanzado algo para mejorar la experiencia de la voz. Habla de eso.
VER: Guía del líder de TI sobre el futuro de la inteligencia artificial (Tech Pro Research)
Heck: Sí, así que tenemos una función muy buena en la que puedes ver un tráiler de una película, y puedes decir, «Get tickets», y te mostraremos una aplicación de Fandango en el televisor que te permite comprar entradas de cine en tu televisor con una aplicación. También podrás iniciar sesión en la aplicación Fandango de tu teléfono, pero nosotros te facilitamos mucho la realización de la transacción en tu televisor. Esto es algo que hemos escuchado de los usuarios que ellos querían, y por eso estábamos muy emocionados de poder ofrecerlo.
Hall: Ser competitivo y mantenerse competitivo es un problema para cualquiera en esta industria. ¿Cuántos empleados de Comcast se han enfocado en la tecnología emergente?
Heck: Tenemos muchos empleados centrados en la tecnología emergente. Yo diría que tenemos a todo nuestro equipo X1, que es un equipo bastante grande. Normalmente no hablo de números, exactamente, públicamente, pero creo que tenemos un equipo bastante competitivo, ciertamente en la industria del cable y de la televisión en términos de tamaño. Así que un equipo bastante grande, y somos capaces de reclutar de todas las áreas diferentes, por lo que tenemos un montón de… Nuestro equipo trabaja en la IA, por lo que somos capaces de atraer a la gente directamente desde sus programas de doctorado que quieren ir a una empresa donde pueden resolver problemas muy interesantes con muchos datos, porque sabemos que con la IA, muchas veces es, seguro que los algoritmos son emocionantes, pero los datos son lo que hace que los algoritmos, es como si completaran los algoritmos. En una empresa como Comcast, tenemos una escala enorme, por lo que nuestros ingenieros están muy entusiasmados con la escala que tenemos con nuestros productos y con la cantidad de datos sobre los que podemos entrenar cuando estamos construyendo algoritmos.
Hall: Cuéntanos sobre la Semana del Laboratorio y la Feria de Ciencias.
Heck: Me encanta la Semana del Laboratorio. Sí. Tres veces al año, la TPX de Comcast, es como se llama nuestro departamento, Producto y Experiencia Tecnológica, tenemos tres Semanas de Laboratorio al año. Se anima a los ingenieros a trabajar en cualquier cosa que les entusiasme, o en una nueva característica o en un nuevo producto que quieran ver construido. Tienen tiempo para esa semana completa para concentrarse en ese producto, y luego tenemos una feria de ciencias al final de la semana donde los ingenieros muestran el trabajo que han hecho esa semana, y nuestros ejecutivos hasta el CEO vienen a la Feria de Ciencias de la Semana del Laboratorio y caminan por el piso para ver cuáles son las nuevas ideas». Me encanta, porque realmente creo que las mejores ideas provienen de los ingenieros, especialmente de los ingenieros que trabajan en los productos. Ellos saben dónde llevar el producto a continuación, así que creo que el evento de la Semana del Laboratorio refuerza esa creencia como empresa de que queremos fomentar que nuestros equipos de ingeniería aporten más ideas».
Hall: Bien, Jeanine, ¿cuáles son algunos de los objetivos futuros relacionados con el aprendizaje automático, la inteligencia artificial o la Internet de las cosas que habéis planeado?
VER: Investigación: Las empresas carecen de habilidades para implementar y apoyar la IA y el aprendizaje automático (Tech Pro Research)
Heck: Somos, además del reconocimiento de voz, también somos… Tenemos mucho trabajo en el espacio de recomendaciones. Así que cuando te mueves por la guía X1, recibes recomendaciones de contenido y siempre digo, hasta que sepamos exactamente lo que quieres ver ahora mismo, nuestro trabajo de IA no se hace allí. Todavía tenemos un montón de esfuerzos en el hogar que nos entusiasman bastante. Así que uno de ellos es con cámaras. Nuestro equipo de IA ha construido algunas de nuestras propias capacidades de visión por ordenador, y lo lanzamos el año pasado en las cámaras Xfinity Home Cameras. Una de las cosas que lanzamos es la capacidad de crear una mejor miniatura inteligente, por lo que hacemos zoom en el objeto en movimiento de tu miniatura, en lugar de que veas siempre el mismo fotograma, por lo que es mucho más fácil encontrar el vídeo que te interesa desde la cámara de tu casa. Así que sí, tenemos un montón de… Nuestro equipo se centra en la amplia gama, o diría que la cartera, de productos de Comcast, y cualquier producto que tenga la marca Xfinity o que se pueda utilizar desde Comcast, es un producto al que estamos aplicando la IA.
Hall: Bueno, muchas gracias, Jeanine, por darnos una idea de cómo estás enfocada en el aprendizaje automático y la inteligencia artificial, y de lo que podemos esperar ver de Comcast en el futuro. Si alguien quiere conectarse contigo, tal vez quiera saber más sobre estos productos, ¿cómo pueden hacerlo?
Heck: Sí, creo que la mejor manera es encontrarme en Twitter. Puedes encontrarme con el mango de Twitter @j9heck y me encantaría saber de ti, así que por favor, ponte en contacto conmigo.
Hall: Muchas gracias de nuevo. Y si quieren seguirme, pueden hacerlo. Puedes ver más de mis entrevistas aquí mismo en ConsejoTecnologico.com, o en ZDNet. O tal vez si quieres conectarte conmigo en los medios sociales, puedes ir a TonyaHall.net, y tengo enlaces a mi Facebook, mi LinkedIn, Pinterest incluso. De hecho, si quieres chatear, me encantaría que me siguieras en Twitter. Estoy en @TonyaHallRadio en Twitter. Me encantaría saber de ti. Gracias por vernos.
Próximo boletín informativo de Big Thing
Conoce las ciudades inteligentes, la IA, la Internet de las cosas, la RV, la conducción autónoma, los aviones no tripulados, la robótica y más de las innovaciones tecnológicas más geniales. Entregado los miércoles y viernes
mismo