Esta aplicación iOS extrae texto de las imágenes y lo convierte en un documento editable. También demuestra las capacidades de los servicios de aprendizaje automático de Google.
A primera vista, la aplicación LetterSnap iOS lanzada el 17 de noviembre de 2019 parece bastante sencilla. Abre la aplicación, apunta el teléfono a algún texto y toca para hacer una foto. LetterSnap identifica el texto de la imagen y le proporciona texto que puede editar.
Para probar la aplicación, usé LetterSnap para convertir los caracteres de las fotos en texto para tres tareas comunes.
Tomé una foto de una página de texto en un libro. En este caso, página 136 de «Impossible to Ignore» de Carmen Simon. La aplicación intentó convertir parte de la ilustración en texto, pero por lo demás capturó gran parte del texto con precisión.
Luego, capturé una imagen de la información que aparece en la pantalla de una computadora. A menudo tomo una foto de la información del sistema para evitar escribirla, pero luego termino mirando la imagen y escribiendo los datos más tarde. LetterSnap me dio texto que podía copiar y pegar sin necesidad de escribirlo.
Luego, escribí en una pizarra y tomé una foto del texto. Una vez más, aunque no era perfecto, LetterSnap capturó y convirtió la mayor parte de lo que escribí, e ignoró las estrellas que garabateé alrededor del título.
Tenga en cuenta que todas estas tareas son complicadas. Tomé la foto del libro mientras lo sostenía. La foto de la pantalla del portátil incluía un logotipo, espacios desiguales y texto que se mostraba en varias partes de la imagen. Y la pizarra, y todas las fotos, capturaron tanto la luz como las sombras intencionadamente. Pero el reconocimiento de texto, en su mayor parte, funcionó.
Puede utilizar LetterSnap para tomar y extraer texto de 10 fotos de forma gratuita. Después de eso, pagas por cada paquete de fotos: 0,99 euros compra 200 conversiones, 1,99 euros por 450, o 3,99 euros por 950.
Pero, la parte más interesante de LetterSnap no está en la aplicación. Es que la aplicación utiliza Google Cloud Vision para ofrecer reconocimiento óptico de caracteres (OCR. Esto significa que el OCR se produce gracias a la API de visión de Google y a los modelos de aprendizaje de máquinas de imágenes.
Más información sobre Movilidad
Hasta la fecha, las propias aplicaciones de Google han tendido a ofrecer las ventajas del aprendizaje automático, como el reconocimiento de imágenes en Google Photos, la traducción de idiomas en Google Translate y sugerencias de temas relacionados más inteligentes con Google Explore. Pero LetterSnap muestra que un desarrollador independiente de aplicaciones para móviles también puede aprovechar la potencia del aprendizaje automático de Google Cloud Vision.
A medida que más desarrolladores integren el soporte para servicios cloud de aprendizaje de máquinas, espero que cambien los precios de las aplicaciones y los ciclos de actualización.
En primer lugar, el precio de las aplicaciones puede evolucionar hacia un modelo de uso -más, más de pago-. Por ejemplo, los usuarios frecuentes de LetterSnap tendrán que pagar por conversiones adicionales. Espero ver más aplicaciones con modelos de pago por uso o de precios escalonados. (Para otro ejemplo, eche un vistazo a Evernote, que ofrece búsqueda de personajes a un precio superior, y que recientemente anunció una transición a la plataforma Google Cloud Platform.)
En segundo lugar, puedes esperar que las aplicaciones mejoren sin necesidad de actualizaciones. La precisión del reconocimiento de LetterSnap mejorará a medida que mejoren las funciones de reconocimiento de caracteres de Google Cloud Vision. Esto es un cambio con respecto a la mayoría de las aplicaciones móviles actuales que sólo mejoran cuando se lanza e instala una nueva versión. Las aplicaciones que incorporan funciones de la plataforma en nube mejorarán a medida que mejoren los servicios de fondo, de forma similar a como mejoran los resultados de búsqueda de Google con el tiempo.
Por lo tanto, si desea convertir fotos a texto que puede editar, pruebe con LetterSnap. Eso es exactamente lo que hace la aplicación. Pero LetterSnap también demuestra el poder del aprendizaje automático de Google como un servicio, en una aplicación que la mayoría de la gente puede entender.
¿Qué hay de ti?
Además de Google Photos, Google Translate y LetterSnap, ¿qué aplicaciones utiliza para demostrar el poder del aprendizaje automático? Díganoslo en los comentarios.
Boletín semanal de Google
Descubre cómo sacar el máximo partido a Google Docs, Google Apps, Chrome, Chrome OS, Google Cloud Platform y todos los demás productos de Google utilizados en entornos empresariales.
Viernes de entrega