Las impresoras de HP podrían pronto limpiar las páginas Web para su impresión y, al mismo tiempo, añadirles anuncios.
Una impresora que reformatea las páginas automáticamente para reducir los elementos innecesarios podría ahorrar en tinta y realizar impresiones más fáciles de leer. Sin embargo, ¿aceptaría usted a cambio la inclusión de algunos anuncios adicionales en el documento? Los investigadores de los laboratorios HP, piensan que sí.
"Según algunas estadísticas, casi la mitad de las impresiones realizadas en impresoras HP provienen de la Web, pero la experiencia es realmente mala en comparación con los documentos de Office o los PDF", afirma Parag Joshi, miembro del Laboratorio para la Interacción y la Comprensión Multimedia de HP, con sede en Palo Alto, California. Joshi y su colega Sam Liu dirigieron el desarrollo del software que extrae el texto y las imágenes pertinentes de un artículo en línea y descarta el resto de la página, para obtener una impresión mucho más limpia. Este sistema elimina los elementos innecesarios como los elementos de navegación o los anuncios en línea, por lo que se gasta menos tinta y papel.
Al mismo tiempo, el sistema puede insertar publicidad seleccionada para coincidir con el contenido. Este software "es una manera con la que HP podría generar ingresos adicionales", comenta Liu, "pero también puede proporcionar una mejor experiencia al usuario y ahorrarle dinero."
Los anuncios que aparecen en la versión impresa son escogidos por unos algoritmos que escanean el contenido de un artículo, y pueden ser diseñados para adaptarse mejor a la página impresa, señala Joshi. Por ejemplo, pueden estar más basados en imágenes, o incluir cupones que pueden llevarse a una tienda para recibir un descuento--ambas tácticas que son más comunes en la publicidad impresa que en línea.
Para determinar qué partes de una página web conservar y cuáles descartar, el software de HP primero renderiza la página de la misma forma que un navegador Web. A continuación, analiza cómo se transmiten el texto y las imágenes a través de diferentes secciones de la página para extraer el texto y las imágenes principales. Varios indicios hacen posible excluir con precisión todo lo que no sea el contenido de un artículo, afirma Liu. Por ejemplo, el hecho de que los anuncios a menudo son etiquetados como tales y que no constan de pie de foto hace que sean fáciles de detectar.
Este aspecto del programa es similar al funcionamiento de algunos plugins para navegadores como Readability--ahora integrado en el navegador Safari de Apple--que lo elimina todo menos el cuerpo del texto de una página y lo presenta en un diseño limpio y de fácil lectura. Sin embargo, el sistema de HP también preserva las imágenes relevantes y tiene que hacer el trabajo extra de dar formato a la página impresa, e incluir los nuevos anuncios.
La selección de los anuncios adecuados implica extraer el significado del texto. "Una vez que hemos identificado el contenido principal, usamos el aprendizaje de máquina para encontrar las correspondientes categorías semánticas", explica Liu. Seguidamente, los anuncios relacionados con esas categorías son seleccionados para su inserción en el documento.
Actualmente, se puede escoger la disposición final de un pequeño conjunto de plantillas muy similares que organizan el artículo en columnas. "Estas producen documentos que parecen una revista de noticias", afirma Liu. Una de las características previstas que se encuentra en desarrollo en este momento es la combinación de varios artículos para ahorrar papel, en vez de imprimir cada uno de forma individual. "Podría suscribirse a un canal de RSS y obtener una pequeña revista generada automáticamente, o combinar artículos de diferentes portales", destaca Joshi.
Richard Ziade, socio fundador de la consultora de diseño neoyorkina Arc90, que desarrolló el plugin Readability, destaca que muchas personas se están dando cuenta que a menudo los diseños de las páginas web dejan mucho que desear en lo que a leer el contenido se refiere.
"Cuando sacamos [Readability], la enorme respuesta que recibimos dejó claro que realmente habíamos dado en el nervio", explica él. "Actualmente se vive una frustración frente a todo el desorden y la poca accesibilidad en la web, mientras que antes había una especie de acuerdo de que "lo recibo de forma gratuita, así que voy a tolerar el mal diseño."
La erosión de este acuerdo ha dado lugar a herramientas como Readability, Instapaper, y la aplicación Flipboard para el iPad, que crea una experiencia parecida a la lectura de una revista a partir de los artículos compartidos por los amigos de un usuario. "Recientemente, parece que HP también está explorando cómo utilizar mejor el contenido web", comenta Ziade.
Ziade está menos seguro del tamaño del mercado para la impresión del contenido en línea. "Probablemente no hay un gran porcentaje de personas que impriman todas sus lecturas desde dispositivos portátiles y las aplicaciones para ellos, como Flipboard, están mejorando realmente rápido."
Por el momento, la tecnología de HP se está probando en forma de plugins de los navegadores Firefox e Internet Explorer. Estos plugins añaden un botón al navegador que, cuando se hace clic en él, envía la página a un servicio que se ejecuta en una plataforma de computación en nube que reformatea la página, inserta los anuncios, y envía el resultado final de vuelta al ordenador del usuario para la impresión.
El próximo año, indica Liu, se desarrollará una versión para la tienda de aplicaciones que acompaña al nuevo servicio de impresión basado en la nube, ePrint, de HP. ePrint permite que cualquier dispositivo conectado a Internet--incluyendo los teléfonos de tipo smartphone que no disponen de los controladores de la impresora--pueda imprimir un documento mediante el envío a una dirección de correo electrónico asociada a una impresora física. La tienda de aplicaciones—llamada ePrintCenter--ofrece a los usuarios acceso a aplicaciones inteligentes, como un servicio de suscripción a periódicos, o el que está siendo desarrollado por Liu y Joshi.