Google ya puede indexar documentos escaneados PDF

carlos31 Octubre 2008 - 1:02pm 0 comentarios
Enviar por Email Imprimir

Google ha anunciado que va a comenzar a incluir documentos escaneados en sus resultados de búsqueda, una verdadera hazaña. Ya que a diferencia de los documentos de texto estándar, los archivos escaneados no contienen datos de texto que las arañas de Google puedan indexar. En su lugar, Google debe emplear un procedimiento llamado Reconocimiento óptico de caracteres (o también llamado OCR), tecnología que convierte las palabras de fotos digitales en texto plano.

Google indexa documentos PDF

Con este nuevo método, los documentos PDF aparecerán directamente enlazados en el buscador, sin poner en riesgo la calidad de sus búsquedas. Pues, si bien es cierto, desde hace mucho Google ofrece PDFs en su buscador, siempre basaba estas búsquedas en base a metadatos cercanos al documento. Ahora, en cambio, cada vez que veamos un documento como PDF, también tendremos la opción de verlo como HTML.

En la imagen de encima pueden ver como quedarán los resultados con los documentos PDF escaneados y su enlace para verlo como HTML.

Fuente | Google blog

Tutoriales

Cómo descargar videos de VK.com
En este artículo voy a explicar como descargar videos y películas...
Descargar Facebook Móvil Gratis
Por si aún no lo han hecho, es posible descargar Facebook Móvil...
Cómo generar tráfico web con las redes sociales - Paso a Paso
Muchas empresas están publicando contenidos como la forma de crear...

Artículo Recomendado

3 Tips cruciales para recuperar archivos eliminados
¿Te imaginas perder el trabajo de toda una semana en tan solo unos segundos? Todos hemos pasado por este problema. Quizás eliminamos por error un archivo importante o lo borramos sin pensar que era valioso para otro... más