Descubre las entrañas de cómo funciona Google Search y cómo aparece tu empresa en los resultados.

    Hace poco escribí un artículo sobre la gestión del cambio en el centro de datos y necesitaba proporcionar algunos ejemplos de software relacionado, así que consulté a Google para ver qué podía encontrar. Evolven fue uno de los mejores resultados de la lista, así que examiné sus productos e incluí una referencia en el artículo.

    Eso me hizo pensar más tarde: «¿Cómo fue exactamente Evolven en la parte superior de los resultados de búsqueda? ¿Se debe a que se identifican más estrechamente con el software de gestión del cambio? ¿Tienen la mayor satisfacción del cliente? ¿Hay más personas buscándolas que otras empresas? ¿Han actualizado recientemente su sitio web? ¿Cómo funciona esto de la Búsqueda de Google? ¿Por qué me pregunto esto cuando puedo averiguarlo en Google?» Y así lo hice.

    Google proporciona lo que es indiscutiblemente el motor de búsqueda más popular y eficaz (el único que se ha convertido en un verbo, como cuando la gente dice que va a «Google» un tema para saber más. Muchos de nosotros damos por sentado que la Búsqueda de Google sólo funciona y los resultados son válidos sin preocuparnos de lo que sucede detrás de la cortina o de cómo se organizan las cosas. Sin embargo, como usted está leyendo esto en ConsejoTecnologico.com, lo más probable es que usted sea el tipo de persona a la que le gusta ver lo que hay detrás de esa cortina, especialmente si usted es dueño de o trabaja en un negocio en el que Google devuelve resultados de búsqueda para el público. Vamos a tirar hacia atrás, ¿de acuerdo?

    Tenga en cuenta que hay elementos relacionados con la Búsqueda de Google, como la Búsqueda instantánea y la función «Me siento afortunado», pero a efectos de este artículo me centraré en la estructura subyacente y en cómo se devuelven los resultados.

    Al principio….

    Empecemos con lo básico. Según Wikipedia, Google Search fue creado en 1997 por Larry Page y Sergey Brin y actualmente realiza más de tres mil millones de búsquedas diarias para los usuarios. Estas búsquedas se llevan a cabo a través de 60 trillones de páginas web utilizando un índice (un directorio de datos) que, según Google, tiene un tamaño de 95 petabytes: ¡aproximadamente 100 millones de gigabytes!

    Paso 1: Explorando la Web

    Google ofrece una explicación interesante del proceso de búsqueda que afirma que utilizan un software especial (conocido como «Googlebot») que se ejecuta en un gran número de ordenadores para rastrear la web, siguiendo enlaces «de página en página» (esto me recuerda a los extrañamente eficientes robots araña de la película «Minority Report» de 2002 -quizás sea más reconfortante pensar en los secuaces de «Despicable Me». Googlebot comienza desde su último estado de rastreo y busca con frecuencia nuevos sitios, cambios en los sitios actuales y enlaces no válidos.

    Google insiste en que no acepta dinero para favorecer una u otra página rastreándola con más frecuencia, pero los propietarios de sitios pueden especificar hasta cierto punto cómo se rastrean sus sitios (o si se rastrean en absoluto. Por ejemplo, pueden impedir que los resúmenes aparezcan en los resultados o que sus sitios se almacenen en caché en los servidores de Google.

    Paso 2: Organizar los datos

    Ahora que han explorado el territorio, los rastreadores web de Google informan sobre las páginas que visitaron, y ese enorme índice de 95 petabytes se actualiza. Para poner las cosas en perspectiva, esto es 95.000.000.000.000.000.000.000 de bytes de tamaño – casi el doble de la cantidad de información jamás escrita por la humanidad. Sin embargo, esto no es todo lo que podrían indexar: Google dice que «Googlebot puede procesar muchos, pero no todos, los tipos de contenido. Por ejemplo, no podemos procesar el contenido de algunos archivos multimedia o páginas dinámicas».

    Paso 3: Presentación de los datos

    Una búsqueda en Google no sólo se zambulle en este índice y busque lo que necesita. Eso tomaría mucho tiempo y devolvería mucha basura. Se utilizan varios factores para presentar los resultados de búsqueda más relevantes, y aquí es donde se encuentra la «receta de Coca Cola». Algunos de estos factores son conocidos y otros se mantienen confidenciales para frustrar a los descontentos que podrían tratar de manipular injustamente el sistema (léase: spammers y otros tipos de escoria y villanía.

    ¿Cuáles son los factores conocidos?

    • Tipo de contenido (relevancia de los datos del sitio para los términos de búsqueda)
    • Calidad del contenido (el corrector ortográfico se utiliza para separar los sitios profesionales de los imitadores descuidados)
    • Frescura de contenido (los sitios a partir de 1996 tienen menos probabilidades de ser devueltos antes que los sitios a partir de 2013)
    • La región del usuario (no tiene sentido devolver páginas web en otro idioma)
    • Legitimidad del sitio (si se considera que la página puede estar relacionada con el spam)
    • Nombre y dirección de la página web
    • Sinónimos de las palabras de búsqueda
    • Promociones en redes sociales
    • Cuántos enlaces apuntan a una página web en particular
    • El valor de esos enlaces

    Estos dos últimos implican un proceso crucial llamado «PageRank». PageRank clasifica las páginas web en función de una puntuación. A los sitios se les asignan estas puntuaciones en función de si los enlaces a los mismos proceden de sitios importantes o de «mayor autoridad»: páginas de alto tráfico y bien establecidas. Estos sitios se presentan más arriba en la lista de resultados de búsqueda, lo que permite al buscador alcanzar el objetivo correcto.

    Tenga en cuenta que PageRank es lo suficientemente inteligente como para diferenciarse centrándose en la cantidad y la calidad. Si un sitio tiene 5 enlaces de alta calidad desde sitios importantes y otro tiene 10 enlaces de baja calidad desde sitios sin importancia, el primer sitio terminará con una puntuación de PageRank más alta.

    Por ejemplo, si el New York Times contiene varios enlaces a mi blog de escritura, a mi blog se le dará un PageRank más alto que si una persona, Joe-Bob Taylor de Huckaloosa, Arkansas, se conecta a mi blog desde su casi extinta página web de pesca (¡lo siento, Joe-Bob!. Esto significa que si alguien busca temas de escritura y mi blog contiene información relevante que cumple con sus criterios, es más probable que vean mi página en los resultados gracias a esos enlaces del New York Times.

    Del mismo modo, en el caso de Evolven, supongo que su sitio apareció entre los primeros resultados de búsqueda de «software de gestión del cambio» debido a la relevancia y la frescura de su contenido, los enlaces que apuntan a su sitio y la importancia de los sitios que proporcionan esos enlaces.

    Suena simple, pero aún hay mucho más detrás de esa cortina. La entrada de Wikipedia en PageRank presenta un algoritmo «simplificado»:

    Si te gustan las ecuaciones, esta página las tiene en abundancia.

    ¿Cómo puedo mejorar mi puntuación en PageRank?

    Naturalmente, ha habido intentos de elevar las puntuaciones del PageRank del sitio web a través de tácticas furtivas como Google Bombs y Link Farms. Conseguir que Joe Bob y todos sus hermanos y primos tengan un enlace a su sitio tampoco ayudará mucho, como hemos visto. Sin embargo, hay formas legítimas de mejorar la puntuación de PageRank de su sitio web. Ahí es donde la optimización de motores de búsqueda (SEO) entra en juego. En mi próximo artículo discutiré cómo funciona el SEO y cubriré los principios que puedes aplicar a tu negocio.