| Aplacando La Competencia | Todo Ads | Ciber Autores |
|---|
13
2008
Misión Google #1: Cómo logro que Google me indexe?

MISIÓN POSiCIONAMIENTO WEB
Inicio con éste, un una serie de post donde hablaré de la optimización para motores de busqueda y posicionamiento web.
1- Cómo trabaja google?

Indexación
Lo primero necesario para indexar páginas web es interpretarlas. El proceso de interpretación debe contemplar un gran, enorme, numero de posibles errores que varÃan desde errores en etiquetas HTML, miles de ceros en medio de un tag, caracteres no-ASCII, etiquetas mal anidadas y no cerradas, etiquetas anidados en forma casi infinita y gran variedad de otros errores. Para maximizar la velocidad Google usa flex para generar un analizador léxico que se alimenta con su propia pila. El desarrollo de este intérprete, que debe correr a una velocidad razonable y ser muy robusto, involucra gran cantidad de trabajo. Una vez interpretado cada documento es codificado en los barrels. Cada palabra es convertida en un Word-Id usando una tabla de hashing mantenida en memoria, o sea, el léxico. Nuevos agregados a la tabla de hashing del léxico son registrados en un archivo. Una vez que las palabras son convertidas en wordIDs sus ocurrencias en el documento son traducidas a hit-lists y son almacenadas en los barrels. La mayor dificultad con la paralelización de la fase de indexado es que el léxico debe compartirse. En lugar de compartir el léxico, Google escribe un registro de todas las palabras extras que no están en el léxico base que se fijó en 14 millones de palabras. De esta forma múltiples indexadores pueden ejecutarse en paralelo y luego el archivo de registro puede ser procesado por el último indexador.
Para generar el Ãndice invertido, el indexador toma cada uno de los barrels ordenándolo por wordID para producir un barrel invertido. El proceso de ordenamiento también es paralelizado para usar tantas máquinas como se pueda simplemente corriendo múltiples ordenadores que pueden procesar diferentes buckets al mismo tiempo. Dado que los barrels no caben en memoria, el clasificador los subdivide en baskets ordenando cada basket en memoria y volcando el contenido combinado al barrel.
Búsqueda (Searching)
El objetivo del proceso de búsqueda es proveer una búsqueda de calidad y eficiente. Muchos de los grandes buscadores comerciales han hecho grandes progresos en cuanto a la eficiencia, por lo que Google se ha concentrado en proveer calidad en los resultados. El proceso de consultas de Google involucra 4 pasos: interpretar la consulta, convertir palabras en wordIDs, buscar el principio de la doclist en el barrel que corresponde a cada palabra. Buscar en los doclists hasta que se encuentre un documento que contiene todos los términos buscados y finalmente computar el orden (ranking) correspondiente de cada documento.
Con la información de los Ãndices se accede a los servidores de documentos de Google que contienen una copia de cada web indexada.
- Google contiene más de 4000 millones de páginas, por cada página almacena 10KB de información, lo que supone 40 Terabytes de información.
- Google dispone de 50 mirrows (replicas) por cada servidor.
Por último se aplica el algoritmo de PageRank para ordenar los resultados de la búsqueda por relevancia. El algoritmo de PR calcula la relevancia de una web gracias a 2 billones de ecuaciones con más de 500 millones de variables.
Con toda esta información se crea y muestra al usuario la conocida página de resultados SERP, merece la pena mencionar que Google completa todo este proceso de búsqueda en menos de 1 segundo.
Esto es basicamente una introducción al tema, porque lograr que google indexe nuestro sitio es más facil de lo que algunos podrian imaginarse. El método oficial para que Google indexe una página web es añadiendo la url desde este link: http://www.google.es/intl/es/addurl.html, sinembargo puede tardar hasta 6 meses o más para que nuestra página sea indexada.
Ahora te explico paso a paso lo que debes hacer para que tu web este indexada en Google:
Logra que un sitio web que ya esté indexado por google te linkee a ti. Pues esto podrÃa ser difÃcil, pero no lo es, hazlo asÃ:
1- Envia 2 articulos de tu web a Digg, Propeller y Meneame.
2- SuscrÃbete en 2 directorios de paginas web como: WebEspacio, RaisMave.
Listo, eso es todo, en 2 dias o menos tu sitio estará indexado por Google, OJO, indexado, no POCISIONADO, en futuros articulos te explicaré como alcanzar los primeros lugares en las busquedas de google.
Tags: google, pocisionamiento web



















