Check the new version here

Popular channels

Manual para entender Google

Manual para entender Google: El dios PageRank y sus adoradores mentirosos

El Page Rank es un algoritmo utilizado por Google para dar mayor importancia y ordenar las búsquedas que se realizan en el buscador. Su escala en la superficie pone nota del 1 al 10 a todas las webs de la Red. Sin miramientos, Google ha castigado con una rebaja de la calificación de miles de web sites, incluso a su propio YouTube, que ha pasado de 8 a 7 en el escalafón.


Los fundadores de Google, Sergey Brin (izq.) y Larry Page, durante una conferencia de prensa en Bangalore, India.


CIUDAD DE BUENOS AIRES (edición i). Google ha destapado su cólera ante aquellas páginas web y blogs que pretendían engañar a su algoritmo PageRank, el núcleo de su éxito como buscador desde 1998.

PageRank (PR) es un valor numérico que representa la importancia que una página web tiene en Internet. Google se hace la idea de que cuando una página coloca un enlace (link) a otra, es un voto para esta última.

PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto de Información Cientifica (ISI) en los Estados Unidos durante la década del '50.

El Science Citation Index pretende resolver la asignación objetiva de méritos cientificos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos cientificos) es más alto colaboran en mayor medida con el desarrollo de su área de investigación.

El índice de citación es un elemento determinante para seleccionar que investigadores reciben becas y recursos de investigación.

Así, la patente más famosa de Google es una de las principales ventajas competitivas que permitió a esta compañia aplastar a sus competidores en el campo de las busquedas en internet.

El Page Rank es una idea genial para hallar el valor o 'importancia' que tiene una página web determinada. Y esa 'importancia' se emplea después para mostrar los resultados de mayor calidad cuando realizamos una búsqueda en Google.

La calidad de los resultados de Google empleando este método (combinado, por supuesto, con otros algoritmos) es lo que provocó la muerte de los antiguos buscadores (Altavista, Metacrawler).

Hoy en la Red hay numerosos servicios que ayudan a cualquier webmaster a mostrar el PageRank actual en su página web: junto al código, tambien se introduce un enlace de vuelta hacia PageRank Tracking, lo que ayuda aumentar el PageRank y la importancia de esa web para la lista de los sitios top. Un enlace del directorio ayuda a indexar la propia página web de forma más rápida y aumenta los resultados de los motores de búsqueda.

Los sitios con más PageRank son los que obtienen los ingresos publicitarios más importantes.


Edificio de Google, uno de sus centros de investigación y desarrollo distribuidos por el planeta Tierra.



Edificio de Google, uno de sus centros de investigación y desarrollo distribuidos por el planeta Tierra.


Es decir que el puesto de una página es el resultado de una 'votación' entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página. Un hiperenlace a una página cuenta como un voto de apoyo.

El PageRank de una página depende del PageRank de todas las páginas que la enlazan. Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto. Si no hay enlaces a una página web, no hay apoyo a esa página específica.

CÓMO FUNCIONA

La 'importancia' de una página web sólo depende de las paginas web que la enlazan.

Si una página web es enlazada desde páginas importantes (de alto Page Rank), esa página recibira una parte de esa importancia. Y viceversa.

Una página web distribuye por igual su importancia entre todas las páginas a las que enlaza.

Es decir: Si a su página la enlaza una página importante que enlaza 3 ó 4 páginas además de la suya, es mucho mejor que si la enlaza una página igual de importante que enlace 30 ó 40 (hay más PageRank a repartir).

No se puede hablar de PageRank sin avanzar sobre los Spiders (arañas), veloces programas automáticos que recorren internet como si fuesen un usuario humano, pulsando todos los enlaces posibles, extendiendose así por la Red y creando un mapa de la misma.

Los Spiders proporcionan a Google un mapa de la red donde se puede ver qué página apunta a que página (en internet hay millones de páginas apuntándose unas a otras y cada día son más). La pregunta que vale es cómo crear un algoritmo que sea capaz de lidiar con tantos enlaces.

Algunos han especulado feo al respecto y el castigo ha sido masivo, en especial con los bloggers, que descubren que Google les ha rebajado el rating en varios grados por uso comercial de enlaces con otras páginas web.

LA FUERZA

Google destaca por un objetivo concreto: desarrollar el motor de búsqueda 'perfecto', lo que, en palabras de Larry Page, cofundador de la empresa, se define como algo que "comprende exactamente lo que quiere decir el usuario y le ofrece exactamente lo que desea".

Para alcanzar esta meta, Google ha desarrollado su propia infraestructura de publicación y la innovadora tecnología PageRank. En teoría, fantástico.

Desde el principio, sus programadores comprendieron que ofrecer los resultados más precisos con la mayor rapidez posible exigía cambiar la configuración de los servidores. Mientras que la mayoría de los motores funcionaba con diversos servidores de gran tamaño que, a menudo, disminuían su rendimiento en los momentos de mayor carga, Google se decantó por PC enlazados, que permitían localizar rápidamente la respuesta a cada consulta.

Esta innovación se tradujo en unos tiempos de respuesta más reducidos, una mayor escalabilidad y unos costos menores.

El software que sustenta la tecnología de búsqueda de Google ejecuta una serie de cálculos simultáneos en apenas una fracción de segundo. Los motores de búsqueda tradicionales suelen basarse en la frecuencia de aparición de una palabra en una página web.

Pero Google utiliza PageRank para examinar toda la estructura de vínculos de la web e identificar las páginas más importantes. A continuación, realiza un análisis de concordancia de hipertexto a fin de determinar qué páginas son relevantes respecto a la consulta concreta que se ha planteado.

Entonces, PageRank realiza una valoración objetiva de la importancia de las páginas web resolviendo una ecuación de más de 500 millones de variables y 2.000 millones de términos.

PageRank interpreta un vínculo de la página A a la B como un voto para la página B por parte de la A. Y a continuación, valora la importancia de la página en cuestión contando la cantidad de votos recibidos. E incrementa el valor de la página enlazada.

Las páginas importantes reciben un PageRank más elevado y se sitúan entre los primeros resultados. La tecnología de Google utiliza la inteligencia colectiva de Internet para determinar la importancia de una página. Los resultados se determinan sin intervención ni manipulación humana. Es el motivo de la confianza de los usuarios, que consideran Google una fuente de información objetiva no tergiversada por motivos económicos.

Pero, de pronto, comenzaron a abundar los cuestionamientos y hasta las críticas a PageRank.

EL DESCALABRO

Cientos de webmasters han vivido semanas de tensión mientras se producía el proceso de revisión del ráting PageRank durante más de seis meses, cuando lo habitual era un trimestre, y se han producido sorpresas negativas.

La rebaja del PageRank se entiende de facto como una penalización. Es un castigo a las prácticas ilegales para el posicionamiento web, y son consecuencias de las críticas a Google que han surgido.

Entonces Google ha demostrado su posición de fuerza en Internet, y su enorme control sobre el funcionamiendo de la Red.

"Todo parece indicar que la empresa ha realizado una identificación manual de los programas más conocidos de Venta de Enlaces, bien de manera espontánea o bien utilizando los formularios de denuncia", le dijo Enrique Dans, profesor de Tecnología del Instituto de Empresa, a ElConfidencial.com/

Según Dans, la medida es inteligente.

Por su parte, Antonio Ortiz escribió en el blog sobre tecnología Error 500 que "Google tiene una posición de fuerza desde la cual puede obligar a que se construya una web para su buscador y no al contrario (...) Ha forzado una situación en la que todos pierden".

El problema es que la imagen de Google cambió: se encuentra valorizada a más de US$ 200.000 millones pero para preservar la cotización, se enfrentó a sus viejos aliados, los webmasters.

¿Google está siguiendo el derrotero de Microsoft? Sería peligroso para el buscador.

¿Habrá en breve un movimiento antiGoogle como lo hay antiWindows? ¿Surgirá el Linux de los buscadores?

Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg, es el algoritmo HITS. Pero hay otras ideas en elucubración. Google deberá no solamente reinstalar la credibilidad de otrora sino... no volver a perderla.

Fuente:
http://www.edicioni.com/ver_articulo.php?id=405&pagina=1
http://www.edicioni.com/ver_articulo.php?id=405&pagina=2
http://www.edicioni.com/ver_articulo.php?id=405&pagina=3
0
0
0
0
0No comments yet