domingo, agosto 26, 2007

PageRank™

PageRank™ é uma família de algoritmos para dar pesos numéricos a documentos com hyperlink (ou páginas da web) indexadas por um motor de busca.

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, i. e., cada página tem sua importância na internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância dá-se pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.

Esse critério de ordenação das páginas, de acordo com várias pessoas, é bastante democrático, refletindo o que a "internet pensa" sobre determinado termo. Lembre-se que cerca de dez bilhões de páginas são levadas em conta. A qualidade das páginas mais importantes são naturalmente garantidas, classificadas e eleitas pela própria internet. Além de todas as páginas terem a mesma condição de subir nessa lista, conquistando votos pela internet afora.

Uma boa unidade de medida para definir o PageRank™ de uma página pode ser a porcentagem (%) de páginas que ela é mais importante. Por exemplo, se uma página tem PageRank™ de 33% significa que ela é mais importante que um terço de toda a internet. Se o seu PageRank™ é 99% significa que ela é superior a quase todas as páginas da internet.

Veja uma Animação do funcionamento simplificado e didático do GoogleBot que varre as páginas calculando o PageRank™ no Wikipédia

Sem comentários: