Descobrindo o PageRank de um site via linha de comando

Publicado por Fábio Berbert de Paula em 20/09/2011

[ Hits: 6.670 ]

Blog: https://mestrefabio.com

 


Descobrindo o PageRank de um site via linha de comando



Nesta rápida dica criaremos um simples Perl script para recuperar o PageRank de um site através de linha de comando.

Para quem não sabe o que é PageRank, eis um trecho de sua definição na Wikipédia:

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.


Fonte: http://pt.wikipedia.org/wiki/PageRank

Para executar nosso script será necessário a instalação do módulo Perl WWW:Google::PageRank. Vamos instalá-lo via CPAN:

sudo perl -MCPAN -e shell

Na shell interativa comande:

cpan[1]> install WWW::Google::PageRank
cpan[1]> exit

De volta ao terminal, vamos verificar se a instalação do módulo foi executada com sucesso:

perl -MWWW::Google::PageRank -e 'print "ok\n"'

A saída deve ser um simples "ok".

Agora vamos ao script em si. Abra um editor de texto de sua preferência e crie um arquivo com o seguinte conteúdo:

#!/usr/bin/perl use WWW::Google::PageRank; my $pr = WWW::Google::PageRank->new; foreach my $site (@ARGV) { if ( $site !~ /^http/i ) { $site = "http://$site"; } print "$site tem pagerank " . scalar($pr->get($site)) . "\n"; }

Salve com um nome qualquer, aqui adotei pagerank.pl.

Dê permissão de execução:

chmod a+x pagerank.pl

E finalmente execute-o, passando a lista dos sites desejados como parâmetro:

./pagerank.pl www.vivaolinux.com.br
http://www.vivaolinux.com.br tem pagerank 6


Outro exemplo:

pagerank.pl www.vivaolinux.com.br br-linux.org www.doode.com.br under-linux.org dicas-l.com.br softwarelivre.org www.noticiaslinux.com.br
http://www.vivaolinux.com.br tem pagerank 6
http://br-linux.org tem pagerank 6
http://www.doode.com.br tem pagerank 5
http://under-linux.org tem pagerank 6
http://dicas-l.com.br tem pagerank 7
http://softwarelivre.org tem pagerank 7
http://www.noticiaslinux.com.br tem pagerank 6


É isso.

Um abraço.

Outras dicas deste autor

Nginx - Como redirecionar seu domínio para o www

Catálogo de efeitos de texto para Gimp

Copiando arquivos e diretórios ocultos com rsync

Graduação em TI via EAD - Curso gratuito de 600h pela CECIERJ

Miniaturas de vídeo no Dolphin/KDE (video thumbnails)

Leitura recomendada

Gerando estatísticas de acesso ao web server com awstats em arquivos html estáticos

Munin - estatísticas para servidores

Dicas e macetes sobre o Firefox

Perl e jQuery

Node.js e Apache juntos usando mod_proxy

  

Comentários
[1] Comentário enviado por meiradarocha em 20/09/2011 - 17:33h

Bem interressante!

Vale a pena dar uma olhada nesta página: http://www.webmasterworld.com/forum80/631.htm

[2] Comentário enviado por julio_hoffimann em 20/09/2011 - 18:27h

Legal Fábio!

Como sempre Perl se mostrando uma ótima linguagem para utilitários web. :-)

Abraço!

P.S.: Os comentários enviados por autores nos artigos estão funcionando. ;-)

[3] Comentário enviado por removido em 21/09/2011 - 11:41h

Bem legal !

[4] Comentário enviado por ysquyty em 19/12/2011 - 16:51h

Legal gostei demais. Vou colocar em meu site.


Vinicius

www.dedcomponentes.com.br">www.dedcomponentes.com.br
www.dedcomponentes.com



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts