Descobrindo o PageRank de um site via linha de comando

Publicado por Fábio Berbert de Paula em 20/09/2011

[ Hits: 7.552 ]

Blog: https://fabio.automatizando.dev

 


Descobrindo o PageRank de um site via linha de comando



Nesta rápida dica criaremos um simples Perl script para recuperar o PageRank de um site através de linha de comando.

Para quem não sabe o que é PageRank, eis um trecho de sua definição na Wikipédia:

O sistema PageRank é usado pelo motor de busca Google para ajudar a determinar a relevância ou importância de uma página. Foi desenvolvida pelos fundadores do Google, Larry Page e Sergey Brin enquanto cursavam a Universidade de Stanford em 1998.

O Google mantém uma lista de bilhões de páginas em ordem de importância, isto é, cada página tem sua importância na Internet como um todo; esse Banco de Páginas mantém desde a página mais importante do mundo até a menos importante. Essa importância se dá pelo número de votos que uma página recebe. Um voto é um link em qualquer lugar da Internet para aquela página. Votos de páginas mais importantes valem mais do que votos de páginas menos importantes.


Fonte: http://pt.wikipedia.org/wiki/PageRank

Para executar nosso script será necessário a instalação do módulo Perl WWW:Google::PageRank. Vamos instalá-lo via CPAN:

sudo perl -MCPAN -e shell

Na shell interativa comande:

cpan[1]> install WWW::Google::PageRank
cpan[1]> exit

De volta ao terminal, vamos verificar se a instalação do módulo foi executada com sucesso:

perl -MWWW::Google::PageRank -e 'print "ok\n"'

A saída deve ser um simples "ok".

Agora vamos ao script em si. Abra um editor de texto de sua preferência e crie um arquivo com o seguinte conteúdo:

#!/usr/bin/perl use WWW::Google::PageRank; my $pr = WWW::Google::PageRank->new; foreach my $site (@ARGV) { if ( $site !~ /^http/i ) { $site = "http://$site"; } print "$site tem pagerank " . scalar($pr->get($site)) . "\n"; }

Salve com um nome qualquer, aqui adotei pagerank.pl.

Dê permissão de execução:

chmod a+x pagerank.pl

E finalmente execute-o, passando a lista dos sites desejados como parâmetro:

./pagerank.pl www.vivaolinux.com.br
http://www.vivaolinux.com.br tem pagerank 6


Outro exemplo:

pagerank.pl www.vivaolinux.com.br br-linux.org www.doode.com.br under-linux.org dicas-l.com.br softwarelivre.org www.noticiaslinux.com.br
http://www.vivaolinux.com.br tem pagerank 6
http://br-linux.org tem pagerank 6
http://www.doode.com.br tem pagerank 5
http://under-linux.org tem pagerank 6
http://dicas-l.com.br tem pagerank 7
http://softwarelivre.org tem pagerank 7
http://www.noticiaslinux.com.br tem pagerank 6


É isso.

Um abraço.

Outras dicas deste autor

online_man - Páginas de manual online no terminal

Como ordenar arquivos por tamanho

Criando GIFs animadas pelo terminal GNU/Linux

Como instalar última versão Node.js via repositório no Ubuntu, Debian e derivados

Estatísticas completas do mercado de browsers

Leitura recomendada

Perl e jQuery

Dicas e macetes sobre o Firefox

Munin - estatísticas para servidores

Gerando estatísticas de acesso ao web server com awstats em arquivos html estáticos

PrintScreen em modo texto

  

Comentários
[1] Comentário enviado por meiradarocha em 20/09/2011 - 17:33h

Bem interressante!

Vale a pena dar uma olhada nesta página: http://www.webmasterworld.com/forum80/631.htm

[2] Comentário enviado por julio_hoffimann em 20/09/2011 - 18:27h

Legal Fábio!

Como sempre Perl se mostrando uma ótima linguagem para utilitários web. :-)

Abraço!

P.S.: Os comentários enviados por autores nos artigos estão funcionando. ;-)

[3] Comentário enviado por removido em 21/09/2011 - 11:41h

Bem legal !

[4] Comentário enviado por ysquyty em 19/12/2011 - 16:51h

Legal gostei demais. Vou colocar em meu site.


Vinicius

www.dedcomponentes.com.br">www.dedcomponentes.com.br
www.dedcomponentes.com



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts