Capturar imagens de um site

Publicado por Fábio Berbert de Paula 13/11/2002

[ Hits: 10.323 ]

Homepage: https://fabio.automatizando.dev

Download getImages.zip




Script usado para fazer o download usando o wget de todas as imagens de determinada URL. Por exemplo, se você estiver visitando um álbum de fotos e deseja salvar as 50 fotos que aparecem numa única página, ao invés de clicar 50 vezes com o mouse e escolher  "Salvar como ...", você executa o getImages.pl

  



Esconder código-fonte

#!/usr/bin/perl
# +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
# getImages.pl
#
# Script usado para fazer o download usando o wget de todas as 
# imagens de determinada URL. Por exemplo, se você estiver visitando 
# um álbum de fotos e deseja salvar as 50 fotos que aparecem numa 
# única página, ao invés de clicar 50 vezes com o mouse e escolher 
# "Salvar como ...", você executa o getImages.pl
# 
#
# Programado por Fábio Berbert de Paula <fabio@vivaolinux.com.br>
# Na web em: www.vivaolinux.com.br
#
# Rio de Janeiro, 05 de Agosto de 2002
# +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

# carregar os módulos necessários
use strict;

use IO::Socket;

# -----------------------------------
# configure as variáveis abaixo
my $site = "www.enderecodosite.com";
my $url = "/nomedapagina.html";
# -----------------------------------

# vou abrir uma conexão socket com o site e baixar o código HTML da página
my $post = new IO::Socket::INET-> new (
        PeerAddr  => $site,
        PeerPort  => "80",
        Proto     => "tcp",
        Type      => SOCK_STREAM,
        Timeout   => "30"
);

# requisitar a URL em questão
my $header = "GET $url HTTP/1.0\r\nHost: $site\r\n\r\n";
$post->send($header);
while (my $saida = <$post>) {
   # processar cada tag <img src="..."> ....
   if ($saida =~ /img src=\"(.*)\"/i) {
      my $img = $1;
      $img =~ s/\".*$//;
      $img =~ s/\(/\\\(/;
      $img =~ s/\)/\\\)/;
      print "Baixando $img ...\n";
      system("wget -c $site/$img 1>/dev/null 2>/dev/null");
   }
}
print "Divirta-se !!!\n";

Scripts recomendados

Getter - Gerencia downloads

Index Location

Web crawler simples em Perl

Obtendo o IP público (Internet) usando o Perl

Pagerank Checker


  

Comentários
[1] Comentário enviado por miltonb em 11/12/2003 - 14:28h

Olá...
Eu achei este script interessante. mas nao entendi exatamente sua execução?

Como faço para executar o script ( seria ./getImages.pl) uo não grato pela atenção.

[2] Comentário enviado por D4rk 4ng3l em 18/01/2005 - 21:36h

pow pra onde vai os arquivos salvos???

[3] Comentário enviado por fabio em 18/01/2005 - 23:27h

Vão para o diretório que você o executou.

[]'s


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts