Python: automatizando a extração de informações na web com expressões regulares
Presenciamos uma grande necessidade e valorização de soluções para recuperação, filtragem e organização de informações da Internet. O presente artigo pretende ilustrar, de forma didática, como automatizar a obtenção de informações dinâmicas em páginas web utilizando a linguagem Python e seu amplo suporte a expressões regulares.
Introdução
No atual estágio de expansão e dinamismo da Internet, a posse de informações concisas e de qualidade é um requisito essencial para que um site, aplicação ou empresa se destaque em seu meio. Portanto, há uma grande necessidade e valorização de soluções para recuperação, filtragem e organização das informações que se encontram na web.
O presente artigo pretende ilustrar, de forma didática, como automatizar a obtenção de informações dinâmicas em páginas web utilizando a linguagem Python e seu amplo suporte a expressões regulares.
Serão explicados, passo a passo, exemplos envolvendo exibição da previsão do tempo, obtenção de postagens no Twitter, download de imagens e acesso aos resultados de buscas no Google.
Compreendendo os exemplos demonstrados, o leitor poderá facilmente desenvolver aplicativos capazes de obter diversas informações dinâmicas como: cotações, notícias, postagens etc. Recomenda-se que o leitor já possua conhecimentos básicos da sintaxe da linguagem Python e de expressões regulares.
É importante lembrar que para tarefas mais complexas de Parser (X)HTML em Python existem diversos módulos prontos, como o Beautiful Soup.
O presente artigo pretende ilustrar, de forma didática, como automatizar a obtenção de informações dinâmicas em páginas web utilizando a linguagem Python e seu amplo suporte a expressões regulares.
Serão explicados, passo a passo, exemplos envolvendo exibição da previsão do tempo, obtenção de postagens no Twitter, download de imagens e acesso aos resultados de buscas no Google.
Compreendendo os exemplos demonstrados, o leitor poderá facilmente desenvolver aplicativos capazes de obter diversas informações dinâmicas como: cotações, notícias, postagens etc. Recomenda-se que o leitor já possua conhecimentos básicos da sintaxe da linguagem Python e de expressões regulares.
É importante lembrar que para tarefas mais complexas de Parser (X)HTML em Python existem diversos módulos prontos, como o Beautiful Soup.
Parabens.