Durante a última década, o número de usuários de internet tem aumentado diariamente. Uma das razões por trás deste aumento são os smartphones que proporcionam ótimos recursos, bem como a facilidade de acesso à rede. Hoje em dia, diferentes gerações de smartphones estão se tornando mais populares e usando diferentes protocolos relacionado à internet.
A busca pela facilidade e comodidade deu início a utilização de computadores pessoais, assim como a necessidade das empresas, instituições financeiras, bancos e sites de compras na tentativa de corresponder a tais adjetivos que interessam a um público em massa, pois, diversos benefícios ocorrem com tais serviços tal como a redução do tráfego na cidade e consequentemente a redução da poluição do ar e com isso a economia do tempo, custos dentre outras características.
Diante do exposto, atribuímos à internet a grande revolução cultural existente em meio à sociedade contemporânea por se caracterizar como uma ferramenta ilimitada, possibilitando diversas ramificações, e o email, um dos serviços de internet mais conhecido e utilizado com frequência, pois ele substitui a carta convencional, tem se tornado o principal canal utilizado para a realização do phishing. A utilização do email tornou-se uma das partes essenciais da vida do ser humano, tanto na vida doméstica quanto profissional, além do lazer na qual tem se tornado algo comum.
A internet, ao conectar milhares de pessoas, possui usuários com diversos objetivos, desde os que desconhecem o perigo e acessam links maliciosos abrindo portas para invasores, popularmente conhecidos por hackers, crackers ou intrusos, e inclusive aqueles que desejam realizar ataques a computadores vulneráveis. No entanto, o email é um dos serviços que oferece essa vulnerabilidade a começar pela opção "Manter-me conectado". Esta opção ao oferecer facilidade durante os acessos, é um convite a invasão.
Roubos, sabotagem e extorsão são considerados os principais objetivos do phishing. Entende-se por phishing como uma palavra derivada do "pescar, pois consiste em "utilizar métodos tecnológicos que levem o utilizador a revelar dados pessoais e/ou confidenciais" (INTEGRASUL, 2016).
O phishing é então uma espécie de estelionato, e, de acordo com o Código Penal Brasileiro, estelionato é "obter, para si ou para outrem, vantagem ilícita, em prejuízo alheio, induzindo ou mantendo alguém em erro, mediante artifício, ardil, ou qualquer outro meio fraudulento" (BRASIL, 1984).
O email possui limitações que possibilita a farsa do remetente. Além disso:
"A maioria dos clientes de email suporta HTML nativamente, assim todos os recursos da linguagem HTML podem ser utilizados numa mensagem de email. Como o email suporta HTML e o hyperlink (link usado em hipertexto, onde se pode associar a um texto visível uma URL "invisível"), ambos se tornaram uma poderosa ferramenta para os malfeitores (phishers)" (OLIVO, 2010, p.3).
Contudo, a técnica de disseminação de phishing através de emails pode ser comparada à técnica do spam podendo também ambos serem confundidos, embora o phishing visa afetar a vítima nas questões financeiras realizando roubo de informações bancárias, sendo no entanto mais grave que o spam que envia mensagens indesejadas. Para melhor compreensão, os phishings são essencialmente divididos em dois grupos:
- o primeiro é o de Phishing Tradicional, que seria o equivalente a "pescar com rede";
- e o segundo grupo de ataque é chamado de Spear Phishing.
A tradução da palavra "Spear" para o português é lança ou arpão. Embora o phishing e o spear phishing usem técnicas similares, não devem ser confundidos. O phishing é um ataque geralmente exploratório que visa um público mais amplo, enquanto o spear phishing é uma versão direcionada do phishing. Eles são diferentes no sentido de que o phishing é um ataque mais direto - depois que os agressores roubam uma informação, como credenciais de banco, já têm o que pretendiam obter. No spear phishing, o roubo bem-sucedido de credenciais ou informações pessoais é, muitas vezes, apenas o começo do ataque porque a informação só é usada para obter acesso à rede do alvo - um passo que no fim leva ao ataque direcionado (INTEGRASUL, 2016).
Entretanto, existem formas de iludir as vítimas através de propagandas enganosas e apelativas com falsas promoções, e até manuais de como ganhar na loteria. Parece algo banal, mas existem inúmeras pessoas que se deixam levar por propagandas como essas e fornecem dados pessoais e bancários, além de dados de cartão de crédito.
Instituições famosas e de credibilidade como Bradesco, Santander e Itaú não estão livres da atitudes destes phishings pois devido a seriedade destas instituições, há uma facilidade em extrair dados suficientes para a realização do phishing. Entretanto, serão abordadas.
Partindo disso, resolvemos analisar o conteúdo de sites fraudulentos utilizando a análise avançada de suas imagens para que partindo desta avaliação possamos retirar dos resultados informações relevantes como: se aquela imagem se parece com logo de alguma instituição financeira, se aquela imagem se parece com logos de empresas famosas, se sim, quanto por cento.
A proposta é um método de detecção de Phishing com base na análise do conteúdo de sites, mais especificamente as imagens.
No método proposto, foram usados 1000 sites reais, hospedados em um servidor de uma hospedagem brasileira, a Umbler. Neste conjunto foram adicionados sites contendo Phishing de instituições financeiras e falsos sites da Instituição de ensino Faculdades QI, ambos autorizados e depois removidos da estrutura, usados apenas para fins acadêmicos. Foram também analisados cerca de 4000 imagens. Foi usado a ferramenta de análise de imagens do Google, a Cloud Vision para fazer a parte de análise da imagem, Um script para coletar todas imagens do site e enviar para a api do Google, trazendo em tela o resultado da análise do site e de suas respectivas imagens. Foram analisados 1000(mil) sites; cerca de 4000(quatro mil) imagens analisadas; Cloud Vision API; Script para coletar url das imagens; Script customizável; tendo uma boa assertividade.