Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.464 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python # -*- coding: iso-8859-15 -*- ''' Script para unescape de caracteres especiais ISO-8859-1 Autor: Mayron Cachina Contato: mayroncachina@gmail.com Site: http://cachina.wordpress.com ''' import htmlentitydefs import re import cgi #Informações origem = raw_input("Local do arquivo do arquivo original: ") fim = raw_input("Local do arquivo final: ") pattern = re.compile("&(\w+?);") def descape_entity(m, defs=htmlentitydefs.entitydefs): # callback: translate one entity to its ISO Latin value try: return defs[m.group(1)] except KeyError: return m.group(0) # use as is def descape(string): return pattern.sub(descape_entity, string) #Abre os arquivos para manipulação de dados f = open(origem) w = open(fim,'w') #Operações try: novo = descape(f.read()) w.write(novo) finally: f.close() w.close() print "Finalizado!!!"
Jogo de adivinhar o número aleatório
Nenhum comentário foi encontrado.
Crie alias para as tarefas que possuam longas linhas de comando - bash e zsh
Criando um gateway de internet com o Debian
Configuração básica do Conky para mostrar informações sobre a sua máquina no Desktop
Aprenda a criar músicas com Inteligência Artificial usando Suno AI
Entendendo o que é URI, URL, URN e conhecendo as diferenças entre POST e GET
Como instalar o XFCE4-terminal na sua distribuição Linux e integrá-lo ao sistema
Como instalar o Tilix Terminal no Gnome e usá-lo como menu drop-down ao estilo Quake
Instalando Grub Customizer no Ubuntu 24.04
Problemas chatos alguem se aventura na ajuda? (2)
Atualização pra versão 2.7.0 (2)
Navegadores com linhas na tela [RESOLVIDO] (11)
Som continua saindo no auto-falante mesmo com headphone, como conserto... (4)