Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.878 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi
#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
# callback: translate one entity to its ISO Latin value
try:
return defs[m.group(1)]
except KeyError:
return m.group(0) # use as is
def descape(string):
return pattern.sub(descape_entity, string)
#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')
#Operações
try:
novo = descape(f.read())
w.write(novo)
finally:
f.close()
w.close()
print "Finalizado!!!"
Just Do It - XML Generic Editor
Verificar se um número é primo
Modificação do Ubuntu Tweak para Debian
Nenhum comentário foi encontrado.
Cirurgia para acelerar o openSUSE em HD externo via USB
Void Server como Domain Control
Modo Simples de Baixar e Usar o bash-completion
Monitorando o Preço do Bitcoin ou sua Cripto Favorita em Tempo Real com um Widget Flutuante
[Resolvido] VirtualBox can't enable the AMD-V extension
Como verificar a saúde dos discos no Linux
Como instalar , particionar, formatar e montar um HD adicional no Linux?
Como automatizar sua instalação do Ubuntu para desenvolvimento de software.
Não consigo instalar distro antiga no virtualbox nem direto no hd (11)
Quais os códigos mais dificeis que vcs sabem fazer? (12)
systemd-resol... precisa ser reiniciado periodicamente [RESOLVIDO] (7)









