Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 26/11/2008
[ Hits: 6.044 ]
Homepage: http://mayroncachina.net
Script para conversões de caracteres especiais ISO-8859-1 para UTF-8
#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi
#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
# callback: translate one entity to its ISO Latin value
try:
return defs[m.group(1)]
except KeyError:
return m.group(0) # use as is
def descape(string):
return pattern.sub(descape_entity, string)
#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')
#Operações
try:
novo = descape(f.read())
w.write(novo)
finally:
f.close()
w.close()
print "Finalizado!!!"
Cria no fluxbox um menu para mudar o wallpaper
SnakeSQL - Crie consultas SQL facilmente
Criador de instalador USB Linux bootável com Python
Nenhum comentário foi encontrado.
File Browser: Crie sua Nuvem Pessoal Privada
A produção de áudio e vídeo no Linux e as distribuições dedicadas a esse fim
Criptografando sua Home com Gocryptfs para tristeza do meliante
A Involução do Linux e as Lambanças Desnecessárias desde o seu Lançamento
O Journal no Linux para a guarda e consulta de logs do sistema
Assistindo IPTV no Linux com Fred TV e Lista Free TV
Impressora Tomate MDK-007 no Ubuntu (ou qualquer distro Linux)
Acelerando a compilação de pacotes no Arch Linux (AUR) usando todos os núcleos do processador
VoidBR - Void Linux adaptado ao Brasil. (6)
Vídeo sobre o papel de parede (0)
Teclado sem conseguir usar o acento crase (2)
Warsaw no Ubuntu/Kubuntu 26.04, alguiém conseguiu? [RESOLVIDO] (2)









