Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.901 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi
#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
# callback: translate one entity to its ISO Latin value
try:
return defs[m.group(1)]
except KeyError:
return m.group(0) # use as is
def descape(string):
return pattern.sub(descape_entity, string)
#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')
#Operações
try:
novo = descape(f.read())
w.write(novo)
finally:
f.close()
w.close()
print "Finalizado!!!"
Tkinter - Sistema de Cadastro de Cursos, Alunos e Turmas
Gerador de referência cruzada de texto
Programa para derivação de funções matemáticas polinomiais
Nenhum comentário foi encontrado.
Gentoo binário em 2026: UEFI, LUKS, Btrfs e Systemd
Trabalhando Nativamente com Logs no Linux
Jogando Daikatana (Steam) com Patch 1.3 via Luxtorpeda no Linux
LazyDocker – Interface de Usuário em Tempo Real para o Docker
Servidor vs Computador Convencional
Como administrar uma rede Linux através da ferramenta Webmin
Como escanear portas de um servidor através da ferramenta Nmap e como alterar a porta do SSH.
Marcando e desmarcando pacotes para atualização, instalação e remoção no Debian e agregados
Internet não funciona corretamente no Linux (4)
Após todos esses anos... youtube! (5)
Pendrive do Ubuntu 24.04 travando ao tentar fazer a instalação dual bo... (4)









