Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.752 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python # -*- coding: iso-8859-15 -*- ''' Script para unescape de caracteres especiais ISO-8859-1 Autor: Mayron Cachina Contato: mayroncachina@gmail.com Site: http://cachina.wordpress.com ''' import htmlentitydefs import re import cgi #Informações origem = raw_input("Local do arquivo do arquivo original: ") fim = raw_input("Local do arquivo final: ") pattern = re.compile("&(\w+?);") def descape_entity(m, defs=htmlentitydefs.entitydefs): # callback: translate one entity to its ISO Latin value try: return defs[m.group(1)] except KeyError: return m.group(0) # use as is def descape(string): return pattern.sub(descape_entity, string) #Abre os arquivos para manipulação de dados f = open(origem) w = open(fim,'w') #Operações try: novo = descape(f.read()) w.write(novo) finally: f.close() w.close() print "Finalizado!!!"
Modificação do Ubuntu Tweak para Debian
Probabilidade de Vencer - Poker Texas Hold
Criador de instalador USB Linux bootável com Python
Compartilhe suas configurações gconf
Nenhum coment�rio foi encontrado.
Visualizar câmeras IP ONVIF no Linux sem necessidade de instalar aplicativos
Atualizar Debian Online de uma Versão para outra
Máquina perereca - até onde é possível o uso de Linux?
Convertendo pacotes DEB que usam ZSTD (Padrão Novo) para XZ (Padrão Antigo)
Colocando skins no VLC Media Player
Como anda a saúde do disco rígido?
Debian 13 "trixie&... lançado! (30)
O que você está ouvindo agora? [2] (203)