Convertir y corregir texto con formato iso8859


Seguro que más de una vez te has encontrado texto con formato iso 8859
codificado de forma incorrecta, mostrando cosas como esta:
Estas p=E1ginas est=E1n desarrollados por mi compa=F1ero Gru=F1on.
en lugar del texto correcto
Estas páginas están desarrollados por mi compañero Gruñon.

Podemos solucionar este pequeño inconveniente con sed

Sed es un potente comando que permite realizar multitud de
operaciones sobre textos, por lo que parece una buena elección para realizar
la sencila conversión de formatos motivo de este artículo.

Basandome en la información de esta página:
iso8859.html
, he creado este sencillo script en sed:

#! /bin/sed -f

# iso8859toascii.sed
# Script sed que convertix textes iso8859 mal formats

s/=E1/á/g
s/=E9/é/g
s/=ED/í/g
s/=F3/ó/g
s/=FA/ú/g

s/=C1/Á/g
s/=C9/É/g
s/=CD/Í/g
s/=D3/Ó/g
s/=DA/Ú/g

s/=E0/à/g
s/=E8/è/g
s/=EC/ì/g
s/=F2/ò/g
s/=F9/ù/g

s/=3D/=/g
s/=3A/:/g
s/=2E/./g
s/=2C/,/g

s/=BF/¿/g
s/=20/ /g
s/=F1/ñ/g
s/=D1/Ñ/g

Podría haber elegido perl, awk, shell scripts, C,
etc …, pero creo que no es mala elección el uso de sed,
de todas forma os invito a todos a que propongaís otras alternativas para
realizar esta sencilla conversión de textos, seguro que todos
aprenderemos algo 😉


$ alias carcoco=”echo Carlos Cortes”

http://bulma.net/todos.phtml?id_autor=132

Este post ha sido traido de forma automatica desde https://web.archive.org/web/20140625063149/http:/bulma.net/body.phtml?nIdNoticia=1280 por un robot nigromante, si crees que puede mejorarse, por favor, contactanos.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.