uni2ascii : convertir unicode a ascii


Sovint quan generam continguts per la web ens trobam amb problemes amb les codificacions de caràcters. Aquests accents que no se veuen bé, aquest unicodes, … Linux té una petita utilitat que es excel·lent per resoldre aquests tipus de problemes uni2ascii

Traducción al castellano
automática vía Internostrum

El primer que hem de fer és mirar si la utilitat és al nostre sistema, si no hi és obviament caldrà instal·lar-la. El paquet Debian s’anomena uni2ascii:

uni2ascii – convert UTF-8 into 7-bit ASCII and vice versa

Així que amb un apt-get ho tindrem llest. Ara sols ens queda fer la conversió.
uni2ascii utilitza els fluxs d’entrada i sortida estàndar és a dir haurem d’utilizar < i > per a enviar-li texts d’entrada i deixar-los als nostres arxius de sortida, però també ho podem utilitzar directament des de la consola, com a una bona eina per tenir oberta per quan no recordam com es codifica un caràcter. Per exemple

aaloy@G5:~/tmp$ uni2ascii -Q -D
ñu
ñu
ÑÀÜ
ÑÀÜ

Aquí he utilitzat una de les opcions que més m’agraden: la de poder convertir unicode a entitats html. I per convertir aquest article, la cosa també ha estat prou senzilla:

uni2ascii -Q -D < article.txt > article_c.txt

uni2ascci es complementa amb la utilitat recíproca ascii2uni, també molt útil quan ens trobam amb la necessitat de fer la conversió inversa.
Sols una darrera nota, alerta a fer servir el mateix arxiu com flux d’entrada i de sortida! Suposo que no fa falta recordar-ho, però per si un cas …

Este post ha sido traido de forma automatica desde https://web.archive.org/web/20140625063149/http:/bulma.net/body.phtml?nIdNoticia=2367 por un robot nigromante, si crees que puede mejorarse, por favor, contactanos.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.