Sovint quan generam continguts per la web ens trobam amb problemes amb les codificacions de caràcters. Aquests accents que no se veuen bé, aquest unicodes, … Linux té una petita utilitat que es excel·lent per resoldre aquests tipus de problemes uni2ascii
Traducción al castellano
automática vía Internostrum
El primer que hem de fer és mirar si la utilitat és al nostre sistema, si no hi és obviament caldrà instal·lar-la. El paquet Debian s’anomena uni2ascii:
uni2ascii – convert UTF-8 into 7-bit ASCII and vice versa
Així que amb un apt-get ho tindrem llest. Ara sols ens queda fer la conversió.
uni2ascii utilitza els fluxs d’entrada i sortida estàndar és a dir haurem d’utilizar < i > per a enviar-li texts d’entrada i deixar-los als nostres arxius de sortida, però també ho podem utilitzar directament des de la consola, com a una bona eina per tenir oberta per quan no recordam com es codifica un caràcter. Per exemple
aaloy@G5:~/tmp$ uni2ascii -Q -D
ñu
ñu
ÑÀÜ
ÑÀÜ
Aquí he utilitzat una de les opcions que més m’agraden: la de poder convertir unicode a entitats html. I per convertir aquest article, la cosa també ha estat prou senzilla:
uni2ascii -Q -D < article.txt > article_c.txt
uni2ascci es complementa amb la utilitat recíproca ascii2uni, també molt útil quan ens trobam amb la necessitat de fer la conversió inversa.
Sols una darrera nota, alerta a fer servir el mateix arxiu com flux d’entrada i de sortida! Suposo que no fa falta recordar-ho, però per si un cas …
Este post ha sido traido de forma automatica desde https://web.archive.org/web/20140625063149/http:/bulma.net/body.phtml?nIdNoticia=2367 por un robot nigromante, si crees que puede mejorarse, por favor, contactanos.