Esperanto met kapjesletters

Het Esperanto gebruikt naast de gewone letters 6 letters met diacriten. Dit zijn ĉ, ĝ, ĥ, ĵ, ŝ, ŭ en de bijbehorende hoofdletters Ĉ, Ĝ, Ĥ, Ĵ, Ŝ en Ŭ.

Veel Esperantisten gebruiken een oude afspraak: zet een x achter de letter in plaats van een dakje erboven: cx, gx, hx, jx, sx, ux. Eigenlijk zo'n beetje zoals Duitsers een ü soms als ue schrijven. Deze afspraakt stamt uit de tijd dat computers alleen ASCII kenden, bovendien typt het soms wat makkelijker dan ĉ.

Om het mooi te maken, moet je voor een tijdschrift of website deze x-jes weer omzetten in echte kapjesletters. Dat kun je doen met je editor: 12 keer zoek en vervang. Ik gebruik zelf daarvoor het programma sed (een van de vele standaard Unix-commando's op mijn linux-computer). Het volgende scriptje staat onder de naam x2utf op mijn systeem:

cat $1 |\
sed -e s/cx/ĉ/g  -e s/gx/ĝ/g  -e s/hx/ĥ/g  -e s/jx/ĵ/g  -e s/sx/ŝ/g  -e s/ux/ŭ/g |\
sed -e s/cx/Ĉ/gi -e s/gx/Ĝ/gi -e s/hx/Ĥ/gi -e s/jx/Ĵ/gi -e s/sx/Ŝ/gi -e s/ux/Ŭ/gi

Oh ja, als je dit op een website gebruikt, dan moet je wel tegen de browser vertellen dat het om UTF8-tekst gaat. Dat doe je met de meta-header <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> zoals ook op deze webpagina zelf gebruikt is.

Johan Swenker
3 mei 2015