Entries Tagged as 'language'

Help make «DocBook XML to PDF» work for Greek

<?xml version=”1.0″ encoding=”utf-8″?>
<!DOCTYPE art­icle PUBLIC “-//OASIS//DTD Doc­Book XML V4.2//EN”
“http://www.oasis-open.org/docbook/xml/4.2/docbookx.dtd”>
<article lang=”en”>
<section><title>Title</title>
<para>ëãáâṩẫëĝéõōåőȩçą</para>
<para>ЁЂыњѨѬѺѸѶѦщЖЊЌЍШЩзф</para>
<para>ᾶᾳὰέᾁᾂδϕϟϸϡϸϸαϷϕϲδϕϛ€ϕ©ϖϐͻ©ϖϐ</para>
</section>
</article>

This is an issue that I would appre­ci­ate if someone could help in solving.

The above doc­u­ment (mytestfile.xml) is a Doc­Book XML doc­u­ment with text in many scripts (latin, cyril­lic and greek). Nor­mally it was dif­fi­cult to con­vert to PDF, until recently.

Now, one can run

dblatex --backend=xetex --verbose mytestfile.xml

(requires to install the dblatex pack­age and any depend­en­cies) and it cre­ates mytestfile.pdf. If you have a fresh install­a­tion of Ubuntu 8.10 and you go through the pro­cess of installing these pack­ages, please make a list of them, to use as advice for new users.

[cap­tion id="attachment_822" align="alignnone" width="500" caption="Generated PDF doc­u­ment with lang=en"]Generated PDF document with lang=en[/cap­tion]

Since we use XeTeX as a backend, we can work with Uni­code text dir­ectly, which is the proper thing to do. Above you can see that all char­ac­ters are shown (except a few obscure ones that are not found in DejaVu Sans and are shown as boxes). You can see Latin (+Exten­ded), Cyril­lic (+Exten­ded), Greek (+Exten­ded) in the same document.

[cap­tion id="attachment_823" align="alignnone" width="423" caption="Generated PDF doc­u­ment with lang=el"]Generated PDF document with lang=el[/cap­tion]

The issue arises when we change the lang mod­i­fier in the doc­u­ment above, from en to el. Here you see Τιτλε, which in fact is Title but with the char­ac­ters replaced with their Greek equi­val­ent. This is a sign for non-​Unicode, 8-bit encod­ing con­ver­sion issue. In addi­tion, some of the rest of the char­ac­ters are shown, and appar­ently a strange con­ver­sion took place.

What we need to do is figure out is how to fix xetex when ‘lang=el’. There is some work to get Greek XeTeX sup­port upstream, and there are instruc­tions on how to add local Greek XeTeX sup­port in your distribution.

What we need is instruc­tions on how to fix the Greek XeTeX sup­port in Ubuntu 8.10, and test that dblatex can gen­er­ate doc­u­ments cor­rectly when lang=el.

For your test­ing, here are the files mytestfile-en.pdf, mytestfile-el.pdf, mytestfile-en.xml, mytestfile-el.xml.

Περισσότερη ορολογία πληροφορικής στα ελληνικά

Λαμβάνω κάθε δύο μήνες το ηλεκτρονικό περιοδικό της ΕΛΕΤΟ, της Ελληνικής Εταιρίας Ορολογίας που ονομάζεται Ορόγραμμα. Στο Ορόγραμμα υπάρχουν χρήσιμες πληροφορίες για την απόδοση όρων στα ελληνικά. Ακόμα, δείχνει πως είναι δυνατόν να έχει κάποιος ένα ποιοτικό φύλλο με μικρά έξοδα διότι είναι ηλεκτρονικό.

Στο τελευταίο τεύχος (Ιανουάριος/Φεβρουάριος) γίνεται αναφορά για τα με το χέρι, χειροκίνητος και χειρωνακτικός, και τα πολύ συχνά λάθη που γίνονται στη χρήση. Σε κάθε τεύχος έχουν τέτοια ενδιαφέροντα και χρήσιμα για τις μεταφράσεις που κάνουμε (για το ελεύθερο λογισμικό), που είναι παράξενο το πόσο σχετικά είναι για μας. Μια υποψία που έχω είναι ότι κοιτούν τις μεταφράσεις που κάνω.

Στο ίδιο τεύχος γίνεται αναφορά για ένα γλωσσάρι όρων της Τεχνικής Επιτροπής 21 του ΕΛΟΤ. Πρόκειται για όρους σχετικούς με την ίδια την ορολογία. Αρκετοί από τους όρους έχουν σχέση με το ελεύθερο λογισμικό,

download {verb}    καταφορτώνω, κατεβάζω
upload {verb}      αναφορτώνω, ανεβάζω
parsing            συνταξανάλυση
concatenation      συναλύσωση

Σε κάθε περίπτωση, το GNOME 2.22.x έχει βγει, και τυχόν αλλαγές στην ορολογία που χρησιμοποιούμε θα εξεταστεί κατά την νέα έκδοση.

Υπάρχουν όροι που χρησιμοποιούμε στο GNOME που θα ήταν καλό να συζήσουμε σε χώρους ευρύτερους από την κοινότητα ελεύθερου λογισμικού. Ελπίζω να υπάρξει η ευκαιρία για κάτι τέτοιο στο μέλλον.

Droid fonts from Google (Android SDK)

Two years ago, Google bought a start-​up called Android in order to deliver an open plat­form for mobile applic­a­tions. A few days ago the Android SDK has been released and you can develop now Android applic­a­tions that can run in the emu­lator. Android hand­sets are expec­ted at some point next year.

Even if you do not plan to develop applic­a­tions for Android, you can still run the emu­lator which is func­tional, includes quite a few samples, and comes with a browser shown above. To get it, down­load the Android SDK for your system, uncom­press it and run

./android_sdk_linux_m3-rc20a/tools/emulator

An inter­est­ing aspect of Android is that it comes with a set of fonts that have been spe­cially designed for mobile devices, the Droid fonts. The fonts are embed­ded in the Android image, in android_sdk_linux_m3-rc20a/tools/lib/images/system.img, a clever guy man­aged to extract them and a modest guy cor­rec­ted me (Damien’s blog to download).

The fonts are prob­ably licensed under the same license as the SDK (Apache License), how­ever it is better to hear from Google first.

In the mean­time, here is a screen­shot of Ubuntu 7.10 with Droid.

Update: To extract the fonts from the SDK, run the emu­lator with the -console para­meter. The emu­lator starts and at the same time you get a shell to the filesys­tem of the run­ning emu­lator. You can locate the fonts in system/fonts/. Once loc­ated the full path of a file, you can extract with ./adb pull system/fonts/DroidSans.ttf /tmp/DroidSans.ttf (thanks cosmix for the tip).

Cannot write Greek Polytonic in Linux

Gen­eral Update: If you have Ubuntu 8.10, Fedora 10 or a sim­il­arly new dis­tri­bu­tion, then Greek Poly­tonic works out-of-the-box. Simply select the Greek Poly­tonic layout. For more inform­a­tion, see the recent Greek Poly­tonic post.

Update 3rd May 2008: If you have Ubuntu 8.04 (prob­ably applies to other recent Linux dis­tri­bu­tions as well), you simply need to add GTK_IM_MODULE=xim to /etc/environment. Start a Ter­minal (Applications/Accessories/Terminal) and type the com­mands (the first com­mand makes a backup copy of the con­fig­ur­a­tion file, and the second opens the con­fig­ur­a­tion file with admin­is­trat­ive priv­il­iges, so that you can edit and save):

$ gksudo cp /etc/environment /etc/environment.ORIGINAL
$ gksudo gedit /etc/environment

then append

GTK_IM_MODULE=xim

save, and restart your com­puter. It should work now. Try to test with the stand­ard Text editor, found in Accessories.

In Ubuntu 8.10 (autumn 2008), it should work out of the box, just by enabling the Greek Poly­tonic layout.

Update 20th June 2008: If still some accents/breathings/aspirations do not work, then this is prob­ably related to your system locale (whether it is Greek or not). It works better when it is Greek. If you are affected and you do not use the Greek locale, there is one more thing to do.

$ gksudo cp /usr/share/X11/locale/en_US.UTF-8/Compose /usr/share/X11/locale/en_US.UTF-8/Compose.ORIGINAL
$ gksudo cp /usr/share/X11/locale/el_GR.UTF-8/Compose /usr/share/X11/locale/en_US.UTF-8/Compose

The first com­mand makes a backup copy of your ori­ginal en_​US Com­pose file (assum­ing you run an Eng­lish locale; if in doubt, read /usr/share/X11/locale/locale.dir). The second com­mand copies the Greek com­pose file over the Eng­lish one. You then logout and login again.

End of updates

To write Greek Poly­tonic in Linux, a spe­cial file is used, which is called the com­pose file. There is a bit of com­plic­a­tion here in the sense that the com­pose file depends on the cur­rent system locale.

To find out which com­pose file is active on your system, have a look at

/usr/share/X11/locale/compose.dir

Let’s assume your system locale is en_US.UTF-8 (Start Applications/Accessories/Terminal and type locale).

In the compose.dir file it says

en_US.UTF-8/Compose: en_US.UTF-8

Note that the locale is the second field. If you have a dif­fer­ent system locale, match on the second field. Many people make a mis­take here. Actu­ally, I think be faster for the system to locate the entry if the compose.dir file was sorted by locale.

There­fore, the com­pose file is

/usr/share/X11/locale/en_US.UTF-8/Compose

So, what’s the prob­lem then?

Well, for the Greek locale (el_GR.UTF-8) we have a dif­fer­ent com­pose file, a com­pose file in which Greek Poly­tonic actu­ally works ;-).

There­fore, there are numer­ous work­arounds here to get Greek Poly­tonic working.

For example,

  • If you speak modern Greek, you can install the Greek locale.
  • You can edit /usr/share/X11/locale/compose.dir so that for your locale, the com­pose file is the Greek one, /usr/share/X11/locale/el_GR.UTF-8/Compose.
  • You can edit the Greek com­pose file, take the Greek Poly­tonic sec­tion and update the Greek Poly­tonic sec­tion of en_US.UTF-8/Compose.
  • You can copy the Greek com­pose file in your home dir­ect­ory under the name .XCom­pose. I did not try this one, and also you may be affected by this bug. (not tested)

Of course the proper solu­tion is to update en_US.UTF-8/Compose with the updated Greek Poly­tonic com­pose sequences. There is a tend­ency to add the com­pose sequences of all lan­guages to en_US.UTF-8/Compose, and this actu­ally is hap­pen­ing now. In this respect, it would make sense to rename en_US.UTF-8/Compose into some­thing like general/Compose.

Google News στα ελληνικά!

Google News in Greek

To Google News έχει τώρα έκδοση ειδικά για την Ελλάδα.
Η υπηρεσία είναι σε δοκιμαστική κατάσταση (Beta).

Περιλαμβάνει ειδήσεις από τις ηλεκτρονικές εκδόσεις εφημερίδων, ειδησεογραφικούς δικτυακούς τόπους και άλλες πηγές.

Αν κάποιος δικτυακός τόπος θέλει να προσφέρει τις ειδήσεις του, μπορεί να δει τη σχετική σελίδα για του εκδότες.

Οδηγοί βίντεο για εγκατάσταση/χρήση Ubuntu Linux

Πριν από μερικές μέρες, ο Ser­gios Tsabolov έφτιαξε μια σειρά από οδηγούς στα ελληνικά, σε μορφή βίντεο για την εγκατάσταση και χρήση του Ubuntu Linux. Τα βίντεο αυτά είναι μορφής screen­cast και ενσωματώνουν και φωνή· περιγραφή της διαδικασίας από τον ίδιο το Σέργιο. Το φορμά (format) των αρχείων είναι OGG οπότε χρειάζεστε μια εφαρμογή όπως Εφαρμογές/Ήχος και Εικόνα/Movie Player (Ubuntu) ή VLC για την αναπαραγωγή.

Είδα τα βίντεο και πρέπει να πω ότι πιστεύω ότι θα βοηθήσουν πάρα πολύ τους νέους χρήστες, στο κομμάτι τις εγκατάστασης της διανομής αλλά και στη βασική χρήση.

Ακολουθεί η ανακοίνωση του Σέργιου στη λίστα συνδρομητών ubuntu-​gr,

Καλησπέρα .
Έχω ανεβάσει και το τέταρτο μέρος είναι λίγο μεγαλύτερο αλλά έγινε μεγάλο επειδή εδώ έπρεπε να αναφέρω αρκετά πράγματα για εγκατάσταση προγραμμάτων και τρόποι εγκατάστασης τους.
Ζητάω από τώρα να με συγχωρήσετε αν έχω πει κάτι παραπάνω , εξάλλου τα video θα είναι χρήσιμα για νέους χρηστές εμπειρότεροι χρήστες ξέρουν τα περισσότερα από αυτά , στο 3 μέρος δεν έχω κάνει κάτι σημαντικό απλός έκανα ενημέρωση και κάποιες βασικές ρυθμίσεις για καλύτερη λειτουργία.

Τα αρχεία μπορείτε να δείτε online εδώ :

http://​econ​lab.​uom.​gr/​e​c​o​n​l​a​b​/​u​b​u​n​t​u​/​v​i​d​e​o​/​U​b​u​n​t​u​E​d​g​y​6​.​1​0​.​1.ogg

http://​econ​lab.​uom.​gr/​e​c​o​n​l​a​b​/​u​b​u​n​t​u​/​v​i​d​e​o​/​U​b​u​n​t​u​E​d​g​y​6​.​1​0​.​2.ogg

http://​econ​lab.​uom.​gr/​e​c​o​n​l​a​b​/​u​b​u​n​t​u​/​v​i​d​e​o​/​U​b​u​n​t​u​E​d​g​y​6​.​1​0​.​3.ogg

http://​econ​lab.​uom.​gr/​e​c​o​n​l​a​b​/​u​b​u​n​t​u​/​v​i​d​e​o​/​U​b​u​n​t​u​E​d​g​y​6​.​1​0​.​4.ogg

Σύντομα θα προχωρήσω και στο 7.04 με παρόμοιο τρόπο.
Ευχαριστώ εκ τον προτέρων.

Unicode Fonts for Ancient Scripts

George Douros cre­ated a set of Uni­code fonts that cover the part of the Uni­code stand­ard for ancient scripts and symbols.


Linear B Ideo­grams; Ιδεογράμματα Γραμμικής Β


Ancient Greek num­bers; Αρχαίοι ελληνικοί αριθμοί

Click here to see more screen­shots on
the Ancient fonts gallery.

Διαθέσιμη η νέα διανομή Fedora 7

Διαβάζοντας την ανακοίνωση του Δημήτρη, βλέπουμε τα νέα χαρακτηριστικά που περιλαμβάνει η νέα έκδοση της διανομής Fedora.
Η ελληνική ομάδα που είναι πίσω από τη διανομή Fedora μετάφρασε τις σημειώσεις κυκλοφορίας της Fedora 7 για την προσωπική σας ευχαρίστηση.
Ολοκλήρωσα χτες τη λήψη του DVD ISO της Fedora 7 και το γράφω τώρα σε οπτικό δίσκο.

Convert your legacy font to Unicode

There exist quite a few legacy fonts, from the time that 8-bit-style encod­ings was the norm. Nowdays, most (if not all) spoken and ancient scripts have been added to the Uni­code stand­ard.
There­fore, if you have a legacy font, you can con­vert to Uni­code using a guide by Wil­liam J Poser. The guide uses Linear B as an example.

The pro­gram men­tioned in the guide is pfaedit, which is now known as Font­Forge. Font­Forge is avail­able in your Ubuntu dis­tri­bu­tion; simply search using the pack­age manager.

Once you have a Uni­code font, the next step is to pre­pare an input method so that you can write in this script. But that’s another blog post.

The Junicode Greek Project

Specimen of Wilson's Greek Type

What’s Junicode? Well,

Junicode (short for Junius-​Unicode) is a Uni­code font for medi­ev­al­ists. The cur­rent ver­sion is a beta; the selec­tion of char­ac­ters and the arrange­ment of the Private Use Area are sub­ject to change. Your com­ments, sug­ges­tions and bug reports will be a great help to me as I com­plete the project.

Source: http://​junicode.​source​forge.net/

If you look at the font cov­er­age of Junicode, you will notice that Greek is miss­ing. There is a new pro­ject to add Greek sup­port in Junicode, and the font designer asks for feed­back from Greek-​speaking users,

You can help with this pro­ject, if you know Greek better than I do, by provid­ing feed­back. Some ques­tions that occur to me:

  • Wilson’s font does not have the k-style kappa. Should I include this, or just use the x-style kappa?
  • The shapes of zeta, rho, phi and per­haps others differ markedly from what one usu­ally sees in modern Greek fonts. Should these be mod­ern­ized, or will they do as-​is?

I wel­come any and all sug­ges­tions. Please write to the address below.

Source (and con­tact e-mail): http://​junicode.​source​forge.​net/​g​r​e​e​k​.html

The new (exper­i­mental) Greek glyphs look like

Μετάφραση του WordPress στα ελληνικά (νέο έργο!)

Ξεκίνησε μια νέα προσπάθεια για τη υποβοήθηση των μεταφράσεων του Word­Press στις τοπικές γλώσσες, όπου διάφοροι χρήστες μπορούν να συνεισφέρουν μέσω του Διαδικτύου.

Η μετάφραση γίνεται με τη βοήθεια μιας εφαρμογής Web· χρειάζεται να αποκτήσετε λογαριασμό στο http://​www.​word​press.com/ για να μπορέσετε να συνδεθείτε στο http://​trans​late.​word​press.com/.

Η εφαρμογή του Web επιτρέπει να γίνονται προτάσεις για μια μετάφραση και έπειτα να καθορίζονται ποιες είναι οι αποδεκτές, κατά του τρόπου που το Google μεταφράζει μέσω της κοινότητας το δικτυακό του τόπο.
Το επίπεδο μετάφρασης του Word­press στα ελληνικά είναι γύρω στο 75% (960 από 1294 μηνύματα), και όπως φαίνεται έχει ληφθεί η μετάφραση που είχε γίνει στο Pootle και που μετά είχε σταλθεί upstream.  Είναι σημαντικό να στέλνεις υλικό upstream :-).

Ευχαριστώ τον Unique Fish για το πινγκ.

Μιλήσαμε για τη μετάφραση του Word­press για πρώτη φορά πριν από ένα χρόνο.

Inscription in the Cypriot syllabic script

Inscrip­tion in the Cyp­riot syl­labic script
Can you read what the tablet says?

Hint