Skip to content
Permalink
8bed31719c
Switch branches/tags

Name already in use

A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
Go to file
 
 
Cannot retrieve contributors at this time
159 lines (112 sloc) 17.1 KB
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE book PUBLIC "-//OASIS//DTD DocBook XML V4.5//EN" "../../../docbook-xml-4.5/docbookx.dtd">
<chapter id="chapter.segmentation">
<title>Κατάτμηση αρχείων προέλευσης</title>
<para>Τα εργαλεία μετάφραστικής μνήμης λειτουργούν με μονάδες κειμένου που αποκαλούνται Τμήματα. Το <application>OmegaT</application> έχει δύο τρόπους για να κατακερματίζει ένα κείμενο: κατάτμηση ανά παράγραφο, ή ανά πρόταση (που είναι γνωστή και σαν “κατάτμηση βασισμένη σε κανόνες”). Μπορείτε να επιλέξετε το είδος κατάτμησης με <menuchoice> <guimenu><indexterm class="singular">
<primary>Έργο</primary> <secondary>Ιδιότητες</secondary>
</indexterm>Έργο</guimenu> <guimenuitem>Ιδιότητες...</guimenuitem> </menuchoice> από το κύριο μενού και τσεκάρετε, ή αποεπιλέξτε, το κουτάκι επιλογής που προσφέρεται. Η κατάτμηση ανά παράγραφο είναι, σε κάποιες περιπτώσεις, πλεονεκτική, όπως στις πολύ δημιουργικές ή στυλιστικές μεταφράσεις στις οποίες ο μεταφραστής μπορεί να θέλει να αλλάξει τη σειρά ολόκληρων προτάσεων. Για την πλειοψηφία των έρων, πάντως, η κατάτμηση ανά παράγραφο είναι η προτιμώμενη επιλογή, αφού αποδίδει καλύτερες αντιστοιχίσεις από προηγούμενες μεταφράσεις. Αν έχει επιλεγεί η κατάτμηση ανά πρόταση, μπορείτε να ρυθμίσετε τους κανόνες με τις <menuchoice> <guimenu><indexterm class="singular">
<primary>Έργο</primary> <secondary>Επιλογές</secondary>
</indexterm>Επιλογές</guimenu> <guimenuitem>Κατάτμηση...</guimenuitem> </menuchoice>από το κύριο μενού.</para>
<para>Αξιόπιστοι κανόνες κατάτμησης υπάρχουν, ήδη, για πολλές γλώσσες, οπότε, είναι πιθανόν ότι δεν θα χρειαστεί να εμπλακείτε με τη συγγραφή των δικών σας κανόνων κατάτμησης. Από την άλλη, αυτή η λειτουργία μπορεί να αποδειχθεί πολύ χρήσιμη σε ειδικές περιπτώσεις, όπου μπορείτε να αυξήσετε την παραγωγικότητά σας, εναρμονίζοντας τους κανόνες κατάτμησης με το κείμενο που πρέπει να μεταφρασθεί.</para>
<para><emphasis role="bold">Προειδοποίηση: </emphasis>επειδή το κείμενο θα καταμηθεί διαφορετικά μετά την αλλαγή επιλογών φίλτρου, τότε ενδέχεται να πρέπει να ξαναρχίσετε τη μετάφραση από το μηδέν. Συγχρόνως, τα μέχρι πρότινος έγκυρα τμήματα στη μεταφραστική μνήμη του έργου, θα μετατραπούν σε ορφανά τμήματα. Αν αλλάξετε τις επιλογές κατάτμησης όταν ένα έργο είναι ανοικτό, πρέπει να ξαναφορτώσετε το έργο, για να μπορούν να εφαρμοσθούν οι αλλαγές.</para>
<para>Το <application>OmegaT</application> χρησιμοποιεί την εξής σειρά βημάτων:</para>
<variablelist> <varlistentry> <term><indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κατάτμηση σε επίπεδο πηγής</secondary>
</indexterm>Κατάτμηση σε επίπεδο δομής</term>
<listitem>
<para>Το <application>OmegaT</application> πρώτα αναλύει (parses) το κείμενο για κατάτμηση σε επίπεδο δομής. Στη διάρκεια αυτής της διαδικασίας, χρησιμοποιείται μόνον η δομή του αρχείου προέλευσης για να παραχθούν τα τμήματα.</para>
<para>Για παράδειγμα, τα αρχεία κειμένου μπορούν να κατατμηθούν στις αλλαγές γραμμής, σε κενές γραμμές, ή να μην κατατμηθού καθόλου. Τα αρχεία που περιέχουν μορφοποίηση (έγγραφα ODF, έγγραφα HTML, κλπ.) κατακερματίζονται σε επίπεδο ετικετών block-level (παραγράφου). Οι ιδιότητες (attributes) των μεταφράσιμων αντικειμένων σε αρχεία XHTML ή HTML μπορούν να εξαχθούν σαν χωριστά τμήματα.</para>
</listitem>
</varlistentry> <varlistentry> <term><indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κατάτμηση σε επίπεδο πρότασης</secondary>
</indexterm>Κατάτμηση σε επίπεδο πρότασης</term>
<listitem>
<para>Μετά την κατάτμηση του αρχείου προέλευσης σε δομικές μονάδες, το <application>OmegaT</application> θα κατακερματίσει περαιτέρω αυτά τα blocks σε προτάσεις.</para>
</listitem>
</varlistentry>
</variablelist>
<section id="segmentation.rules">
<title>Κανόνες κατάτμησης<indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κανόνες</secondary>
</indexterm></title>
<para>Η διαδικασία κατάτμησης μπορεί να περιγραφεί ως εξής: ο δείκτης μετακινείται κατά μήκος του κειμένου, κατά έναν χαρακτήρα κάθε φορά. Για την κάθε θέση του δείκτη, εφαρμόζονται, με τη δεδομένη σειρά τους, κανόνες που αποτελούνται από ένα μοτίβο<emphasis role="bold">Before </emphasis>και <emphasis role="bold">After </emphasis> για να δούμε αν οποιαδήποτε μοτίβο<emphasis role="bold"> Before</emphasis> είναι έγκυρο για το κείμενο στα αριστερά, ή για το αντίστοιχο μοτίβο <emphasis role="bold">After</emphasis> για το κείμενο στα δεξιά του δείκτη. Αν ο κανόνας αντιστοιχίζεται, είτε ο δείκτης μετακινείται χωρίς να εισαχθεί μια αλλαγή τμήματος (για έναν κανόνα εξαίρεσης), είτε δημιουργείται μία νέα αλλαγή τμήματος στην τρέχουσα θέση του δείκτη (για τον κανόνα αλλαγής).</para>
<para>Αυτα τα δύο είδη κανόνων συμπεριφέρονται ως εξής:</para>
<variablelist> <varlistentry> <term><indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κανόνες</secondary> <tertiary>Κανόνας αλλαγής</tertiary>
</indexterm>Κανόνας αλλαγής</term>
<listitem>
<para>Διασπά το κείμενο προέλευσης σε τμήματα. Για παράδειγμα, η φράση &quot;<emphasis>Είχε έννοια; Δεν ήμουν σίγουρος</emphasis>.&quot; θα πρέπει να διασπασθεί σε δύο τμήματα. Για να το πετύχετε, πρέπει να υπάρχει ένας κανόνας αλλαγής για το &quot;;&quot;, όταν αυτό ακολουθείται από διαστήματα και από μια λέξη γραμμένη με κεφαλαία. Για να ορίσετε έναν κανόνα ως κανόνα αλλαγής, τσεκάρετε το κουτί επιλογής Αλλαγή/Εξαίρεση.</para>
</listitem>
</varlistentry> </variablelist> <variablelist> <varlistentry> <term><indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κανόνες</secondary> <tertiary>Κανόνας εξαίρεσης</tertiary>
</indexterm>Κανόνας εξαίρεσης</term>
<listitem>
<para>εξειδικεύστε ποια κομμάτια κειμένου ΔΕΝ πρέπει να διαχωρισθούν. Παρά την τελεία, το <emphasis>&quot;Mrs. Dalloway &quot;</emphasis> δεν πρέπει να χωριστεί σε δύο τμήματα. Οπότε, πρέπει να υιοθετηθεί ένας κανόνας εξαίρεσης για το Mrs (και για το Mr, Dr, Prof κλπ), ακολουθούμενο από μια τελεία. Για να ορίσετε έναν κανόνα ως κανόνα εξαίρεσης, αφήστε αποεπιλεγμένο το κουτάκι Αλλαγή/Εξαίρεση.</para>
</listitem>
</varlistentry>
</variablelist>
<para>Οι προεπιλεγμένοι κανόνες αλλαγής πρέπει να είναι επαρκείς για τις περισσότερες Ευρωπαϊκές γλώσσες και τα Ιαπωνικά. Προς χάριν της ευελιξίας, μπορείτε να ορίσετε περισσότερους κανόνες εξαίρεσης για τη δική σας γλώσσα προέλευσης, για να προσφέρονται περισσότερα συμβατά τμήματα που να έχουν νόημα.</para>
</section>
<section id="rules.priority">
<title>Κανόνες προτεραιότητας<indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Κανόνες προτεραιότητας</secondary>
</indexterm></title>
<para>Όλες οι ομάδες κανόνων κατάτμησης για την αντιστοίχιση μοτίβων γλωσσών είναι ενεργοί και εφαρμόζονται με τη δεδομένη σειρά προτεραιότητας, και άρα, οι κανόνες για ιδιαίτερες γλώσσες θα πρέπει να να είναι ψηλώτερα από τους προεπιλεγμένους. Για παράδειγμα, οι κανόνες για τα Καναδικά Γαλλικά (FR-CA) θα πρέπει να ορισθούν ψηλώτερα από τους κανόνες για τα Γαλλικά (FR.*), και ψηλώτερα από τους κανόνες Προεπιλογής (.*). Έτσι, όταν μεταφράζετε από τα Καναδικά Γαλλικά, θα εφαρμόζονται πρώτα οι κανόνες για τα Καναδικά Γαλλικά (αν υπάρχουν), ακολουθούμενοι από τους κανόνες για τα Γαλλικά και, τέλος, από τους κανόνες Προεπιλογής.</para>
</section>
<section id="creating.new.rule">
<title>Δημιουργία ενός νέου κανόνα<indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Δημιουργία ενός νέου κανόνα</secondary> <seealso>Κανονικές εκφράσεις</seealso>
</indexterm></title>
<para>Γενικά, θα πρέπει να αποφεύγετε μείζονες αλλαγές των κανόνων κατάτμησης, ειδικά μετά την ολοκλήρωση του πρώτου προσχεδίου, αλλά οι μικρές αλλαγές, σαν την προσθήκη ενός αναγνωρισμένου ακρωνυμίου, μπορεί να είναι πλεονεκτικές.</para>
<para>Για να επεξεργαστείτε, ή να επεκτείνετε, μια προϋπάρχουσα ομάδα κανόνων, απλώς κάντε κλικ πάνω της, στο επάνω μέρος του πίνακα. Οι κανόνες για την ομάδα αυτή θα εμφανισθούν στο κάτω ήμισυ του παραθύρου.</para>
<para>Για να δημιουργήσετε μια κενή ομάδα κανόνων, για ένα νέο μοτίβο γλώσσας, κάντε κλικ στο <emphasis role="bold">Προσθήκη </emphasis>στο άνω ήμισυ του διαλόγου. Θα εμφανισθεί μία κενή γραμμή στο κάτω μέρος του άνω πίνακα (μπορεί να χρειαστεί να κάνετε περιήγηση προς τα κάτω, για να το δείτε ολόκληρο). Αλλάξτε το όνομα της ομάδας κανόνων και του μοτίβου γλώσσας, στη γλώσσα που εμπλέκεται και της κωδικοπίησής της (δείτε στο <xref linkend="appendix.languages"/> για έναν κατάλογο με τους κωδικούς γλωσσών). Η σύνταξη του μοτίβου γλώσσας συμμορφώνεται με τη σύνταξη κανονικών εκφράσεων (regexp). Αν η ομάδα κανόνων χειρίζεται ένα ζεύγος γλώσσας-χώρας, σας συμβουλεύουμε να την μετακινήσετε στην κορυφή, χρησιμοποιώντας το κουμπί <emphasis role="bold">Μετακίνηση προς τα πάνω</emphasis>.</para>
<para>Πορσθέστε τα μοτίβα <emphasis role="bold">Before</emphasis> και<emphasis role="bold"> After</emphasis>. Για να ελεγξετε τη σύνταξή τους και την εφαρμοσιμότητά τους, συστήνεται η χρήση εργαλείων που σας επιτρέπουν να δείτε άμεσα το αποτέλεσμά τους. Δείτε το κεφάλαιο σχετικά με τις <link linkend="chapter.regexp">Κανονικές εκφράσεις</link>. Ένα καλό σημείο εκκίνησης θα είναι πάντοτε οι υπάρχοντες κανόνες.</para>
</section>
<section id="few.simple.examples">
<title><indexterm class="singular">
<primary>Κατάτμηση</primary> <secondary>Παραδείγματα</secondary>
</indexterm>Μερικά απλά παραδείγματα</title>
<informaltable>
<tgroup cols="4">
<colspec align="left" colnum="1"/>
<colspec align="center" colnum="2"/>
<colspec align="center" colnum="3"/>
<colspec align="left" colnum="4"/>
<thead>
<row>
<entry>Πρόθεση</entry>
<entry align="center">Πριν</entry>
<entry align="center">Μετά</entry>
<entry>Σημείωση</entry>
</row>
</thead>
<tbody>
<row>
<entry>Ορίστε την εκκίνηση του τμήματος μετά από μια τελεία ('.') ακκολοουθούμενη από ένα διάστημα, tab ...</entry>
<entry align="center">\.</entry>
<entry align="center">\s</entry>
<entry>Το &quot;\.&quot; αντιπροσωπεύει το σημείο στίξεως της τελείας. Το &quot;\s&quot; αντιπροσωπεύει οποιοδήποτε χαρακτήρα κενού διαστήματος (διάστημα, tab, νέα σελίδα, κλπ.)</entry>
</row>
<row>
<entry>Να μη γίνει κατάτμηση μετά το Mr.</entry>
<entry align="center">Mr\.</entry>
<entry align="center">\s</entry>
<entry>Αυτός είναι ένας κανόνας εξαίρεσης. Έτσι, το κουτί επιλογής κανόνα δεν πρέπει να είναι τσεκαρισμένο</entry>
</row>
<row>
<entry>Ορίστε ένα τμήμα μετά το &quot;&quot; (είναι η Ιαπωνική τελεία)</entry>
<entry align="center">。</entry>
<entry align="center"/>
<entry>σημειώστε ότι το <literal>after</literal> είναι κενό</entry>
</row>
<row>
<entry>Να μη γίνει κατάτμηση μετά το M. Mr. Mrs. και Ms.</entry>
<entry align="center">Mr??s??\.</entry>
<entry align="center">\s</entry>
<entry>Κανόνας εξαίρεσης - βλέπε τη χρήση του ? στις κανονικές εκφράσεις</entry>
</row>
</tbody>
</tgroup>
</informaltable>
</section>
</chapter>