top of page
lilianfaedi

Dernière mise à jour : 11 avr. 2022


Aujourd'hui, après un peu de travail de ma part étalé sur ma semaine, j'ai décidé d'enfin écrire un article sur po4a. Comme pour avertissement de la terrible chose que je m'apprête à faire, il me manque une tasse de thé sur les deux que je prends habituellement le matin. Néanmoins, je pense que cette rédaction va être suffisamment intéressante pour que cela vaille le coup.


po4a, qu'est-ce que c'est ?


po4a (ou ".po for anything") est un programme qui permet de récupérer le texte à l'intérieur d'un document et de convertir ce contenu au format .po plus facilement traduisible. Le format .po vient de l'utilitaire gettext, qui lui convertit le contenu des fichiers du code source des interfaces utilisateur, alors que po4a permet de traiter des fichiers de documentation. L'outil est particulièrement utile pour la traduction parce qu'il permet de traduire sans se soucier des bouts de code éparpillés dans le fichier d'origine du document pour ensuite réintégrer le texte dans le format d'origine.


Installation d'une distribution Linux (Debian)



Au début, j'avais tenté d'installer po4a directement sur Windows par les fichiers obtenus sur le site officiel de po4a. Mais ma tentative a été vouée à l'échec. Donc, dans ce tutoriel, je vais passer en revue l'installation d'une distribution Linux avec le Windows Store.


En premier lieu, il faut activer le sous-système Linux pour Windows. C'est pratique pour avoir accès à une interface Linux, lorsque l'on ne dispose que de Windows 10 comme système d'exploitation sous la main. Une méthode simple est de faire Windows + R, puis de taper "optionalfeatures", sans les guillemets. Après cela, une fenêtre s'affiche, avec d'innombrables cases à cocher. Cherchez "Sous-système Windows pour Linux" et cochez l'option correspondante :

Redémarrez ensuite votre ordinateur. Une fois ceci fait, tapez "Powershell" dans votre barre de recherche Windows. Quand l'invite de commande s'ouvre, écrivez bash et appuyez sur Entrée. "bash" est un peu le PowerShell de Linux : si vous ne disposez pas de distribution Linux installée, on va vous dire que bash n'existe tout simplement pas, par le biais de ce message :

Il n'y a aucune distribution installée pour le sous-système Windows pour Linux. Les distributions peuvent être installées en accédant au Windows Store : https://aka.ms/wslstore

Rendez-vous alors sur ce lien, qui va ouvrir votre application Windows Store. A partir de là, on va vous proposer des distributions diverses : Kali Linux, Debian et Alpine WSL. Je vous conseille Debian, celle que je vais utiliser dans le cadre de ce tutoriel.


Son installation se déroulant normalement sans heurt, vous avez désormais accès à son interface. Ou pas tout à fait : l'invite de commande vous demande d'abord un identifiant d'utilisateur et un mot de passe. Vous pouvez passer cette étape en redémarrant purement et simplement Debian (fermez et rouvrez la fenêtre).


Normalement, vous devriez avoir ceci sur votre écran :


Même si ce n'est pas nécessaire, je vous recommande de faire une mise à jour de Debian avec la commande sudo apt-get update. "sudo" correspond à "substitute user do" et correspond à peu près à l'administrateur pour Windows. "apt-get" est pour sa part "the Advanced Packaging Tool", permettant la gestion interne de modules au sein de Linux. Enfin, "update" met à jour la distribution.

Quand cela est terminé, on peut commencer à installer ce qui nous intéresse.


Installation de po4a


Il est maintenant temps d'entrer la commande la plus importante de ce tutoriel : sudo apt-get -y install po4a. Des lignes de commentaires s'affichent frénétiquement dans Debian, mais c'est tout à fait normal : l'installation est en cours. Vous voyez notamment (cf. la capture d'écran ci-dessous), que po4a est installé en compagnie d'autres librairies, avec notamment une mention d'un certain "Perl". Ce dernier est nécessaire, puisque po4a est un module écrit dans ce langage spécifique.


Après un temps, l'installation est terminée :


Localiser votre fichier pour po4a


Je ne vais détailler aujourd'hui que la fonctionnalité de po4a qui se nomme "gettextize". C'est celle qui convertit un document en .po. Mais pour faire cela, il faut indiquer à po4a où se trouve le fichier à convertir, et donc trouver son emplacement dans notre ordinateur. Pour cet exemple, j'ai téléchargé un "fichier test" : la page en xhtml du manuel de po4a, et nous allons essayer de l'exporter en .po.


Je ne vais ici ni détailler les commandes possibles dans Linux, ni les expliquer outre mesure. Un excellent article le fait déjà très bien : https://www.hostinger.fr/tutoriels/commandes-linux.


Tapez df et appuyez sur Entrée. Normalement, vous devriez obtenir quelque chose comme ce qui suit :

C:\ et E:\ sont mes disques durs personnels. Si je veux alors entrer dans mon ordinateur tel que je le vois dans Windows, je dois utiliser la commande cd. Elle permet de me rendre où je le souhaite. Si je tape cd /mnt/c, voilà ce qui s'affiche :

Debian m'indique que j'ai changé de dossier de travail dans l'ordinateur, et que je suis à /mnt/c, soit C:\. Imaginons que le fichier que je souhaite convertir se nomme "Man page of PO4A.html" et qu'il se trouve dans mon dossier "Stage 2022" présent dans mes téléchargements. Je dois me rendre donc dans "Stage 2022" en tapant cd /mnt/c/Users/Lilian/Downloads/'Stage 2022' (cette adresse de répertoire n'est pas la même pour chaque utilisateur). Notez bien les guillemets simples entourant "Stage 2022" : cela se révèle nécessaire pour que bash prenne en compte les espaces pour ce nom, pour ne pas être considérés comme des séparateurs d'argument.

Si vous avez réussi à localiser le bon dossier, vous êtes probablement ici :

Je vous conseille d'entrer la commande ls pour voir si votre fichier se trouve bien dans ce répertoire. Si c'est le cas, on passe à l'ultime étape.


Utiliser po4a-gettextize


Il manque la dernière commande de ce tutoriel : po4a-gettextize. Essayez d'entrer cet argument pour voir ce que ça donne. Vous devez obtenir ceci :

"fmt" est pour le format du document, "master.doc [-l XX.doc]" est pour le fichier à rendre, et "-p XX.po" est pour le fichier final en .po. Pour que cela marche avec notre "Man page of PO4A", il faut donc rentrer la commande :

po4a-gettextize -f text -m "Man page of PO4A.html" -p "Man page of PO4A".po

Sachez d'ailleurs qu'il est possible d'entrer "man po4a-gettextize" pour obtenir plein d'informations complémentaires concernant l'utilitaire, également trouvables ici :

Bref, si à l'entrée de cette commande aucune ligne de commande décrivant une erreur ne s'affiche, vous pouvez aller vérifier dans votre dossier s'il s'y trouve :



En guise d'ultime vérification, nous allons créer un projet dans OmegaT et voir si le fichier s'affiche correctement. Passez rapidement toutes les étapes (même si vous devez faire attention à la langue source et à la langue cible), puis appuyez sur OK. Le projet maintenant créé, glissez le fichier .po dans la fenêtre principale :

Si le fichier s'ouvre sans heurt, vous avez réussi à convertir le document choisi en .po.


En résumé


po4a est un module utile dans le cadre de la traduction. Il permet de prendre un document pour le rendre plus traduisible. Par ce cas d'application, nous avons utilisé po4a-gettextize, un utilitaire de po4a. Je tâcherai d'essayer d'expliquer ultérieurement l'installation de Texinfo et son utilisation.


J'ai été parfaitement amateur dans l'écriture de cet article, je le reconnais. Je me suis renseigné du mieux possible sur les fonctionnalités basiques de Linux, que je ne connaissais à peine il y a encore quelques jours. Mais j'espère que ce post va être utile à des personnes qui ont été exactement dans le même cas que moi.


Pour des informations sur les formats pris en charge ou pour de la documentation sur le module, n'hésitez pas à vous rendre sur po4a.org.

lilianfaedi

Ce post a été réalisé "en partenariat" avec mon ami et collègue Ismaël GARIN, en lien direct avec son post disponible sur son blog : https://igtraduction.blogspot.com/2022/03/reflexion-sur-la-traduction-la.html.

Lui traite de la partie portée sur les outils de relecture.


Pour notre stage, la question s'est vite concentrée sur notre relecture dans OmegaT, et notre tuteur de stage (M. Jean-Christophe Helary, de son nom complet) nous a demandé d'en produire un écrit. Honnêtement, je ne savais pas par où commencer, surtout pour un sujet aussi vaste. Il m'a fallu une réunion, toute une journée et mes quatre tasses de thé quotidiennes (Earl Grey, 3 min d'infusion, 2 sucrettes de stévia) pour me convaincre moi-même d'aborder les scripts dans OmegaT et leur fonction vraiment poussée. Il s'avère que leur étude m'a apporté un certain intérêt. D'ailleurs, j'avais créé une page sur notre wiki, qui est trouvable ici : https://forge.chapril.org/brandelune/stage_2022/wiki/Fen%C3%AAtre-Scripts-%28OmegaT%29.


C'est quoi un script ?

Les scripts sont les bouts de code qui peuvent être exécutés dans une fenêtre spéciale d'OmegaT (Outils > Scripts...). Des raccourcis-clavier sont aussi assignables directement dans le menu, il n'est donc pas nécessaire de se rendre à chaque fois dans la fenêtre.

Ils fonctionnent en Javascript et en Groovy et permettent des fonctions qu'OmegaT ne dispose pas de base ou qui sont plus facilement atteignables par ce biais.


Dans le vif du sujet

On a donc plusieurs possibilités : soit utiliser un script par défaut, soit en copier/coller un d'Internet, soit l'écrire soi-même. Si l'on regarde déjà ceux par défaut, un attire immédiatement l'attention quant à la relecture : il s'agit du tout premier de la liste, nommé "AQ - Règles de vérification". On appuie sur "Exécuter" et :


La révision a bien été effectuée. Nous avons ici les numéros des segments comportant des "problèmes" (pratique pour s'y rendre avec Ctrl + J en plus des boutons cliquables), les catégories des erreurs, le segment cible et le segment source. L'utilisateur doit relire lui-même les segments pour les corriger.


Liste non exhaustive des scripts utiles :


- Espace insécable : voir les espaces en trop ;

- QA - Identical segment, Check same segment ou Show same segment : voir les segments source et cible identiques ;

- Vérification orthographique : voir les fautes d'orthographe.


Mais il n'est pas impossible de soi-même définir ses propres règles de révision. Les possibilités avec les scripts sont par conséquent quasi infinies. Cela demande néanmoins une connaissance poussée des deux langages de programmation mentionnés plus tôt dans cet article.


Quant aux scripts à télécharger, ils sont présents un peu partout sur Internet. Le site d'OmegaT met d'ailleurs à disposition des ressources pour tout et n'importe quoi, trouvables ici : https://omegat.org/fr/resources.


De ce fait, les scripts sont des vrais outils de relecture. Ils peuvent mener à bien la vérification partielle ou totale du document ou du projet en cours. Cela m'a fait réaliser que cette nouvelle approche pouvait s'avérer utile pour la suite, parallèlement aux outils décrits par Ismaël.

lilianfaedi

Dernière mise à jour : 25 mars 2022

Nous nous approchons désormais de la mi-mars et le temps passe en un éclair. Alors que je continue à utiliser OmegaT, je me suis demandé encore quelles connaissances je vais bien pouvoir développer au fur et à mesure de mon exploration dans le logiciel. Cet outil de TAO (Traduction Assistée par Ordinateur) permet une certaine liberté dans l'exercice, surtout par rapport à d'autres logiciels comme Trados Studio. Cela fait à la fois sa force et sa faiblesse, en "deux temps deux mesures" si je puis dire. En effet, pour quelqu'un qui est habitué à utiliser un tel logiciel, les possibilités pour traiter un document, le traduire et en générer une copie cible semblent plus étendus et plus personnalisables. A l'inverse, les fonctions proposées sont telles que pour un parfait débutant que j'étais - et que je suis encore -, la majorité reste à mes yeux pour le moins nébuleux.


C'est précisément le but de ce stage qui me pousse (me force, peut-être) à sortir de ma zone de confort et à essayer un grand nombre de fonctionnalités. Car, dans mon cursus à l'université, OmegaT restait minoritaire. C'est surtout notre tuteur de stage qui nous a montré en partie son fonctionnement et des notions qui demeuraient jusqu'alors inconnues, comme les "expressions régulières". Avec Ismaël, collègue stagiaire, nous nous échangeons continuellement des conseils, des façons de faire, des traductions à adopter, etc. Cela permet avant tout de développer son esprit d'équipe et, au-delà de cela, de mettre en avant ses compétences professionnelles : bien souvent, dans une entreprise, il est somme toute assez rare de se couper du monde et de ne travailler qu'avec soi. Les acteurs, aussi minimes soient-ils, restent présents lorsqu'il s'agit de mener à bien un projet - ce qui est évidemment le cas de la traduction.


Pour comprendre, il ne faut pas seulement consulter la documentation en ligne. Il faut surtout expérimenter. Un bon exemple de cela se trouve dans les projets en équipe, qui sont peu employés par les traducteurs d'agences de traduction (et encore plus par les utilisateurs d'OmegaT). La fonction est intéressante ; l'enregistrement, pratique. Il est possible de voir même les commentaires partagés et les ajouts automatiques de la mémoire de traduction dans les segments cible, ce qui ajoute une plus-value au projet.


En réalité, je dois avouer que c'est intéressant de découvrir le logiciel ainsi, à la façon d'un trial and error. Voir jusqu'où cette exploration d'OmegaT et d'autres outils (Texinfo, po4a ...) permet une liberté intuitive. Dans cette traduction que je réalise chaque jour, j'ai l'impression de mieux comprendre des éléments et de saisir l'objectif réel de ce travail. Ainsi, j'en conclus que les semaines suivantes vont connaître une diversification des tâches du stage, qui sont autant de connaissances à assimiler.

bottom of page