Google XXL: Traduire avec Google Translator Toolkit
Google XXL

Traduire avec Google Translator Toolkit

Tout traduire avec Google Translator Toolkit

Un nouvel outil de traduction : Google Translator Toolkit


Google Translator Toolkit fonctionne avec des documents Word, OpenOffice, RTF, HTML, texte, les articles de l’encyclopédie en ligne Wikipédia et les Knols.
Une fois que vous vous êtes enregistré auprès de ce service, il sera visible dans votre espace Google sous cette appellation : Google Translation Center.
Un éditeur WYSIWYG vous permet de modifier la traduction qui est proposée.
Vous pouvez éditer un document en ligne avec les personnes de votre choix.
Il est possible d’exporter le document traduit dans différents formats : Word, OpenOffice, RTF ou HTML.
Le principe est donc de fournir à des personnes réalisant des traductions professionnelles un ensemble d’outils qui vont leur permettre de travailler de manière plus efficace.
Pour l’instant, l’anglais est la seule langue source possible. La langue de destination peut être une des suivantes : albanais, arabe, bulgare, catalan, chinois (simplifié), chinois (traditionnel), croate, tchèque, danois, néerlandais, anglais, estonien, philippin, finnois, français, galicien, allemand, grec, hébreu, hindi, hongrois, indonésien, italien, japonais, letton, lituanien, maltais, néerlandais, norvégien, polonais, portugais (Brésil), portugais (Portugal), roumain, russe, serbe, slovaque, slovène, espagnol, suédois, thaï, turc, ukrainien ou vietnamien.
Cet outil est capable de réaliser des traductions dans un grand nombre de langues parlées dans le sous-continent indien comme le rappelle ce blog de Google.
Google Translator Toolkit offre des fonctionnalités de translitération permettant de convertir des lettres romaines en caractères arabes ou indiens.
La taille du document source ne doit pas excéder 1 Go et vous avez le droit d’envoyer jusqu’à 1 Go de contenu par an.
Consultez l’aide pour avoir plus de détails sur la taille autorisée pour les glossaires personnels (1 Mo par envoi) ainsi que pour les mémoires de traduction (50 Mo par envoi). Ces mémoires peuvent être au format TMX ou "Format d'échange pour les mémoires de traduction". Signalons qu’une mémoire de traduction est une base de données contenant des segments de texte ainsi que leur équivalent dans une autre langue. De fait, vous pouvez enregistrer des mémoires afin de les utiliser de nouveau un peu plus tard.
Une liste de raccourcis clavier est indiquée sur cette autre page de l’Aide.
Vous activez cet ensemble d’outils en cliquant sur le bouton Show toolkit.
Il existe certaines particularités...
Quand vous charger un document, ce dernier est divisé en différents segments puis il sera traduit automatiquement par Google. Ce processus de pré-traduction fait appel à ces possibilités :
  • Si une traduction humaine existe, elle sera d’abord utilisée ;
  • Si aucune traduction publique n’existe, une machine se chargera de tout le travail ;
  • Si aucune traduction n’a été trouvée et qu’aucune machine n’est capable d’accomplir la tâche demandée, alors ce sera le texte d’origine qui sera affiché.
Vous pouvez modifier l’ordre de priorité en cliquant sur le lien Settings.
Le texte qui peut ne pas être visible dans, par exemple, une page HTML est aussi traduit et son contenu sera mentionné dans la rubrique Hidden text (en bas de la page). Cela peut être la valeur de certains boutons, les options présentes dans les listes déroulantes, etc. En bref, cela recoupe à la fois les éléments et les attributs HTML.
De manière similaire, certaines balises HTML sont remplacées par des équivalents dont la syntaxe est la suivante : {n/}. La valeur placée entre deux accolades indique la position de la balise par rapport aux autres attributs trouvés dans le même segment. La liste déroulante Insert HTML tags permet d’insérer vos propres balises HTML.
Que votre traduction soit finalisée ou non, il vous est possible de l’enregistrer en cliquant sur Save.
La mention "Translation completion" indique le pourcentage du nombre de segments qui ont été traduits par vos soins. Si vous recevez un complément à un texte d’origine, ce pourcentage va donc logiquement diminuer.
Il vous est possible d’insérer des commentaires ainsi que de rechercher et remplacer du texte.
Vous pouvez utiliser un glossaire personnalisé qui doit être au format CSV. Un glossaire est un ensemble de termes, définitions, usages ainsi que les notes qui sont associées.
L’utilisation des dictionnaires et des glossaires permettent au traducteur ne se servir de son précédent travail pour améliorer et rendre plus rapide les traductions qu’il sera amené à réaliser plus tard.
Bon, vous l’avez deviné : je ne suis pas traducteur de métier et je baragouine trois mots d’anglais… J’ai eu l’impression que Google Translator Toolkit se situait à mi-chemin entre les services en ligne et les applications professionnelles de traduction. Bien que cet outil comporte des limitations en termes de poids des fichiers, il propose un grand nombre de fonctionnalités qui vous permettront de réaliser des traductions de manière beaucoup plus efficace qu’avec des programmes en ligne comme Systran. Bien entendu, si vous utilisez d’autres solutions dites avancées, vous pouvez nous laisser un commentaire qui mettra mieux en lumière les avantages et les inconvénients de Google Translator Toolkit.
Dernier point : le développement de cet outil va permettre à la firme de Mountain View d’améliorer son propre service de traduction en étant aidé par des milliers (millions ?) de petites mains anonymes qui, chacun à leur manière, apporteront leur pierre à l’édifice.

2 commentaires:

  Anyword - Guillaume

15 juin 2009 à 17:16

Bonjour,

Google Translator Toolkit est un concurrent sérieux, et gratuit, des nombreuses applications professionnelles d'aide à la traduction comme SDL Trados, Wordfast, Atril DéjàVu, Similis, Star Transit, etc. Tous ces logiciels sont vendus aux professionnels (traducteurs et agences) pour réutiliser les traductions antérieures et améliorer leur productivité. Presque tous les professionnels exploitent ces logiciels, et il existe des regroupements (comme TAUS) qui partagent leurs mémoires. Il existait déjà des solutions en licence libre, mais aucune ne bénéficie de la célébrité de Google. Or le prix de ces outils constitue un frein considérable pour les traducteurs indépendants, qui renâclent à payer 800€ la licence, et à la renouveler tous les deux ans. Il y a donc de fortes chances que Google Translator Toolkit soit très vite adopté par les traducteurs professionnels.
C'est là qu'interviennent les autres problèmes. Les traducteurs manipulent des textes dont le degré de confidentialité est très élevé, au moins pendant le temps de la traduction. Considérez le cas des communiqués de presse. En cours de traduction, ils font de très nombreux allers-retours entre le traducteur (ou l'agence) et le client final, qui tient à valider le sens exact de chaque proposition. Tant que le texte final n'est pas validé, l'information est "sous embargo" : il est strictement interdit de la diffuser aux journalistes. Ce qui est vrai pour un simple communiqué de presse l'est encore bien plus pour un contrat entre deux entreprises... Les agences de traduction ont des Conditions générales d'achat et des contrats de confidentialité très stricts qui les lient avec leurs traducteurs, parce qu'elles ont des obligations draconiennes à respecter pour leurs clients.
Or le Translator's Toolkit récupère le contenu des textes source et le réutilise. Même si un texte n'est pas "partagé", son contenu est susceptible de ne pas être privé. Si vous chargez un texte dans l'interface puis que vous le supprimez et que vous téléchargez ensuite le même texte dans une autre langue, le Translator Toolkit vous proposera les phrases issues du premier texte comme traductions du second. Google semble conserver les textes téléchargés une fois sur son interface de traduction. Ce qui brise toute confidentialité. Ce point est très grave car il y a de fortes chances que les traducteurs indépendants utilisent le Translator's Toolkit. Ce faisant, ils risquent de rompre l'accord de confidentialité qui les lie à leur client, agence ou entreprise. Premier risque majeur.
Quant au second, il n'échappe à personne. Les traductions réalisées au sein du Toolkit sont envoyées pour analyse au moteur de traduction automatique Google Translate. Celui-ci fonctionne sur des bases "statistiques", c'est-à-dire qu'il améliore sans cesse ses résultats en s'entrainant sur des traductions. Ce système donne d'excellents résultats... à condition que le "corpus" d'entrainement soit correct. La meilleure manière de s'en assurer, c'est de le faire constituer par des traducteurs professionnels.
La proposition de Google est subtile : des traducteurs professionnels vont utiliser gratuitement son outil à mémoire de traduction afin de créer et mettre à jour un corpus de bonne qualité, qui sera ensuite utilisé pour améliorer les résultats du moteur de traduction Google Translate... dont l'objectif reste in fine de remplacer les traducteurs indépendants !
Si l'actualité de tous ces outils vous intéresse, n'hésitez pas à consulter L'Observatoire de la traduction, qui publie régulièrement des articles sur ces sujets.

Guillaume de Brébisson
Agence de traduction Anyword

  test

15 juin 2009 à 17:57

C'est rare d'avoir un commentaire qui soit presque aussi long que l'article !
Je suis d'accord avec les deux points que vous relevez.
Mais de là à dire que les traducteurs professionnels seront ammenés à disparaître, je crois qu'il y a une part d'exagération.
Je pense plutôt que leur métier va forcément évolué.
Cela dit, d'après ce que j'ai entendu ici et là, je n'ai pas eu le sentiment que les traduteurs indépendants roulaient sur l'or. Le prix des outils ne doit pas les aider beaucoup en effet !
Au final, je serai curieux de comparer les performances respectives des solutions professionnelles et savoir si la panoplie des fonctions proposées est réellement beaucoup plus importantes que les solutions open-source ou gratuites (mais limitées) comme celles que propose Google.
Bon ! Voici une bonne raison de faire une visite approfondie à l'observatoire de la traduction ;-)