Google XXL: Bing Translator Vs Google Traduction
Google XXL

Bing Translator Vs Google Traduction

Bing Translatore

Un comparatif entre 3 services de traduction en ligne


La disponibilité de Bing Translator m’a donné envie de le comparer avec ces deux autres services de traduction en ligne : Google Traduction et Systran. Indépendamment de l’interface très bien pensée de Bing Translator, je me suis simplement intéressé à la qualité des traductions qui étaient proposées. En rouge, est indiquée ce qui m’a semblé être la meilleure traduction pour une même phrase tandis que la couleur bleue signale les traductions qui sont similaires à, au moins, deux services. Étant donné que l’avant dernière phrase n’est pas plus compréhensible d’un service à l’autre, c’est donc un zéro pointé qui a été décerné à nos trois challengers. La page de test qui sert de référence est extraite de l’encyclopédie en ligne Wikipédia (dans sa version anglaise) et traite du HTML 5.

Google Traduction :
HTML 5 (HyperText Markup Language Version 5) est la prochaine révision majeure du langage de base de la World Wide Web, HTML.
HTML 5 spécifie deux variantes de la même langue, d'un "classique" HTML (text / html) variante connue sous le nom de HTML5 et XHTML variante connue sous le nom de XHTML5.
C'est la première fois que le HTML et le XHTML ont été développés en parallèle.
Les idées de HTML 5, initialement dénommé applications Web 1.0, a été lancé en 2004 par le Web Hypertext Application Technology Working Group (WHATWG),
HTML 5 intègre Web Forms 2.0, un autre WHATWG spécification.
La spécification HTML 5 a été adopté comme point de départ des travaux du nouveau groupe de travail HTML du W3C en 2007.
Le groupe de travail a publié le premier Working Draft public du cahier des charges le 22 Janvier 2008. [1]

La spécification est un travail en cours, et devrait le rester pour de nombreuses années, bien que certaines parties de HTML 5 sont en cours d'être terminé et mis en œuvre dans les navigateurs devant l'ensemble de la spécification finale atteint le statut de recommandation.[2]
Les éditeurs sont Ian Hickson de Google, Inc et David Hyatt, Apple, Inc[1]


Bing Translator :
HTML 5 ( hyperText Markup Language version 5 ) est la prochaine révision majeure de la langue principale du Web , HTML .
HTML 5 spécifie deux variantes de la même langue, une variante HTML (text/html) classique appelé HTML5 et une variante XHTML appelé XHTML5 .
C'est la première fois que HTML et XHTML ont été développés en parallèle.
Les idées derrière HTML 5, à l'origine appelé Web Applications 1.0 , ont été lancées en 2004 par le groupe de travail Web Hypertext application Technology (WHATWG);
5 HTML intègre les Web Forms 2.0 , un autre spécification WHATWG .
La spécification HTML 5 a été adoptée comme point de départ de le œuvre du nouveau groupe de travail HTML du W3C en 2007.
Le groupe de travail a publié le premier public document de travail de la spécification, le 22 janvier 2008. [ 1 ]
La spécification est un travail en cours et devrait rester pendant de nombreuses années, bien que certaines parties de HTML 5 vont être terminé et mis en œuvre dans les navigateurs avant atteint de la spécification toute statut de recommandation finale.[ 2 ]
Les éditeurs sont Ian Hickson de Google, Inc. et David Hyatt , Apple,[ 1 ]


Systran :
HTML 5 (la version de langage de balisage hypertexte 5) est la prochaine révision principale de la langue de noyau du World Wide Web, HTML.
HTML 5 spécifie deux variantes de la même langue, une variante « classique » de HTML (texte/HTML) connue sous le nom de HTML5 et une variante de XHTML connue sous le nom de XHTML5.
C'est la première fois que le HTML et le XHTML ont été développés en parallèle.
Les idées derrière HTML 5, à l'origine désigné sous le nom des applications Web 1,0, ont été frayées un chemin en 2004 par le groupe de travail de technologie d'application d'hypertexte de Web (WHATWG) ;
HTML 5 incorpore les formes 2,0, des autres spécifications de Web de WHATWG.
Les spécifications de HTML 5 ont été adoptées comme le point de départ du travail du nouveau groupe de travail de HTML de W3C en 2007.
Le groupe de travail a édité le premier document de travail public des spécifications le 22 janvier 2008.[1]
On s'attend à ce que les spécifications sont un travail continu, et demeurent ainsi pendant beaucoup d'années, bien que des parties de HTML 5 aillent être finies et mises en application en navigateurs avant que les spécifications entières atteignent le statut final de recommandation.[2]
Les rédacteurs sont Ian Hickson de Google, Inc. et David Hyatt, Apple, Inc. [1]

En ajoutant un point à Google et Systran puisqu’ils proposent la même traduction pour une phrase, on obtient les scores suivants :
  • Google Traduction : 5 points ;
  • Bing Translator : 1 point ;
  • Systran (ou Babel Fish) : 3 points.
Comme on peut le voir, la perfection n’est pas de ce monde et chacun de ces services possède ses points forts et ses points faibles. Mais dès que la tournure des phrases se fait quelque peu littéraire, la traduction proposée dévisse pour tendre vers un charabia incompréhensible. Malgré tout, Bing Translator semble en retrait par rapport à ses concurrents.
Et, au final, on peut aussi penser que pour afficher une traduction parfaite de cette page, il est encore plus simple d’accéder à la version française de cet article…
N’utilisant pas des applications de traduction avancées, j’ignore complètement si elles font mieux ou moins bien…

4 commentaires:

  Anonyme

14 juin 2009 à 18:21

Sur cette exemple, Bing est le dernier. Toutefois, j'utilise les trois pour traduire des bouts de texte et il s'avère que Bing et Google sont baucoup mieux que Systran. Et j'ajouterai que certaines fois, Bing translator tire son épingle du jeu en traduisant à la perfection. Est-ce du à des avancées depuis l'écriture de cet article?

  Jean-Noël Anderruthy

14 juin 2009 à 19:45

Non ! Cet article n'est en aucun cas parole d'évangile. Il est sûr que vous allez avoir des bouts de texte mieux traduits parce que vous êtes tombé sur un des points forts du programme (quelque soit le programme considéré). J'ai pris cet exemple mais j'ai testé d'autres pages. J'ai eu l'impression qu'au moins sur le sens anglais - français, Google Traduction s'en sortait globalement mieux. Mais, cela n'engage que moi ! De fait, je pense que la bonne solution est d'utiliser les 3 outils et de n'en garder que le meilleur de ce qu'ils produisent.

  Guillaume - Anyword

18 juin 2009 à 11:17

Bonjour,

c'est toujours très intéressant de comparer les résultats de plusieurs moteurs de traduction automatique, parce que ça permet de se faire une idée des conséquences des choix technologiques. Google Translate est un moteur de traduction statistique, et ses résultats dépendent donc en grande partie de la qualité des textes de référence à partir desquels il s'entraîne. Systran (la version Web) est basé sur un système d'analyse syntaxique : ses résultats sont très liés au dictionnaire personnalisé qu'il exploite pour traduire le texte qui lui est soumis. Quand à Bing (qui s'appelait Live translator auparavant), eh bien... ça dépend des langues : c'est un moteur statistique la plupart du temps, mais pour certaines paires de langues il repose encore sur la technologie Systran.

Tout ça pour dire que si on veut avoir de bons résultats en traduction automatique, il faut, au minimum, pouvoir personnaliser soit le dictionnaire soit le corpus de textes, ce que ne permettent pas les sites Web de ces moteurs. A défaut, on peut aussi agir sur le texte source : selon la façon dont la phrase d'origine est construite, les résultats seront très différents (voir à ce sujet une autre comparaison entre moteurs de traduction dans L'Observatoire de la traduction).

C'est pourquoi on peut difficilement tirer des conclusions au sujet de la qualité des moteurs de traduction en se basant sur les sites Web gratuits. Les logiciels pour postes de travail des éditeurs spécialisés (essentiellement Reverso, Systran et Promt) donnent des résultats bien plus exploitables. Et bien sûr les solutions pour entreprises sont bien bien meilleures. A ce sujet, ll faut noter que la nouvelle version Entreprise de Systran exploite à la fois la technologie syntaxique traditionnelle et la technologie statistique retenue par Google. Il est probable que les résultats sont encore meilleurs (mais c'est difficile à vérifier sans s'équiper, et le prix n'est pas à la portée des particuliers ni des petites entreprises).

A bientôt,
Guillaume de Brébisson
Agencede traduction Anyword

  Jean-Noël Anderruthy

18 juin 2009 à 13:34

Merci pour votre commentaire : j'ai vraiment appris quelque chose !
Et ça me donne envie de tester des logiciels professionnels. C'est vrai que les prix ont de quoi faire peur :-(