Lorsque la phrase « le contexte fait toute la différence » ne veut plus rien dire en matière de localisation

Il y a quelques semaines, une collègue a interrompu notre conversation pour faire valoir un point. « Le contexte fait toute la différence », a-t-elle déclaré.

Tous ceux qui ont déjà travaillé dans le domaine de la localisation connaissent bien ce phénomène. Les traducteurs reçoivent souvent des phrases isolées ou des éléments graphiques sans informations contextuelles. Sans contexte, même les phrases les plus courtes peuvent être interprétées de plusieurs façons. Depuis des décennies, fournir davantage de contexte aux traducteurs est l’un des moyens les plus efficaces pour réduire les corrections et améliorer la qualité.

Ce principe a longtemps influencé la conception des processus de localisation. En cas de problème, l’explication était généralement la même : le traducteur ou le système ne disposait tout simplement pas de suffisamment de contexte.

La localisation facilitée par l’IA commence à révéler une tendance différente.

Présentement, pour une seule demande de localisation, les équipes envoient en même temps la documentation du produit, les guides de style, les bases de données terminologiques et les mémoires de traduction. Le système reçoit ainsi davantage d’informations contextuelles que la plupart des traducteurs humains n’ont jamais eu accès simultanément.

Cependant, les résultats ont tendance à être moins fiables plutôt que plus cohérents.

Cet élément mérite d’être examiné. Il met en lumière un fait important concernant le rôle réel du contexte dans les processus de localisation modernes axés sur l’IA.

Les éléments importants à retenir

  • Dans le domaine de la localisation, le contexte ne se limite désormais plus au texte environnant.
  • Un contexte plus complet n’améliore pas systématiquement la qualité des traductions générées par l’IA.
  • La localisation par l’IA nécessite une gestion attentive du contexte, et non pas seulement une accumulation de données contextuelles.
  • Le principal défi consiste désormais à déterminer quels éléments contextuels sont prioritaires.
  • Le rôle de l’expertise humaine évolue : elle passe de la correction a posteriori à la gestion du contexte en amont.

Que signifie le « contexte » en matière de localisation ?

Dans le domaine de la localisation, le contexte a toujours eu une portée plus large que d’être limité uniquement aux mots qui précèdent et ceux qui suivent la phrase à traduire. Plusieurs types d’informations distincts déterminent la façon dont le texte doit être interprété et transposé.

Voici quelques exemples types :

  • Le contexte linguistique, notamment les phrases adjacentes ou les segments déjà traduits
  • Le contexte relatif au produit ou technique, qui sert à expliquer le rôle réel d’une fonctionnalité ou d’un composant de l’interface
  • Les lignes directrices concernant le style et le ton de la marque
  • Les contraintes juridiques ou réglementaires
  • Les attentes du public et les normes culturelles

Traditionnellement, la plupart des outils de localisation ne fournissaient qu’une petite partie de ces informations pendant la traduction. Les traducteurs comblaient cette lacune grâce à leur jugement. Il s’agissait là d’une limite bien connue et les processus de travail étaient conçus en tenant compte de cette contrainte.

Le contexte à l’ère des outils de TAO et des mémoires de traduction

À l’époque des outils de traduction assistée par ordinateur et des systèmes de mémoire de traduction, le contexte revêtait une signification opérationnelle plutôt restreinte.

Les mémoires de traduction enregistraient les segments déjà traduits. Lorsqu’une phrase similaire réapparaissait, le système proposait la version déjà utilisée. Le contexte était donc lié à deux éléments principaux : les traductions antérieures et le texte environnant. L’objectif principal était la cohérence. Lorsque la même phrase apparaissait à plusieurs reprises dans un ensemble de documents, elle devait être traduite de la même manière à chaque fois.

Ce modèle était limité, mais cohérent. Les traducteurs comprenaient d’où provenaient les signaux contextuels et comment ceux-ci devaient influencer leurs décisions. Le système ne prétendait pas en faire plus qu’il n’en faisait.

L’ère de la traduction automatique neuronale: des données améliorées en conservant le même modèle mental

La traduction automatique neuronale a élargi l’éventail d’informations dont les machines pouvaient utiliser pour générer des résultats. Les systèmes pouvaient être entraînés sur des corps de textes spécialisés, de la documentation technique sur les produits et une terminologie validée. La qualité des résultats s’est considérablement améliorée. La fluidité des textes s’est accrue, et de nombreuses corrections de routine sont devenues superflues.

Le modèle mental sous-jacent est toutefois resté similaire. Le contexte était toujours considéré avant tout comme un élément qui manquait au système. Des relecteurs humains corrigeaient les traductions lorsque le système traitait de manière inappropriée la terminologie spécialisée, le ton ou le sens.

Le flux de travail restait réactif. Les problèmes de contexte étaient corrigés après la traduction plutôt qu’avant la production. C’est une distinction importante quand on y repense, car l’approche qui a suivi a rendu le moment où les décisions contextuelles étaient prises beaucoup plus déterminant.

Localisation faite par l’IA et les différents niveaux de contexte

Les grands modèles linguistiques ont transformé la manière dont le contexte est intégré au système. Dans les processus de localisation effectué par l’intelligence artificielle, le contexte peut désormais provenir de plusieurs sources simultanément.

Les sources typiques comprennent :

  • Les instructions de la requête décrivant la tâche et ses exigences
  • Les guides de style ou les documents de référence joints à la demande
  • Les systèmes de recherche exploitant le contenu interne ou les mémoires de traduction
  • La mémoire systématique des interactions ou séances antérieures

Chacun de ces niveaux est cohérent en soi. Le problème survient lorsque ces niveaux se combinent. Les instructions peuvent entrer en conflit avec les documents de référence. Les bases de données terminologiques peuvent contredire les exemples trouvés dans les documents extraits. Les directives relatives au ton de la marque peuvent aller à l’encontre de la documentation technique du produit.

Au lieu de se compléter, les signaux contextuels peuvent entrer en concurrence. Le système doit gérer cette rivalité et il ne le fait pas toujours de la manière souhaitée par l’équipe.

Lorsque davantage de contexte nuit aux résultats

L’une des réalités contre-intuitives de la localisation faite par l’intelligence artificielle est que le fait de fournir davantage de contexte n’améliore pas systématiquement le résultat.

Les équipes constatent régulièrement des situations dans lesquelles une demande est accompagnée d’une documentation de référence très complète, mais que la terminologie devient incohérente ou que le ton de la marque varie d’un segment à l’autre. Ces résultats sont particulièrement difficiles à expliquer, car les informations pertinentes étaient techniquement présentes. Il ne manquait rien.

Le problème n’est pas le manque de données. Il est lié à la concurrence entre les signaux.

Les grands modèles linguistiques évaluent les entrées contextuelles de manière probabiliste. Lorsque de nombreuses sources se font concurrence pour influencer un résultat unique, le modèle doit trancher en fonction de ce qu’il estime être le plus pertinent. Des instructions importantes peuvent perdre de leur influence si elles sont diluées par des éléments que le modèle considère comme tout aussi importants, voire plus.

Les entreprises constatent souvent :

  • Une terminologie incohérente malgré l’existence de glossaires détaillés.
  • Une variation du ton de la marque, même lorsque des guides de style complets sont fournis.
  • Des résultats corrects, mais peu fiables pour des tâches similaires.

Ces phénomènes ne sont pas le signe d’un système défaillant. Ils reflètent une véritable limite du principe selon lequel un contexte plus étoffé améliore toujours la traduction. À partir d’un certain point, l’ajout de contexte commence à créer de la confusion plutôt qu’à la dissiper.

Le contexte de gouvernance lors de la localisation effectuée par l’IA

À mesure que les informations contextuelles se multiplient, les entreprises sont confrontées à une question qui ne se posait pas aux époques précédentes : comment gérer le contexte?

Dans le domaine de la localisation, la gestion du contexte consiste à déterminer quelles sources d’informations doivent guider les systèmes d’IA et comment résoudre les conflits potentiels entre elles. Il ne s’agit pas là d’une question purement technique, mais bien d’une question d’organisation.

La gouvernance peut inclure des décisions telles que :

  • Quels documents de référence font autorité pour un type de tâche donné
  • Quelles instructions prévalent sur les autres en cas de conflit
  • Quelles sources contextuelles doivent être exclues de certains flux de travail

En l’absence de règles explicites, les données contextuelles ont tendance à s’accumuler de manière organique entre les équipes et les outils. Au fil du temps, cette accumulation réduit la prévisibilité sans que quiconque ait pris la décision consciente de laisser cela se produire.

Les organisations qui déploient avec succès la localisation assistée par l’IA ont tendance à considérer le contexte comme un élément nécessitant une structure délibérée plutôt qu’un ajout passif.

Privilégier le contexte plutôt que d’accumuler trop d’informations

Une gestion efficace du contexte en matière de localisation implique généralement de définir des priorités plutôt que de multiplier les éléments. La question n’est pas de savoir quoi ajouter, mais ce qui doit prévaloir.

Les équipes bénéficient souvent de l’identification d’un petit ensemble de signaux dominants qui guident de manière cohérente le comportement de l’IA. Par exemple :

  • Les bases de données terminologiques peuvent prévaloir sur les exemples trouvés dans les documents de référence.
  • La documentation technique des produits peut prévaloir sur les consignes stylistiques générales pour le contenu technique.
  • Les obligations d’ordre juridique peuvent prévaloir sur les préférences de ton dans les communications réglementées.

Il s’agit rarement de décisions purement techniques. Elles nécessitent un jugement organisationnel concernant la tolérance au risque, l’identité de marque et les attentes du public cible du contenu traduit.

L’expertise humaine se déplace donc en amont. Plutôt que de corriger les traductions après leur production, les professionnels déterminent de plus en plus quelles données contextuelles le système doit privilégier et dans quel ordre. Il s’agit d’un type de compétence différent de la post-édition traditionnelle et les organisations qui ne reconnaissent pas cette évolution ont tendance à maintenir des effectifs adaptés à l’ancien mode de travail longtemps après que le véritable défi ait évolué.

Conclusion

Le contexte demeure un élément essentiel dans la localisation. Le sentiment intuitif qui accompagne depuis longtemps cette expression n’est pas faux.

Ce qui a changé, c’est la nature du problème. Les équipes de localisation ne sont plus principalement confrontées à un manque de contexte. Elles opèrent dans des environnements où le contexte est abondant, complexe et souvent contradictoire. La question n’est plus de savoir comment en fournir davantage. La question est de savoir quel type de contexte a de l’importance, qui prend cette décision et si l’organisation a fait ce choix de manière délibérée ou si elle a laissé les choses se faire naturellement.

Des questions sur vos processus de localisation ? Contactez l’équipe ITC Global, nous serons ravis d’en discuter avec vous.

Partager cet article :

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

ten + nine =

Ces articles pourraient vous intéresser

Faisons équipe!

C’est le moment de parler la langue de vos clients, prospects, partenaires et employés grâce à notre offre complète de solutions, qui combine les talents de notre entreprise et les nouvelles technologies. ITC Global, c’est tous les services linguistiques dont vous avez besoin, sur mesure, avec un seul et unique prestataire.