Vertalingsglossaria & Terminologieconsistentie in WordPress

Open de Duitse versie van een WooCommerce winkel en zie hoe het woord "Cart" door de interface reist. De headerknop zegt Warenkorb. De afrekenpagina zegt Einkaufswagen. Een bevestigingsmail zegt Korb. Alle drie zijn technisch geldige Duitse woorden voor een winkelwagentje, en een menselijke vertaler die bestand voor bestand werkt, zou elk van hen kunnen gebruiken. Maar een klant die de site leest, ziet geen drie synoniemen. Ze zien een site die zijn eigen woordenschat niet consistent kan houden, en op een e-commerce site wordt die inconsistentie gelezen als slordigheid, precies op het moment dat u om een creditcard vraagt.
Dit is het probleem dat een vertaalglossarium oplost. Een glossarium, soms ook wel een termbase genoemd, is de gezaghebbende lijst van hoe specifieke termen in elke taal moeten worden weergegeven, welke termen helemaal nooit mogen worden vertaald, en welke elke keer op precies dezelfde manier moeten worden vertaald. Deze gids legt het concept van het glossarium uit, de twee categorieën termen die het belangrijkst zijn, waarom het opdelen van grote bestanden in 'chunks' stilletjes de consistentie vernietigt, en hoe een vertaalpijplijn die een glossarium over meerdere 'chunks' handhaaft, dit probleem oplost.
Wat is een vertalingsglossarium?
Een vertalingsglossarium is een gestructureerde toewijzing van brontaaltermen aan hun goedgekeurde vertalingen, bijgehouden per taal. In zijn eenvoudigste vorm is het een tabel: de bronterm, de vereiste doelterm en een opmerking of deze 'locked' of vertaalbaar is. Vertalers en vertaalengines raadplegen het als de enige bron van waarheid, zodat hetzelfde concept nooit op twee verschillende manieren wordt weergegeven.
Een klein glossariumfragment kan er in JSON zo uitzien:
{
"en": "Cart",
"translations": {
"de": "Warenkorb",
"es": "Carrito",
"fr": "Panier"
},
"translatable": true
},
{
"en": "Acme Pro",
"translations": {},
"translatable": false,
"note": "Brand product name. Never translate."
}
Of, als uw team de voorkeur geeft aan een platte spreadsheet, dezelfde gegevens als CSV:
source,de,es,fr,translatable
Cart,Warenkorb,Carrito,Panier,yes
Checkout,Kasse,Pagar,Commander,yes
Acme Pro,,,,no
Add to Cart,In den Warenkorb,Añadir al carrito,Ajouter au panier,yes
Het glossarium doet twee dingen tegelijk. Voor vertaalbare termen dwingt het één goedgekeurde weergave af. Voor niet-vertaalbare termen fungeert het als een 'niet aanraken'-lijst.
Het formaat zelf doet er nauwelijks toe. JSON, CSV, een spreadsheet of een eenvoudig sleutel-waarde-bestand werken allemaal, want de waarde van een glossarium zit niet in de bestandsextensie, maar in zijn rol als de overeengekomen referentie. Wat telt, is dat het bestaat, dat het de enige gezaghebbende kopie is, en dat wat uw strings ook vertaalt, het daadwerkelijk raadpleegt. Een glossarium dat op een gedeelde schijf staat en dat het vertaalproces nooit leest, is slechts documentatie. Een glossarium dat de pijplijn op elke string afdwingt, is een kwaliteitsgarantie.
De meeste teams beginnen reactief met een glossarium, nadat de eerste inconsistentie hen in productie in verlegenheid heeft gebracht. De betere weg is om het te vullen vóór de eerste vertaalslag met de voor de hand liggende items: uw productnamen, uw top twintig interfac termen en alle branchegerelateerde woordenschat waarbij een verkeerde keuze klanten in verwarring zou brengen. Twintig goed gekozen items voorkomen de grote meerderheid van consistentiefouten.
De twee soorten termen die zonder glossarium inconsistent worden
Welke termen hebben eigenlijk glossariumcontrole nodig? Twee categorieën, en ze falen in tegenovergestelde richtingen.
Merktermen die nooit mogen worden vertaald
Productnamen, merknamen, functienamen en handelsmerken moeten volledig ongewijzigd door de vertaling heen gaan. Wanneer Acme Pro in het Spaans Acme Profesional wordt, of uw QuickShip verzendfunctie verandert in EnvíoRápido, hebt u de merkherkenning verbroken en, vaak, de UI waar die exacte string in code wordt gematcht.
Dit is de meest voorkomende en meest schadelijke glossariumfout. Een machinevertaler, aan zijn lot overgelaten, zal Pro, Plus, Cloud en elk ander woord dat eruitziet als een gewoon zelfstandig naamwoord, behulpzaam vertalen, omdat hij geen manier heeft om te weten dat die woorden deel uitmaken van een merk. Het glossarium is wat hem vertelt te stoppen.
Termen die consistent moeten worden vertaald
Het tegenovergestelde probleem is de Warenkorb versus Einkaufswagen situatie. Dit zijn echte woorden die vertaald moeten worden, maar altijd op dezelfde manier. Interfacevocabulaire zoals Cart, Checkout, Account, Wishlist, Order en Shipping moeten naar één vaste doelterm worden toegewezen over elk scherm, elke e-mail en elke knop. Het gevaar hier is niet een verkeerde vertaling, maar 'drift': elke individueel-correcte keuze is op zichzelf prima, en alleen de inconsistentie over de hele site is het defect.
Dit is het probleem van de erosie van vertrouwen. Gebruikers bouwen een mentaal model van uw interfacevocabulaire terwijl ze erdoorheen navigeren. Wanneer het woord verandert, breekt het model, en de cognitieve frictie wordt geregistreerd als een vaag gevoel dat de site van lage kwaliteit is, zelfs wanneer de klant niet kan uitleggen waarom.
Consistentie heeft ook een concrete bruikbaarheidskost, naast het gevoel. Ondersteunende documentatie, tooltips en onboarding-e-mails verwijzen allemaal naar interfac termen. Als de knop Warenkorb zegt, maar het helpartikel zegt Einkaufswagen, kan een verwarde klant de instructie niet koppelen aan het scherm. Inconsistente terminologie breekt stilletjes uw eigen ondersteunende inhoud. Het glossarium is wat het product, de documentatie en de marketingteksten letterlijk allemaal dezelfde taal laat spreken.
Waarom het opdelen van grote bestanden in 'chunks' inconsistentie veroorzaakt
Hier is het mechanisme dat een eenmalige glossarium ergernis verandert in een systemisch probleem op grote sites. Een grote WordPress- of WooCommerce-winkel kan een .po bestand hebben met duizenden strings, veel meer dan enig AI-model in één enkele aanvraag kan vertalen. Dus wordt het bestand opgesplitst in 'chunks', en elke 'chunk' wordt afzonderlijk vertaald.
Het probleem is dat wanneer elke 'chunk' afzonderlijk wordt vertaald, de engine geen geheugen heeft van hoe het een term drie 'chunks' geleden heeft weergegeven. 'Chunk' 1 zou "Cart" kunnen vertalen als Warenkorb. 'Chunk' 7, verwerkt als een onafhankelijke aanvraag zonder gedeelde context, zou even redelijkerwijs hetzelfde "Cart" kunnen vertalen als Einkaufswagen. Geen van beide is op zichzelf verkeerd. De inconsistentie is een artefact van het 'chunking', niet van een enkele slechte beslissing.
# Chunk 1 - header strings
msgid "Cart"
msgstr "Warenkorb"
# Chunk 7 - footer strings, translated in a separate request
msgid "View Cart"
msgstr "Einkaufswagen ansehen"
Hoe groter het bestand, hoe meer 'chunks', en hoe meer mogelijkheden voor dezelfde term om uiteen te lopen. Dit is precies waarom het vertalen van grote bestanden moeilijker is dan het lijkt, een onderwerp dat we diepgaand behandelen in hoe grote PO-bestanden te vertalen. Naïef 'chunking' ruilt volledigheid in voor consistentie, en in een winkel met duizenden strings, komt die ruil overal naar voren.
Hoe een glossarium-bewuste pijplijn het oplost
De oplossing is een vertaalpijplijn die twee dingen tegelijk doet: het splitst grote bestanden intelligent zodat ze überhaupt kunnen worden verwerkt, en het draagt glossarium- en terminologiecontext mee over elke 'chunk', zodat het splitsen nooit 'drift' introduceert.
Dit is waar Smart Batching en Context-Aware AI als een paar werken. Smart Batching verdeelt een bestand van meer dan 10 MB in verwerkbare 'chunks', maar de 'chunks' worden niet vertaald als geïsoleerde vreemden. De pijplijn dwingt glossarium- en terminologieconsistentie af over 'chunks' heen, zodat zodra "Cart" is vastgesteld als Warenkorb, elke latere 'chunk' die "Cart" bevat, dezelfde weergave krijgt. Het glossarium van 'locked' merktermen reist ook mee met elke 'chunk', dus Acme Pro blijft intact, of het nu verschijnt in string nummer 5 of string nummer 5.000.
Het praktische resultaat is dat een winkelbestand van 6.000 strings terugkomt met één consistent vocabulaire in plaats van een lappendeken. Merknamen blijven onaangeroerd. Interfac termen zijn uniform. En de plaatsaanduidingen binnen die strings, de %s en {name} tokens, blijven tegelijkertijd op hun plaats vergrendeld. U krijgt een bestand dat leest alsof één zorgvuldige vertaler met een perfect geheugen het hele werk in één keer heeft gedaan.
Vergelijk dat met het alternatief waar de meeste mensen op terugvallen: het bestand in stukken vertalen, en vervolgens handmatig zoeken en vervangen om termen daarna te normaliseren. Die aanpak faalt om twee redenen. Ten eerste moet u al elke term kennen die is afgedwaald, wat betekent dat u duizenden strings moet controleren om de inconsistenties überhaupt te vinden. Ten tweede is blind zoeken en vervangen gevaarlijk, omdat hetzelfde woord in de ene context correct kan zijn en in de andere verkeerd. Het afdwingen van het glossarium tijdens de vertaling, terwijl de engine nog de volledige context van elke string heeft, is fundamenteel veiliger dan het achteraf repareren.
Glossaria in een Multi-Site Workflow
Voor bureaus die lokalisatie uitvoeren over vele klantsites, wordt glossarium discipline samengesteld. Elke klant heeft zijn eigen merktermen en zijn eigen goedgekeurde vocabulaire, en het hergebruiken van het glossarium van de ene klant bij een andere is een gegarandeerde gênante situatie. Een herhaalbare, glossarium-gestuurde workflow is wat een dozijn meertalige sites consistent houdt zonder een dozijn keer de handmatige controle, wat de kern vormt van de ideale lokalisatieworkflow voor bureaus die meerdere klantsites beheren. Het glossarium wordt een per-klant-activum dat meereist met elk bestand dat u voor hen vertaalt.
Terminologieconsistentie is een van die kwaliteitssignalen die niemand bewust opmerkt wanneer het goed is en iedereen voelt wanneer het verkeerd is. De klant die Warenkorb op elk scherm leest, denkt er nooit over na. Degene die drie verschillende woorden voor winkelwagentje ziet, dient ook geen klacht in, ze vertrouwen de site gewoon een beetje minder en converteren een beetje slechter. Een glossarium, afgedwongen over elke 'chunk' van elk bestand, is hoe u ervoor zorgt dat ze dat nooit hoeven te doen.
Klaar om elke term consistent te houden in uw hele meertalige winkel? Probeer SimplePoTranslate gratis — geen creditcard nodig. De gratis laag dwingt glossarium- en terminologieconsistentie af over 'chunks' heen, zodat "Cart" één woord blijft en uw merknamen onaangeroerd blijven van de eerste tot de laatste string.