Глосарії перекладів та послідовність термінології у WordPress

Відкрийте німецьку версію магазину WooCommerce і подивіться, як слово "Cart" проходить через інтерфейс. Кнопка в заголовку каже Warenkorb. Сторінка оформлення замовлення каже Einkaufswagen. Електронний лист з підтвердженням каже Korb. Усі три технічно є дійсними німецькими словами для кошика покупок, і перекладач, що працює з файлом за файлом, може використовувати будь-яке з них. Але клієнт, що читає сайт, бачить не три синоніми. Він бачить сайт, який не може підтримувати свій власний словниковий запас, і на сайті електронної комерції ця непослідовність сприймається як недбалість саме в той момент, коли ви просите дані кредитної картки.
Ось проблема, яку вирішує глосарій перекладів. Глосарій, іноді його називають термінологічною базою, є авторитетним списком того, як конкретні терміни мають бути відтворені кожною мовою, які терміни ніколи не повинні перекладатися взагалі, і які повинні перекладатися однаково щоразу. Цей посібник пояснює концепцію глосарію, дві категорії термінів, які мають найбільше значення, чому розбиття великих файлів на частини непомітно руйнує послідовність, і як конвеєр перекладів, що підтримує глосарій між частинами, це виправляє.
Що таке глосарій перекладів
Глосарій перекладів — це структуроване відображення вихідних термінів на їхні затверджені переклади, що підтримується для кожної мови. У найпростішому вигляді це таблиця: вихідний термін, потрібний цільовий термін та примітка про те, чи є він заблокованим або перекладним. Перекладачі та перекладацькі системи звертаються до нього як до єдиного джерела істини, щоб одне й те саме поняття ніколи не було відтворено двома різними способами.
Невеликий фрагмент глосарію може виглядати так у JSON:
{
"en": "Cart",
"translations": {
"de": "Warenkorb",
"es": "Carrito",
"fr": "Panier"
},
"translatable": true
},
{
"en": "Acme Pro",
"translations": {},
"translatable": false,
"note": "Brand product name. Never translate."
}
Або, якщо ваша команда віддає перевагу простій електронній таблиці, ті ж дані у форматі CSV:
source,de,es,fr,translatable
Cart,Warenkorb,Carrito,Panier,yes
Checkout,Kasse,Pagar,Commander,yes
Acme Pro,,,,no
Add to Cart,In den Warenkorb,Añadir al carrito,Ajouter au panier,yes
Глосарій виконує дві функції одночасно. Для перекладних термінів він забезпечує одне затверджене відтворення. Для неперекладних термінів він діє як список, який не можна чіпати.
Сам формат майже не має значення. JSON, CSV, електронна таблиця або простий файл ключ-значення — усе це працює, оскільки цінність глосарію полягає не в його розширенні файлу, а в його ролі як узгодженого довідника. Важливо те, що він існує, що це єдина авторитетна копія, і що все, що перекладає ваші рядки, дійсно звертається до нього. Глосарій, що лежить на спільному диску і ніколи не читається процесом перекладу, — це просто документація. Глосарій, який конвеєр застосовує до кожного рядка, є гарантією якості.
Більшість команд починають створювати глосарій реактивно, після того, як перша непослідовність зганьбила їх у робочій версії. Кращий шлях — заповнити його перед першим етапом перекладу очевидними записами: назви ваших продуктів, двадцять найпоширеніших термінів інтерфейсу та будь-яка галузева термінологія, де неправильний вибір може заплутати клієнтів. Двадцять добре обраних записів запобігають переважній більшості збоїв у послідовності.
Два типи термінів, які порушуються без глосарію
Які терміни насправді потребують контролю за допомогою глосарію? Дві категорії, і вони зазнають невдачі в протилежних напрямках.
Брендові терміни, які ніколи не повинні перекладатися
Назви продуктів, брендові назви, назви функцій та торгові марки повинні проходити через переклад повністю незмінними. Коли Acme Pro стає Acme Profesional іспанською, або ваша функція доставки QuickShip перетворюється на EnvíoRápido, ви порушуєте впізнаваність бренду і, часто, ламаєте інтерфейс користувача, де цей точний рядок відповідає коду.
Це найпоширеніший і найшкідливіший збій глосарію. Машинний перекладач, залишений на самоті, послужливо перекладе Pro, Plus, Cloud та будь-яке інше слово, що виглядає як загальний іменник, оскільки він не має можливості знати, що ці слова є частиною бренду. Глосарій — це те, що наказує йому зупинитися.
Терміни, які повинні перекладатися послідовно
Протилежна проблема — ситуація з Warenkorb проти Einkaufswagen. Це реальні слова, які слід перекладати, але завжди однаковим чином. Словник інтерфейсу, такий як Cart, Checkout, Account, Wishlist, Order та Shipping, повинен відображатися на один фіксований цільовий термін на кожному екрані, в кожному електронному листі та на кожній кнопці. Небезпека тут не в неправильному перекладі, а в зміщенні: кожен окремо правильний вибір є нормальним у ізоляції, і лише непослідовність на всьому сайті є дефектом.
Це проблема ерозії довіри. Користувачі будують ментальну модель словника вашого інтерфейсу, проходячи через нього. Коли слово змінюється, модель руйнується, і когнітивне тертя реєструється як невиразне відчуття, що сайт низької якості, навіть якщо клієнт не може сформулювати чому.
Послідовність також має конкретну вартість використання, окрім відчуттів. Документація підтримки, підказки та електронні листи для нових користувачів — усі посилаються на терміни інтерфейсу. Якщо кнопка каже Warenkorb, а стаття довідки каже Einkaufswagen, заплутаний клієнт не може зіставити інструкцію з екраном. Непослідовна термінологія непомітно руйнує ваш власний контент підтримки. Глосарій — це те, що дозволяє продукту, документації та маркетинговим матеріалам буквально говорити однією мовою.
Чому розбиття великих файлів на частини викликає непослідовність
Ось механізм, який перетворює одноразову незручність глосарію на системну проблему на великих сайтах. Великий магазин WordPress або WooCommerce може мати файл .po з тисячами рядків, набагато більше, ніж будь-яка модель штучного інтелекту може перекласти за один запит. Тому файл розбивається на частини, і кожна частина перекладається окремо.
Проблема полягає в тому, що коли кожна частина перекладається ізольовано, механізм не пам'ятає, як він переклав термін три частини тому. Частина 1 може перекласти "Cart" як Warenkorb. Частина 7, оброблена як незалежний запит без спільного контексту, може так само обґрунтовано перекласти той самий "Cart" як Einkaufswagen. Жоден з варіантів сам по собі не є неправильним. Непослідовність є артефактом розбиття на частини, а не якогось одного невдалого рішення.
# Chunk 1 - header strings
msgid "Cart"
msgstr "Warenkorb"
# Chunk 7 - footer strings, translated in a separate request
msgid "View Cart"
msgstr "Einkaufswagen ansehen"
Чим більший файл, тим більше частин, і тим більше можливостей для розбіжності одного й того ж терміна. Саме тому переклад великих файлів складніший, ніж здається, ця тема докладно розглядається в how to translate large PO files. Наївне розбиття на частини обмінює повноту на послідовність, і в магазині з тисячами рядків ця "торгівля" проявляється скрізь.
Як вирішує проблему конвеєр, що враховує глосарій
Рішення полягає в конвеєрі перекладів, який виконує дві речі одночасно: він інтелектуально розбиває великі файли, щоб їх можна було обробити, і він переносить контекст глосарію та термінології через кожну частину, щоб розбиття ніколи не призводило до розбіжностей.
Ось тут Smart Batching і Context-Aware AI працюють у парі. Smart Batching ділить файл розміром понад 10 МБ на оброблювані частини, але ці частини не перекладаються як ізольовані елементи. Конвеєр забезпечує послідовність глосарію та термінології між частинами, так що коли "Cart" встановлено як Warenkorb, кожна наступна частина, що містить "Cart", отримує те саме відтворення. Глосарій заблокованих брендових термінів також подорожує з кожною частиною, тому Acme Pro залишається незмінним, незалежно від того, з'являється він у рядку номер 5 чи в рядку номер 5000.
Практичний результат полягає в тому, що файл магазину з 6000 рядків повертається з одним послідовним словником замість розрізненого. Брендові назви залишаються незмінними. Терміни інтерфейсу є однорідними. А заповнювачі всередині цих рядків, токени %s та {name}, залишаються зафіксованими на своїх місцях одночасно. Ви отримуєте файл, який виглядає так, ніби один уважний перекладач з ідеальною пам'яттю зробив всю роботу за один раз.
Порівняйте це з альтернативою, до якої вдається більшість людей: переклад файлу частинами, а потім ручний пошук і заміна для нормалізації термінів. Цей підхід зазнає невдачі з двох причин. По-перше, ви вже повинні знати кожен термін, який відхилився, що означає перегляд тисяч рядків для пошуку непослідовностей. По-друге, сліпий пошук і заміна є небезпечними, оскільки одне й те саме слово може бути правильним в одному контексті і неправильним в іншому. Застосування глосарію під час перекладу, поки механізм все ще має повний контекст кожного рядка, є принципово безпечнішим, ніж виправлення його після факту.
Глосарії в робочому процесі для декількох сайтів
Для агенцій, які займаються локалізацією багатьох клієнтських сайтів, дисципліна глосарію ускладнюється. Кожен клієнт має свої власні брендові терміни та свій затверджений словник, і повторне використання глосарію одного клієнта для іншого гарантовано призведе до незручностей. Повторюваний, керований глосарієм робочий процес — це те, що підтримує узгодженість десятка багатомовних сайтів без десятикратного ручного перегляду, що є основою ідеального робочого процесу локалізації для агенцій, що керують кількома клієнтськими сайтами. Глосарій стає активом для кожного клієнта, який подорожує з кожним файлом, який ви для них перекладаєте.
Послідовність термінології — це один із тих сигналів якості, який ніхто свідомо не помічає, коли він правильний, і кожен відчуває, коли він неправильний. Клієнт, який бачить Warenkorb на кожному екрані, ніколи не замислюється про це. Той, хто бачить три різні слова для кошика, також не подає скарги, він просто трохи менше довіряє сайту і трохи гірше конвертується. Глосарій, застосований до кожної частини кожного файлу, — це спосіб переконатися, що їм ніколи не доведеться про це думати.
Готові підтримувати послідовність кожного терміна у всьому вашому багатомовному магазині? Спробуйте SimplePoTranslate безкоштовно — кредитна картка не потрібна. Безкоштовний тариф забезпечує послідовність глосарію та термінології між частинами, тому "Cart" залишається одним словом, а назви ваших брендів залишаються незмінними від першого до останнього рядка.