WordPress 번역 용어집 및 용어 일관성

WooCommerce 스토어의 독일어 버전을 열고 'Cart'라는 단어가 인터페이스를 통해 어떻게 이동하는지 살펴보세요. 헤더 버튼에는 Warenkorb라고 쓰여 있고, 결제 페이지에는 Einkaufswagen, 확인 이메일에는 Korb라고 쓰여 있습니다. 이 세 단어 모두 기술적으로 장바구니를 의미하는 유효한 독일어이며, 파일별로 작업하는 번역가는 이 중 어떤 단어라도 사용할 수 있습니다. 하지만 사이트를 이용하는 고객은 세 가지 동의어를 보는 것이 아닙니다. 그들은 자체 어휘를 일관성 있게 유지하지 못하는 사이트를 보게 되고, 전자상거래 사이트에서는 신용카드 정보를 요청하는 바로 그 순간에 그러한 불일치가 부주의함으로 비쳐집니다.
이것이 바로 번역 용어집이 해결하는 문제입니다. 때로는 용어 데이터베이스(termbase)라고도 불리는 용어집은 특정 용어가 각 언어로 어떻게 렌더링되어야 하는지, 어떤 용어는 절대 번역되어서는 안 되는지, 그리고 어떤 용어는 매번 동일하게 번역되어야 하는지에 대한 신뢰할 수 있는 목록입니다. 이 가이드에서는 용어집 개념, 가장 중요한 두 가지 용어 범주, 대용량 파일을 청크로 분할하는 것이 어떻게 조용히 일관성을 파괴하는지, 그리고 청크 전반에 걸쳐 용어집을 유지하는 번역 파이프라인이 이를 어떻게 해결하는지 설명합니다.
번역 용어집이란 무엇인가
번역 용어집은 원본 용어를 승인된 번역에 구조화하여 매핑한 것으로, 언어별로 관리됩니다. 가장 간단하게는 원본 용어, 필요한 대상 용어, 그리고 잠금(locked) 또는 번역 가능(translatable) 여부에 대한 주석이 있는 표 형태입니다. 번역가와 번역 엔진은 이를 단일 진실 공급원(single source of truth)으로 참조하여 동일한 개념이 두 가지 다른 방식으로 렌더링되지 않도록 합니다.
작은 용어집 조각은 JSON으로 다음과 같이 보일 수 있습니다:
{
"en": "Cart",
"translations": {
"de": "Warenkorb",
"es": "Carrito",
"fr": "Panier"
},
"translatable": true
},
{
"en": "Acme Pro",
"translations": {},
"translatable": false,
"note": "Brand product name. Never translate."
}
또는 팀에서 평면 스프레드시트를 선호하는 경우, 동일한 데이터가 CSV로 다음과 같이 표시됩니다:
source,de,es,fr,translatable
Cart,Warenkorb,Carrito,Panier,yes
Checkout,Kasse,Pagar,Commander,yes
Acme Pro,,,,no
Add to Cart,In den Warenkorb,Añadir al carrito,Ajouter au panier,yes
용어집은 두 가지 작업을 동시에 수행합니다. 번역 가능한 용어에 대해서는 하나의 승인된 렌더링을 강제합니다. 번역 불가능한 용어에 대해서는 손대지 말아야 할 목록 역할을 합니다.
형식 자체는 거의 중요하지 않습니다. JSON, CSV, 스프레드시트 또는 간단한 키-값 파일 모두 작동합니다. 왜냐하면 용어집의 가치는 파일 확장자에 있는 것이 아니라 합의된 참조로서의 역할에 있기 때문입니다. 중요한 것은 용어집이 존재하고, 유일하게 신뢰할 수 있는 사본이며, 문자열을 번역하는 모든 것이 실제로 용어집을 참조한다는 것입니다. 번역 프로세스가 결코 읽지 않는 공유 드라이브에 있는 용어집은 단지 문서일 뿐입니다. 파이프라인이 모든 문자열에 강제하는 용어집은 품질 보증입니다.
대부분의 팀은 첫 번째 불일치로 인해 운영 중에 난처함을 겪은 후에야 용어집을 사후적으로 시작합니다. 더 나은 방법은 첫 번역 패스 이전에 명확한 항목(제품 이름, 상위 20개 인터페이스 용어, 잘못 선택하면 고객을 혼란시킬 수 있는 모든 산업별 용어)으로 용어집을 시드하는 것입니다. 20개의 잘 선택된 항목만으로도 대다수의 일관성 실패를 방지할 수 있습니다.
용어집 없이는 깨지는 두 가지 유형의 용어
어떤 용어가 실제로 용어집 관리가 필요한가요? 두 가지 범주가 있으며, 서로 반대 방향으로 실패합니다.
절대 번역되어서는 안 되는 브랜드 용어
제품 이름, 브랜드 이름, 기능 이름 및 상표는 번역 과정에서 완전히 변경되지 않고 유지되어야 합니다. Acme Pro가 스페인어로 Acme Profesional이 되거나, QuickShip 배송 기능이 EnvíoRápido로 바뀌면 브랜드 인지도가 손상되고, 종종 해당 정확한 문자열이 코드에서 일치하는 UI가 손상됩니다.
이는 가장 흔하고 가장 치명적인 용어집 실패입니다. 기계 번역기는 자체적으로 작동할 경우 Pro, Plus, Cloud 및 일반 명사처럼 보이는 다른 모든 단어를 친절하게 번역할 것입니다. 왜냐하면 기계는 이러한 단어가 브랜드의 일부인지 알 방법이 없기 때문입니다. 용어집이 바로 번역을 멈추라고 지시하는 것입니다.
일관성 있게 번역되어야 하는 용어
반대 문제는 Warenkorb 대 Einkaufswagen 상황입니다. 이들은 번역되어야 할 실제 단어이지만, 항상 동일한 방식으로 번역되어야 합니다. Cart, Checkout, Account, Wishlist, Order, Shipping과 같은 인터페이스 용어는 모든 화면, 이메일, 버튼에서 하나의 고정된 대상 용어에 매핑되어야 합니다. 여기서의 위험은 오역이 아니라 이탈(drift)입니다. 각 개별적으로 올바른 선택은 개별적으로는 괜찮지만, 전체 사이트 전반의 불일치만이 결함입니다.
이것이 바로 신뢰도 침식 문제입니다. 사용자는 인터페이스를 탐색하면서 인터페이스 어휘에 대한 정신적 모델을 구축합니다. 단어가 바뀌면 모델이 깨지고, 고객이 이유를 명확히 설명할 수 없을 때에도 인지 부하는 사이트 품질이 낮다는 모호한 느낌으로 등록됩니다.
일관성은 느낌을 넘어선 구체적인 사용성 비용도 발생시킵니다. 지원 문서, 툴팁 및 온보딩 이메일은 모두 인터페이스 용어를 참조합니다. 버튼에 Warenkorb라고 쓰여 있는데 도움말 문서에는 Einkaufswagen이라고 쓰여 있다면, 혼란스러운 고객은 지침을 화면에 매핑할 수 없습니다. 일관성 없는 용어 사용은 조용히 자체 지원 콘텐츠를 무너뜨립니다. 용어집은 제품, 문서, 마케팅 문구가 모두 말 그대로 동일한 언어를 사용하도록 유지하는 역할을 합니다.
대용량 파일 청크 분할이 불일치를 유발하는 이유
여기, 한 번의 용어집 문제가 대규모 사이트에서 시스템적 문제로 변하는 메커니즘이 있습니다. 대규모 WordPress 또는 WooCommerce 스토어는 수천 개의 문자열을 가진 .po 파일을 가질 수 있으며, 이는 어떤 AI 모델도 단일 요청으로 번역할 수 있는 것보다 훨씬 많습니다. 따라서 파일은 청크로 분할되고, 각 청크는 개별적으로 번역됩니다.
문제는 각 청크가 독립적으로 번역될 때, 엔진은 세 청크 전에 용어를 어떻게 렌더링했는지 기억하지 못한다는 것입니다. 청크 1은 'Cart'를 Warenkorb로 번역할 수 있습니다. 공유 컨텍스트 없이 독립적인 요청으로 처리된 청크 7은 동일한 'Cart'를 Einkaufswagen으로 똑같이 합리적으로 번역할 수 있습니다. 둘 다 그 자체로는 틀리지 않습니다. 불일치는 청크 분할의 산물이지, 단일 잘못된 결정의 결과가 아닙니다.
# Chunk 1 - header strings
msgid "Cart"
msgstr "Warenkorb"
# Chunk 7 - footer strings, translated in a separate request
msgid "View Cart"
msgstr "Einkaufswagen ansehen"
파일이 클수록 더 많은 청크가 생기고, 동일한 용어가 발산될 기회가 더 많아집니다. 이것이 바로 대용량 파일 번역이 보기보다 어려운 이유이며, 이에 대해서는 대용량 PO 파일 번역 방법에서 자세히 다루고 있습니다. 순진한 청크 분할은 일관성을 위해 완전성을 희생하며, 수천 개의 문자열이 있는 스토어에서는 그러한 희생이 곳곳에서 나타납니다.
용어집 인식 파이프라인이 이를 해결하는 방법
해결책은 두 가지를 동시에 수행하는 번역 파이프라인입니다. 즉, 대용량 파일을 지능적으로 분할하여 처리할 수 있도록 하고, 모든 청크에 걸쳐 용어집 및 용어 컨텍스트를 전달하여 분할로 인한 이탈이 발생하지 않도록 합니다.
여기서 **스마트 배치(Smart Batching)**와 **컨텍스트 인식 AI(Context-Aware AI)**가 짝을 이루어 작동합니다. 스마트 배치는 10MB 이상의 파일을 처리 가능한 청크로 분할하지만, 이 청크들은 독립적인 개체로 번역되지 않습니다. 파이프라인은 청크 전반에 걸쳐 용어집 및 용어 일관성을 강제하여, 'Cart'가 Warenkorb로 확립되면 'Cart'를 포함하는 모든 후속 청크도 동일한 렌더링을 얻게 됩니다. 잠금된 브랜드 용어 용어집도 모든 청크와 함께 이동하므로, Acme Pro는 문자열 번호 5에 나타나든 5,000에 나타나든 손상되지 않고 유지됩니다.
실질적인 결과는 6,000개 문자열의 스토어 파일이 누더기처럼 여러 용어가 섞인 것이 아니라 하나의 일관된 어휘로 돌아온다는 것입니다. 브랜드 이름은 손상되지 않고, 인터페이스 용어는 균일합니다. 그리고 해당 문자열 내부의 %s 및 {name} 토큰과 같은 자리 표시자도 동시에 제자리에 고정됩니다. 완벽한 기억력을 가진 한 명의 신중한 번역가가 전체 작업을 한 번에 수행한 것처럼 읽히는 파일을 얻게 됩니다.
대부분의 사람들이 의존하는 대안과 대조해 보세요. 파일을 부분적으로 번역한 다음, 수동으로 찾기 및 바꾸기 과정을 거쳐 용어를 정규화하는 것입니다. 이 접근 방식은 두 가지 이유로 실패합니다. 첫째, 이미 이탈된 모든 용어를 알아야 하는데, 이는 애초에 불일치를 찾기 위해 수천 개의 문자열을 검토해야 한다는 의미입니다. 둘째, 맹목적인 찾기 및 바꾸기는 위험합니다. 왜냐하면 동일한 단어가 한 컨텍스트에서는 올바르지만 다른 컨텍스트에서는 틀릴 수 있기 때문입니다. 엔진이 각 문자열의 전체 컨텍스트를 가지고 있는 동안 번역 중에 용어집을 강제하는 것이 사후에 수정하는 것보다 근본적으로 더 안전합니다.
다중 사이트 워크플로우에서의 용어집
여러 클라이언트 사이트에서 현지화를 수행하는 에이전시의 경우, 용어집 규율은 더욱 중요해집니다. 각 클라이언트는 고유한 브랜드 용어와 승인된 어휘를 가지고 있으며, 한 클라이언트의 용어집을 다른 클라이언트에 재사용하는 것은 확실히 난처한 상황을 초래합니다. 반복 가능하고 용어집 중심의 워크플로우는 수십 개의 다국어 사이트를 수십 배의 수동 검토 없이 일관성 있게 유지하는 방법이며, 이는 여러 클라이언트 사이트를 관리하는 에이전시를 위한 이상적인 현지화 워크플로우의 핵심입니다. 용어집은 각 클라이언트별 자산이 되어 클라이언트를 위해 번역하는 모든 파일과 함께 이동합니다.
용어 일관성은 옳을 때는 아무도 의식적으로 알아차리지 못하지만, 잘못되었을 때는 모두가 느끼는 품질 신호 중 하나입니다. 모든 화면에서 Warenkorb를 읽는 고객은 이에 대해 전혀 생각하지 않습니다. 장바구니에 대한 세 가지 다른 단어를 보는 고객도 불평하지 않습니다. 그들은 단지 사이트를 조금 덜 신뢰하고 전환율도 조금 낮아질 뿐입니다. 모든 파일의 모든 청크에 걸쳐 강제되는 용어집은 고객이 결코 그럴 필요가 없도록 보장하는 방법입니다.
전체 다국어 스토어에서 모든 용어를 일관성 있게 유지할 준비가 되셨나요? SimplePoTranslate를 무료로 사용해 보세요 — 신용 카드 정보는 필요 없습니다. 무료 티어는 청크 전반에 걸쳐 용어집 및 용어 일관성을 강제하므로, 'Cart'는 하나의 단어로 유지되고 브랜드 이름은 첫 번째 문자열부터 마지막 문자열까지 손상되지 않습니다.