es_ES vs es_MX, pt_PT vs pt_BR: Các biến thể khu vực của WordPress

Tháng trước, một chủ cửa hàng WooCommerce ở Barcelona đã hỏi chúng tôi một câu hỏi đi thẳng vào trọng tâm của vấn đề mà mọi chủ trang web đa ngôn ngữ cuối cùng đều phải đối mặt. Trang web của cô ấy vận chuyển đến Tây Ban Nha, Mexico và Argentina. Cô ấy đã dịch mọi thứ sang es_ES, ra mắt, và trong vòng một tuần, một khách hàng ở Thành phố Mexico đã phàn nàn rằng phần văn bản thanh toán nghe "kỳ lạ và hơi lỗi thời." Một tuần sau, một khách hàng khác chỉ ra rằng một mô tả sản phẩm chứa một từ hoàn toàn vô hại ở Tây Ban Nha nhưng lại thô tục ở Mexico. Câu hỏi của cô ấy là: "Tôi có thực sự cần các bản dịch riêng biệt cho mỗi quốc gia không?"
Câu trả lời ngắn gọn là đôi khi. Câu trả lời dài phụ thuộc vào những gì bạn đang bán, khách hàng của bạn ở đâu và bạn có thể duy trì bao nhiêu nội dung một cách thực tế. Hướng dẫn này sẽ đề cập đến khi nào các biến thể khu vực quan trọng, cách WordPress thực sự xử lý chúng đằng sau hậu trường và cách dịch chúng mà không làm tăng khối lượng công việc của bạn theo số lượng quốc gia bạn phục vụ.
Chúng tôi sẽ tập trung vào tiếng Tây Ban Nha và tiếng Bồ Đào Nha vì đây là hai họ ngôn ngữ mà sự phân tách biến thể gây ra nhiều vấn đề thực tế nhất. Tiếng Pháp, tiếng Anh và tiếng Ả Rập cũng có các biến thể khu vực, nhưng mức độ rủi ro thường thấp hơn.
Tại sao các biến thể khu vực lại quan trọng
Tiếng Tây Ban Nha là ngôn ngữ được nói nhiều thứ hai trên thế giới, nhưng coi "tiếng Tây Ban Nha" như một ngôn ngữ duy nhất là một sự đơn giản hóa. Một câu nghe tự nhiên ở Madrid có thể nghe cứng nhắc, trang trọng hoặc lỗi thời ở Buenos Aires. Một từ hoàn toàn phù hợp ở Thành phố Mexico có thể gây khó chịu ở Lima. Tiếng Bồ Đào Nha có sự phân chia thậm chí còn lớn hơn - khoảng cách về phát âm, ngữ pháp và từ vựng giữa pt_PT và pt_BR đủ rộng để nhiều nhà xuất bản coi chúng là những ngôn ngữ riêng biệt.
Những từ thực sự thay đổi
Một vài ví dụ cụ thể để vấn đề này không còn trừu tượng.
Động từ coger có nghĩa là "lấy" ở Tây Ban Nha và được sử dụng liên tục trong giao tiếp hàng ngày. Ở Mexico, Argentina và hầu hết Mỹ Latinh, đó là một động từ thô tục chỉ hành vi tình dục. Sử dụng nó trong văn bản thanh toán ("coger tu pedido") sẽ mang ý nghĩa rất khác ở Madrid so với ở Buenos Aires.
Ordenador là từ tiêu chuẩn để chỉ máy tính ở Tây Ban Nha. Ở Mỹ Latinh, hầu hết mọi người đều nói computadora. Cả hai đều không sai, nhưng việc trộn lẫn chúng cho độc giả biết rằng nội dung của bạn được dịch cho một thị trường khác.
Móvil (Tây Ban Nha) so với celular (Mỹ Latinh) cho điện thoại di động. Conducir (Tây Ban Nha) so với manejar (Mỹ Latinh) cho việc lái xe. Patata (Tây Ban Nha) so với papa (hầu hết Mỹ Latinh) cho khoai tây. Hàng tá từ ngữ như vậy thường xuyên có sự khác biệt.
Tiếng Bồ Đào Nha thậm chí còn bị chia rẽ nhiều hơn. Brazil sử dụng você cho "bạn" trong hầu hết các ngữ cảnh. Bồ Đào Nha sử dụng tu trong giao tiếp thân mật và você như một dấu hiệu trang trọng - gần giống với tín hiệu tầng lớp xã hội. Tiếng Bồ Đào Nha trong kinh doanh ở Lisbon và São Paulo là những phong cách giao tiếp khác nhau về mặt chức năng.
Chi phí kinh doanh khi bỏ qua các biến thể
Người dùng đưa ra phán đoán về sự tin cậy chỉ trong vài giây. Một người mua hàng ở Mexico đọc mô tả sản phẩm bằng tiếng Tây Ban Nha-Tây Ban Nha sẽ nhận thấy một trong hai điều: hoặc trang web không thực sự địa phương, hoặc thương hiệu không đủ quan tâm để bản địa hóa. Tỷ lệ chuyển đổi giảm. Tỷ lệ bỏ giỏ hàng tăng. Chi tiêu quảng cáo trả phí ở các nước LATAM mang lại lợi tức kém hơn vì các trang đích cảm thấy xa lạ.
Đối với các trang web nhiều nội dung, chi phí SEO cũng là một vấn đề thực tế. Google nhận diện các thẻ hreflang phân biệt es-ES với es-MX, và các truy vấn tìm kiếm cạnh tranh ở mỗi thị trường bị chi phối bởi nội dung được viết theo phương ngữ của khu vực đó. Một trang ropa interior bằng tiếng Tây Ban Nha-Tây Ban Nha sẽ không xếp hạng cạnh tranh với các đối thủ Mexico sử dụng thuật ngữ địa phương như ropa íntima.
Cách WordPress xử lý mã ngôn ngữ địa phương
Ngôn ngữ địa phương của WordPress tuân theo mẫu ll_CC - mã ngôn ngữ hai chữ cái, dấu gạch dưới, mã quốc gia hai chữ cái. Danh sách đầy đủ được định nghĩa trong nhân WordPress và ánh xạ tới các tệp dịch có tên theme-es_ES.mo, plugin-es_MX.mo, v.v.
Ngôn ngữ địa phương cốt lõi so với trang web so với người dùng
WordPress phân biệt ba cài đặt ngôn ngữ địa phương khác nhau:
- Ngôn ngữ trang web (
WPLANG/options.WPLANGtrong lịch sử, nay làoption:WPLANG): Mặc định cho giao diện người dùng của trang web bạn. - Ngôn ngữ địa phương người dùng (
wp_usermeta.locale): Tùy chọn riêng của từng người dùng cho bảng điều khiển quản trị. - Ngôn ngữ địa phương thời gian chạy: Có thể được lọc tại thời điểm yêu cầu bởi các plugin như Polylang hoặc WPML để phục vụ nội dung khác nhau cho mỗi tiền tố URL.
Nếu trang web của bạn là es_ES nhưng người dùng đặt hồ sơ của họ thành es_MX, giao diện quản trị sẽ hiển thị bằng tiếng Tây Ban Nha Mexico trong khi giao diện người dùng vẫn bằng tiếng Tây Ban Nha Tây Ban Nha. Điều này ổn cho giao diện người dùng quản trị nhưng không hữu ích cho việc cung cấp nội dung cho khách hàng - bạn cần chuyển đổi dựa trên URL hoặc tên miền.
Ví dụ về en_GB
Bản thân WordPress cung cấp các ngôn ngữ địa phương riêng biệt như en_US, en_GB, en_CA, en_AU và en_ZA. Chúng chia sẻ hầu hết nội dung nhưng khác nhau về chính tả (colour so với color, organise so với organize) và thành ngữ. Bạn có thể sử dụng điều này làm mẫu cho các biến thể tiếng Tây Ban Nha và tiếng Bồ Đào Nha - duy trì các tệp .mo riêng biệt cho mỗi khu vực, được phục vụ thông qua cấu trúc URL.
Cách đặt tên tệp MO cho các biến thể
Đối với một giao diện có tên mytheme và ba biến thể tiếng Tây Ban Nha:
wp-content/languages/themes/mytheme-es_ES.mo
wp-content/languages/themes/mytheme-es_MX.mo
wp-content/languages/themes/mytheme-es_AR.mo
WordPress chọn tệp khớp với ngôn ngữ địa phương đang hoạt động. Nếu es_AR được yêu cầu nhưng không có tệp nào tồn tại, nó sẽ mặc định quay về es_ES (khớp ngôn ngữ cơ sở) - đây chính xác là hành vi bạn muốn tránh đối với những từ chúng tôi đã liệt kê ở trên.
Các biến thể tiếng Tây Ban Nha trong thực tế
Hầu hết các nhà xuất bản nhắm mục tiêu một đến ba biến thể tiếng Tây Ban Nha. Dưới đây là cây quyết định thực tế.
Chỉ một biến thể
Cung cấp es_ES nếu cơ sở khách hàng của bạn chỉ ở Tây Ban Nha, hoặc es_MX / es (trung lập) nếu cơ sở khách hàng của bạn chủ yếu ở Mỹ Latinh. Sử dụng es làm ngôn ngữ địa phương báo hiệu tiếng Tây Ban Nha trung lập và tránh các đặc điểm khu vực của một trong hai thái cực.
Hai biến thể: Tây Ban Nha và Mỹ Latinh
Sự phân chia phổ biến nhất. Phục vụ es_ES cho Tây Ban Nha và một biến thể tiếng Mỹ Latinh (es_MX hoặc es đã được trung hòa) cho tất cả các quốc gia LATAM. Đây là giải pháp 80/20 - bạn nhận được hầu hết lợi ích bản địa hóa mà không phải duy trì 20 tệp riêng biệt.
Ba hoặc nhiều biến thể hơn
Nếu bạn đang vận hành một trang web thương mại điện tử lớn với doanh thu đáng kể ở Argentina, Mexico và Chile nói riêng, bạn có thể muốn es_AR, es_MX và es_CL ngoài es_ES. Chi phí dịch thuật tăng lên, nhưng tỷ lệ chuyển đổi trên mỗi thị trường cũng tăng theo.
Danh sách từ ngữ đặc trưng theo khu vực
Duy trì một bảng chú giải nhỏ cho mỗi biến thể. Ngay cả khi 95% nội dung dịch của bạn được chia sẻ, một bảng chú giải gồm 50-100 từ khác biệt có tần suất cao cũng sẽ giải quyết hầu hết các vấn đề về nhận thức rằng "nghe có vẻ sai". Để biết thêm về cách xử lý từ vựng chuyên ngành, hãy xem hướng dẫn toàn diện về bản địa hóa WordPress của chúng tôi.
Các biến thể tiếng Bồ Đào Nha (pt_PT so với pt_BR là một sự phân chia thực sự)
Hãy coi tiếng Bồ Đào Nha là hai ngôn ngữ, không phải hai biến thể. Tiếng Bồ Đào Nha Brazil (pt_BR) có 215 triệu người nói. Tiếng Bồ Đào Nha Châu Âu (pt_PT) có 10 triệu người nói. Ngữ pháp khác nhau. Chia động từ khác nhau. Đại từ khác nhau. Một câu được viết cho Lisbon sẽ cảm thấy hoàn toàn xa lạ ở São Paulo, và ngược lại.
Nếu bạn chỉ có thể chọn một, hãy chọn pt_BR - nó có cơ sở người nói lớn hơn và thị trường thương mại điện tử mạnh hơn. Nhưng đừng bao giờ cung cấp nội dung pt_PT cho người dùng Brazil hoặc ngược lại. Chi phí nhận thức là quá cao.
Khi nào bạn nên (và không nên) tạo một biến thể
Tạo một biến thể khu vực khi:
- Bạn có doanh thu hoặc lưu lượng truy cập có thể đo lường được từ khu vực đó (nguyên tắc chung: 10%+ tổng số).
- Danh mục sản phẩm của bạn có thuật ngữ đặc trưng theo khu vực (thời trang, thực phẩm, pháp lý, tài chính).
- Bạn chạy quảng cáo trả phí ở khu vực đó và muốn chất lượng trang đích phù hợp.
- Bạn đang làm SEO địa phương và cần nhắm mục tiêu hreflang.
Bỏ qua biến thể khi:
- Trang web của bạn chủ yếu là giao diện người dùng giao dịch với ít văn bản.
- Lưu lượng truy cập của bạn từ khu vực đó dưới 5% và bạn không thể duy trì các tệp bổ sung.
- Bạn đang ra mắt sản phẩm mới và có thể lặp lại dựa trên phản hồi thực tế của khách hàng sau này.
Một mẫu chống phổ biến: tạo 15 biến thể tiếng Tây Ban Nha "chỉ để an toàn" và sau đó để 12 trong số đó bị lạc hậu. Nội dung lỗi thời tệ hơn nội dung hơi lệch phương ngữ. Hãy cam kết duy trì những gì bạn cung cấp.
Quy trình dịch biến thể hiệu quả
Việc duy trì thủ công năm biến thể của một tệp .po gồm 2.000 chuỗi là một công thức dẫn đến sự lạc hậu. Quy trình làm việc có thể mở rộng:
1. Dịch biến thể chính thật tốt
Chọn biến thể có lưu lượng truy cập cao nhất của bạn (thường là es_ES hoặc es_MX cho tiếng Tây Ban Nha, pt_BR cho tiếng Bồ Đào Nha) và dịch biến thể đó một cách cẩn thận. Đây sẽ trở thành cơ sở của bạn.
2. Tự động tạo các biến thể khác
Tải tệp .po của biến thể chính lên SimplePoTranslate và yêu cầu dịch sang biến thể khác. Một công cụ dịch có nhận thức ngữ cảnh sẽ hiểu es_ES -> es_MX là một tác vụ "khu vực hóa" hơn là một bản dịch từ đầu. Các từ vựng quan trọng (coger -> tomar, ordenador -> computadora) sẽ được tự động hoán đổi trong khi các cụm từ giống hệt nhau vẫn giữ nguyên.
3. Áp dụng ghi đè bảng chú giải khu vực
Giữ một tệp bảng chú giải ngắn với các lựa chọn thuật ngữ đặc trưng theo khu vực của thương hiệu bạn. Áp dụng nó như một lần kiểm tra cuối cùng sau khi dịch bằng AI. Điều này sẽ khóa tên sản phẩm, thuật ngữ thương hiệu và từ vựng gây tranh cãi theo các lựa chọn ưu tiên của bạn cho mỗi khu vực.
4. Tạo tất cả các định dạng đầu ra
Các biến thể cần cả .po (để chỉnh sửa) và .mo (để WordPress thời gian chạy). SimplePoTranslate xuất cả hai trong một tệp ZIP duy nhất, cùng với các định dạng .json và .php nếu bạn cũng phục vụ mã PHP headless hoặc tùy chỉnh. Xem bài viết của chúng tôi về một tệp đầu vào, năm định dạng đầu ra để hiểu tại sao đầu ra đa định dạng lại quan trọng.
5. Triển khai theo ngôn ngữ địa phương
Tải các tệp .mo thu được lên wp-content/languages/themes/ với hậu tố ngôn ngữ địa phương chính xác. Thiết lập thẻ hreflang. Kiểm tra với người dùng thực ở mỗi khu vực nếu có thể - người bản xứ sẽ phát hiện ra những điều mà không công cụ nào có thể.
Tổng kết
Các biến thể khu vực không phải là một thứ "có thì tốt" đối với các trang web đa ngôn ngữ nghiêm túc - chúng là sự khác biệt giữa "đã dịch" và "đã bản địa hóa". Nhưng bạn cũng không cần phải cung cấp mọi biến thể có thể ngay từ ngày đầu tiên. Bắt đầu với một biến thể tiếng Tây Ban Nha và một biến thể tiếng Bồ Đào Nha phù hợp với thị trường lớn nhất của bạn. Thêm các biến thể khi lưu lượng truy cập và doanh thu của bạn ở mỗi khu vực biện minh cho chi phí duy trì.
Tin tốt là quy trình dịch thuật cho các biến thể nhanh hơn đáng kể so với việc xây dựng từng biến thể từ đầu. Chuyển đổi khu vực có sự hỗ trợ của AI mất một giờ cho mỗi biến thể thay vì hàng tuần. Phần khó là kỷ luật biên tập - chọn biến thể nào để duy trì và cam kết giữ chúng luôn mới.
Sẵn sàng dịch trang web WordPress của bạn sang nhiều biến thể tiếng Tây Ban Nha hoặc tiếng Bồ Đào Nha? Dùng thử SimplePoTranslate miễn phí - không yêu cầu thẻ tín dụng. Tải lên một lần, tạo các biến thể khu vực chỉ trong vài phút.