DeepL vs Google Překladač vs AI: Nejlepší pro soubory .po?

Exportujete soubor .pot ze svého WordPress pluginu, vložíte několik stovek řetězců do DeepL nebo Google Překladače, dostanete zpět úhledný německý sloupec, vložíte jej do souboru .po, zkompilujete a nasadíte. Pak uživatel nahlásí, že na stránce košíku je zobrazen nezpracovaný %1$s tam, kde by měl být název produktu, nebo hůře, řádek s cenou ve všech jazycích zní You have 1 items, protože se zhroutila plurálová forma. Kvalita překladu byla v pořádku. Struktura překladu byla zničena.
To je ústřední napětí v debatě DeepL vs Google Překladač, když je zdrojem soubor gettext .po namísto odstavce prózy. Oba jsou světovou špičkou v překladu přirozených vět. Žádný z nich nebyl navržen tak, aby respektoval zástupný symbol printf, plurálové pole Gettext nebo disambiguaci msgctxt. S %1$s zachází jako s překlepem k opravě a se dvouformovým plurálem jako s jednou větou k zploštění. Pro marketingové texty je to neviditelné. Pro lokalizaci softwaru to narušuje funkčnost webů.
Tento příspěvek srovnává klasický strojový překlad – DeepL a Google Překladač – s AI pipeline citlivou na kontext, vytvořenou speciálně pro gettext. Podíváme se na aspekty, které jsou pro soubory .po skutečně důležité: zpracování zástupných symbolů, plurálové formy, kontext, podpora hromadných souborů a náklady. Pokud vás zajímá hlubší diskuse o kvalitě LLM versus LLM, tu jsme probrali v Kvalita AI překladu: Gemini vs GPT-4 vs DeepSeek. Zde je otázka užší a praktičtější: co je nejlepší pro soubory .po?
DeepL vs Google Překladač: Pro co byly navrženy
Oba jsou univerzálními nástroji pro strojový překlad, optimalizovanými pro plynulý výstup v přirozeném jazyce. Ani jeden neparsuje formáty souborů.
DeepL – plynulé, ale slepé k formátu
DeepL je široce chválen pro nejpřirozeněji znějící výstup, zejména napříč evropskými jazyky. Ale zpracovává text, ne strukturu. Pokud mu předložíte msgid ze souboru .po obsahující %1$s ordered %2$s, přeloží slova kolem zástupných symbolů, přičemž často přeskupuje, přidává mezery nebo vynechává tokeny – protože pro DeepL jsou to jen zvláštní znaky ve větě.
Google Překladač – Široké pokrytí, stejná slepá skvrna
Google Překladač podporuje mnohem více jazyků a je výchozím levným řešením pro pluginy jako GTranslate. Jeho zpracování zástupných symbolů není o nic lepší. Oba motory sdílejí stejné zásadní omezení: optimalizují plynulost vět a nemají model pravidel gettextu.
Skutečná otázka není kvalita – je to struktura
Pro soubory .po je čistá jazyková kvalita základ. Věc, která narušuje produkci, je strukturální integrita: přežijí proměnné, zůstanou plurály v multi-formě, je respektován kontext. Právě v tom gettext-aware AI pipeline předbíhá DeepL i Google Překladač.
Proč zástupné symboly a plurály narušují strojový překlad
Soubor .po není próza. Je to text s přísnými pravidly, který sousedí s kódem, a tři z těchto pravidel rutinně porážejí klasický strojový překlad.
Poškozování zástupných symbolů a proměnných
Řetězce ve WordPressu jsou plné zástupných symbolů ve stylu printf: %s, %d a pozičních forem jako %1$s a %2$s. Poziční jsou důležité, protože některé jazyky přeskupují věty a čísla říkají sprintf, který argument kam patří. Podívejte se, co s tím klasický strojový překlad udělá:
// Source string in your .po file
$msg = sprintf( __( '%1$s left a comment on %2$s', 'mytheme' ), $user, $post );
// What DeepL / Google Translate often return (German):
// "%2$s hat einen Kommentar zu %1$s hinterlassen" <- reordered, OK
// "% 1$ s hat einen Kommentar..." <- spaces injected, BROKEN
// "hat einen Kommentar hinterlassen" <- placeholders dropped, BROKEN
Jediná vložená mezera (% 1$ s) nebo vynechaný token vyhodí PHP varování nebo vytiskne syrový kód vašim uživatelům. Do hloubky se tomuto režimu selhání věnujeme v článku Jak překládat soubory PO bez narušení kódových proměnných.
Kolaps plurálových forem
Plurály v Gettextu nejsou jeden řetězec – jsou to pole indexované podle pravidla plurálu daného jazyka. Angličtina má dvě formy; polština má tři; arabština má šest. Klasický strojový překlad obdrží msgid_plural jako dvě samostatné věty a přeloží je nezávisle, bez povědomí o tom, že musí zůstat koherentní vícefázovou sadou. Výsledkem je často duplikovaná jediná forma, takže 1 item a 5 items se zobrazí shodně.
msgid "%d item in your cart"
msgid_plural "%d items in your cart"
msgstr[0] ""
msgstr[1] ""
# A gettext-aware pipeline fills BOTH forms correctly with %d preserved.
# DeepL/Google translate each line in isolation and lose the plural relationship.
Kontext (msgctxt) je ignorován
Gettext používá msgctxt k rozlišení stejných řetězců – „Příspěvek“ jako podstatné jméno versus „Zveřejnit“ jako sloveso, nebo „Objednávka“ jako podstatné jméno versus sloveso ve WooCommerce. Klasický strojový překlad toto kontextové pole nikdy nevidí, takže hádá, a hádá vždy stejně, bez ohledu na to, kde se řetězec objeví.
Poškození se v obchodu sčítá. Katalog WooCommerce je plný krátkých, nejednoznačných řetězců – „Order“, „Ship“, „Free“, „View“ – kde špatný výklad vytvoří tlačítko, které říká špatnou věc v jazyce zákazníka. Jelikož DeepL a Google Překladač překládají každý řetězec izolovaně, nemohou použít okolní kontext, který gettext záměrně kóduje. Pipeline citlivá na formát, která čte msgctxt, řeší přesně tyto nejednoznačnosti, a proto je to nejdůležitější na stránkách obchodu, kde chybné překlady stojí reálné prodeje.
Přístup AI citlivé na kontext pro soubory .po
Účelově navržená gettext pipeline nepřekládá jen slova – rozumí formátu souboru a chrání jeho strukturu. To je rozdíl na úrovni kategorie, a proto správné srovnání vůbec není DeepL vs Google Překladač, ale klasický strojový překlad versus pracovní postup AI citlivý na formát.
Zamykání syntaxe chrání každý token
Rozhodující technikou je Syntax Locking (Uzamykání syntaxe). Než se jakýkoli text dostane k AI, každá proměnná (%s, %1$s, {name}), HTML tag a kódový token je uzamčen a odložen stranou. Model vidí a přepisuje pouze lidsky čitelná slova. Po překladu jsou uzamčené tokeny obnoveny na svá správná místa. K poškození % 1$ s jednoduše nemůže dojít, protože AI se zástupného symbolu vůbec nedotkne. Toto je bezpečnostní síť, která klasickému strojovému překladu strukturálně chybí – bod, který podrobněji rozvádíme v Manuální vs. AI překlad: je AI bezpečná pro lokalizaci WordPressu.
Plná podpora plurálů a kontextu
Gettext-aware pipeline čte msgid_plural jako sadu a generuje všechny požadované formy pro pravidlo plurálu cílového jazyka, přičemž zástupné symboly zůstávají neporušené ve všech formách. Také čte msgctxt a používá jej jako kontext, takže „Objednávka“ (podstatné jméno) a „Objednat“ (sloveso) jsou přeloženy odlišně a správně.
Hromadné soubory, ne kopírování a vkládání
DeepL a Google Překladač jsou nástroje pro vkládání textu do pole (nebo API na bázi znaků). Cloudový .po pracovní postup zpracuje celý soubor – a se Smart Batching jsou balíčky řetězců WooCommerce o velikosti 10MB+ rozděleny, paralelně přeloženy a sloučeny, tam kde přístup kopírování a vkládání selhává mnohem dříve. Nahrajete soubor a stáhnete .po + .mo + další, namísto ručního spojování sloupců.
DeepL vs Google Překladač vs Gettext-Aware AI: Verdikt
Pro prostou prózu jsou DeepL a Google Překladač vynikající. Pro soubory .po jsou osami, které rozhodují o bezpečnosti produkce, zástupné symboly, plurály, kontext a hromadné zpracování – a právě tam vyhrává pipeline citlivá na formát.
Srovnávací tabulka
| Schopnost | DeepL | Google Překladač | Gettext-Aware AI |
|---|---|---|---|
| Plynulost přirozeného jazyka | Vynikající | Velmi dobrá | Velmi dobrá |
Bezpečnost %1$s / zástupných symbolů | Riziková | Riziková | Uzamčeno (Syntax Locking) |
| Gettext plurálové formy | Zplošťuje | Zplošťuje | Plná podpora pro každou lokalitu |
msgctxt kontext | Ignorováno | Ignorováno | Použito |
Vstup hromadných .po souborů | Ruční vkládání | Ruční vkládání | Nahrání celého souboru |
| Velké balíčky WooCommerce | Selhává | Selhává | Smart Batching |
| Výstupní formáty | Pouze text | Pouze text | .po + .mo + .json + .php + .xliff |
Jak si vybrat
Pokud překládáte blogový příspěvek nebo marketingovou stránku, sáhněte po DeepL pro tón. Pokud překládáte soubor .po nebo .pot určený pro živý WordPress web, plynulost není rozhodujícím faktorem – je jím strukturální integrita. Gettext-aware AI pipeline vám poskytne obojí: silnou lingvistickou kvalitu i zástupné symboly, plurály a kontext, které přežijí neporušené až do zkompilovaného .mo souboru.
Existují také náklady na pracovní postup, které tabulka podceňuje. Projít celý plugin přes DeepL nebo Google Překladač znamená kopírovat sloupce řetězců do pole, vkládat výsledky zpět a ručně znovu kontrolovat každý zástupný symbol – což je únavný proces náchylný k chybám, který se zhoršuje s každým dalším jazykem. Pipeline založená na souborech to zredukuje na jedno nahrání a stažení a vrátí nejen .po, ale i zkompilovaný .mo a další formáty v jednom ZIPu, takže soubor, který dodáte, je soubor, který vytvořila AI – bez ručního opětovného sestavování, kde se vloudí nové chyby.
Závěr
Upřímná odpověď na otázku DeepL vs Google Překladač pro soubory .po je, že se ptáte na špatné kandidáty. Oba jsou vynikajícími překladači prózy a oba jsou strukturálně slepí vůči gettextu – poškozují %1$s, zplošťují plurály a ignorují msgctxt, protože nikdy nebyly vytvořeny k čtení překladového souboru. Pro lokalizaci softwaru je to rozdíl mezi čistým vydáním a rozbitou stránkou košíku.
AI pipeline citlivá na kontext s funkcí Syntax Locking mění srovnání zcela. Odpovídá plynulosti, kterou očekáváte od DeepL nebo Google Překladače, a zároveň zaručuje, že každá proměnná, plurálová forma a kontextová poznámka dorazí neporušená – takže váš přeložený web funguje, nejen že se dobře čte.
Chcete překládat soubory
.pobez poškozených zástupných symbolů nebo zhroucených plurálů? Vyzkoušejte SimplePoTranslate zdarma – není vyžadována kreditní karta. Nahrajte své.po,.pot,.jsonnebo.xliffa získejte gettext-bezpečné AI překlady v bezplatné úrovni.