Myšlenka Machine translation, tedy strojového překladu, je stará přes šedesát let. Po druhé světové válce, kdy byl na světě již první počítač, jehož chlazení zajišťovaly dva letecké motory, byl jedním z nápadů, jak jej využít, právě překlad cizích jazyků. Mělo to být jednoduché, ale ukázalo, že to byl mylný předpoklad. I v 21. století mají strojové překladače k dokonalosti hodně daleko. Některé perly jsou shromážděny na stránkách Centra zpracování přirozeného jazyka MU: Osobní převzetí není možné, pouze v případě objednání montáže volat předem pro stanovení ceny (překlad: Pokud si přejete namontovat volata, budeme příst, abychom stanovili cenu), O hotovostní zálohy si prosím pište nejpozději do pátku (překlad: prosím nejpozději do pátku a u toho pištím).
Čtěte také:
Jak si zlepšit angličtinu díky Facebooku?
Kdy se internet stává pastí pro děti a teenagery?
Co je to malá a velká korupce a jak je na tom s korupcí Česko?
85 procent
Dnes se k překládání, které známe ze stolních počítačů, používají tzv. překladové paměti. Právě ty používají překladatelské firmy, když se snaží převést věty z jednoho do dalšího cizího jazyka. V těchto pamětech jsou tisíce přeložených a upravených výrazů, vět a větných spojení. Tyto součásti nebo různé seskupení vět byly schvalovány právě pro použití ve strojových pamětech tedy tak, aby je bylo možné použít pro automatické překládání a vyhledávání v jiném jazyce. Jejich významy se tedy v překladech shodují a k přesnému překladu dochází asi v 85 procentech překladů. Ve zbylých případech z překladače vyleze z nejrůznějších důvodů nesmysl, nebo nepřesnost. Nyní by ale tyto překladové paměti měly fungovat lépe.
Pozná jednotlivé část vět
Podle odborníků z Masarykovy univerzity vyhledávají dnešní překladové systém ve svých databázích totožné věty nebo její části, pracují ale s řetězci, to znamená s více výrazy najednou. V Brně na to ale šli jinak. Jejich software umí rozeznat strukturu textu, pozná sloveso, podmět, frázi a dokonce rozpozná i vazby mezi nimi. To je pro správné pochopení a překlad nejdůležitější. Poté program nabídne překlady těchto celků. Ty pak rozšíří stávající překladovou paměť, a tím zvýší její účinnost. Obohacená databáze se vytvoří pro každý nový dokument, takže „překladová zásoba“ slov, vět, souvětí a jejich nejrůznějších variant se bude rychle zvyšovat. Nemělo by tedy už docházet k tomu, abyste na monitoru viděli mimochod (mimochodem), příst vši (především), knednout (knedlo vepřo), buřtgulat (buřtguláš), jíst dralo (do očí se jí draly slzy), jíst berma (tak jí berem), topit box (set top box) a podobně. Naopak s chybami technické povahy, jako je špatný překlad české diakritiky, nebo špatný font, se asi jen tak nerozloučíme: čekejte prosím! (hekejte prosmm!).
Bude gratis
O této myšlence začali brněnští informatici přemýšlet asi před třemi roky. Bližší pohled pak ukázal, že jejich nápad má smysl. I když se může zdát dvouprocentní vylepšení překladové paměti proti používané databázi málo, pro překladatelské firmy to může znamenat až milionovou roční úsporu nákladů. Podle zdrojů z Masarykovy univerzity si badatelé požádali o grant na výzkum a další rozvoj systému. Předtím ale potřebovali své původní odhady zpřesnit. Nakonec tedy možnosti zvýšení výtěžnosti překladových pamětí odhadl dokonce na pět procent. V blízké budoucnosti ale výzkumníci očekávají až o pětinu větší množství přeloženého textu s dodržením vysoké kvality překladu. Dobrou zprávou určitě je, že software by měl být po svém dokončení volně přístupný.