Rozbalovátko

Jak funguje strojové učení

Umělá inteligence, jak se často strojové učení označuje, funguje na principu analýzy velkého množství dat. Počítačové programy jsou sadou instrukcí, a podle těchto instrukcí zpracovávají dodaná data. Strojové učení je nový přístup k řešení problémů. Než aby programátor počítači napsal veškeré instrukce jednotlivě, tak naprogramuje způsob, kterým se počítač sám učí na dodaných „trénovacích“ datech. Napodobuje tak funkci lidského mozku, odkud ostatně pojem „neuronová síť“ pochází. V případě strojového překladu se neuronová síť trénuje na již přeložených větách textech, které jsou dostupné ve více překladech, jako třeba zákony, populární knihy nebo webové stránky.

Algoritmus strojového učení se obvykle učí na velké sadě „trénovacích“ dat, která jsou předem popsaná a klasifikovaná. Na základě toho se neuronová síť, složená s velkého množství malých jednoduchých podprogramů, naučí rozpoznávat určitá pravidla a vzorce. Aplikací těchto rozpoznaných pravidel pak dokáže posuzovat i zcela nová data.

Pravidla se ale neuronová síť neučí explicitně. Není to totiž klasický program, ale spíše velká skupina (síť) malých relativně jednoduchých programů (simulovaných neuronů). Každý neuron se samostatně učí rozpoznávat pravidla, a pokud tento neuron přispěl ke správnému řešení, dostane odměnu a jeho vazba bude posílena. Tím se může neuronová síť postupně zdokonalovat a dokonce se může i sama trénovat (tzv. unsupervised learning).

Schéma neuronové sítě

Schéma znázorňující jednoduchou neuronovou síť

Firma DeepL odvozuje svůj název od pojmu Deep Learning, tzv. hluboké učení. Jde o označení neuronových sítí s neurony uspořádanými do velkého množství vrstev. Svým způsobem tak jde o několik neuronových sítí poskládaných za sebe. Pokud síť dojde ke špatnému závěru (například něco špatně přeloží), dostane o této chybě informaci a „potrestá“ neurony, které se na chybě podílely, tím, že sníží jejich důležitost nebo změní jejich parametry. Výsledkem je postupné učení, které lze použít nejen na již známá data, ale i na úplně nová data, se kterými se síť nikdy nesetkala.

více informací