Bijvoorbeeld: in een fighting game zoals Tekken, Mortal Kombat of Streetfighter leert een agent dat een bepaalde attack (schoppen) negen op de tien keer veel damage doet. Dat zou kunnen wijzen op twee zaken:
- Die specifieke aanval is te sterk.
- De game AI is te zwak tegen de specifieke aanval
Door agents te trainen tegen het volledige raster van opponents kunnen zulke exploits automatisch worden gedecteerd. In de video hieronder wordt dit mooi geïllustreerd (vanaf minuut 13). Kijk ook verder voor de obstakels (en oplossingen) bij het gebruik van Reinforcement Learning.