Чуваки из OpenAI поставили две нейронные сетки на ринг и запрограммировали их на несколько простых правил борьбы сумо. В итоге ИИ научился без посторонней помощи хвататься, подныривать, притворяться, пинаться, ловить и накалывать оппонента, а также раздавать саечки за испуг, без какого-либо проектирования среды на эти навыки.
Следующая амбициозная задача для нейронных сеток — научить исследователей подбирать хороший саундтрек к демо-роликам.
Competitive Self-Play
We've found that self-play allows simulated AIs to discover physical skills like tackling, ducking, faking, kicking, catching, and diving for the ball, without explicitly designing an environment with these skills in mind.