Роботы-футболисты играют в жизнь

27.11.2001, ВТ, 20:58, Мск

Д-р Таккер Боч (Tucker Balch) – весьма необычный футбольный тренер. Он редко подбадривает игроков, стоя за боковой линией, и никогда не злится на них. Д-р Боч не потрясает в воздухе кулаками, наставляя футболистов: все, что от него требуется, - это склон Роботы, участвующие в экспериментах д-ра Боча, не более чем несколько строчек программного кода, постепенно изучающие искусство футбольной игры на экране монитора. Это всего лишь компьютерные имитации реальных роботов, сконструированных д-ром Бочем – машин размером с коробку из-под обуви, участников футбольных состязаний. Ученый планирует в будущем воспроизвести свои компьютерные эксперименты на реальных роботах, что, по его словам, позволит максимально приблизить его поиски к условиям социальных реалий.

В компьютерной имитации роботы учатся играть в футбол путем выполнения случайной последовательности основных движений – они ведут мяч, бегут за ним, бьют по нему, перехватывают. За каждую последовательность действий программа либо награждает, либо наказывает робота, посылая ему цифровой сигнал, сообщающий, удались ли «атака» или же ее надо повторить.


Д-р Таккер Боч проводит эксперименты с роботами-футболистами	Робот-нападающий с мячом

Д-р Боч разделяет роботов на две команды, представленные кружками на экране монитора. Роботы из контрольной группы могут передавать мяч, защищаться и атаковать с момента начального свистка, в процессе развертывания игры они должны учиться на своих промахах и переигрывать неудачные моменты. Как оказалось, контрольная выборка роботов ведет себя по-разному в зависимости от того, награждается ли вся команда вместе либо ее игроки по отдельности.

По первому сценарию, поощрительный сигнал посылается только тому роботу, который забил гол. В продолжение матча каждый командный игрок действует по единой схеме поведения – устремляется за мячом в едином порыве забить мяч. В результате кружки на экране монитора скапливаются вокруг единой точки – мяча, оставляя все остальные участки поля открытыми для атаки.

По другой схеме награждается вся команда, если кто-то из ее членов забивает гол. После нескольких тренировочных циклов некоторые роботы начинают действовать исключительно как защитники, другие же рвутся в форварды. «Коллективное поощрение порождает разные линия поведения, - отметил д-р Боч, - и это приносит команде победу».

Результаты такого рода наблюдений могут удивить тех, кто верит в силу индивидуального поощрения как в основу капитализма, порождающую многообразие идей, точек зрения, целей и методов их достижения. Д-р Боч пока не спешит переносить свои выводы на человеческое общество, так как, по его словам, нельзя не учитывать всю сложность и многообразность человеческой натуры, а также такие факторы, как мотивация и зависть, которые невозможно воспроизвести в системах искусственного интеллекта. Однако, заявляет ученый, его эксперименты показывают, что изучение роботов может служить окном в мир понимания поведения человека. «Роботы могут учиться и планировать, и общаться между собою, - отметил д-р Боч. – Они, вероятно, представляют собой наилучшую на сегодняшний день модель для проведения контрольных экспериментов над социальными системами».