Стратегия выживания в социуме
Эти знания помогут в будущем лучше понять и объяснить закономерности эволюции культуры человеческой цивилизации.
В своей работе ученые под руководством эволюционного биолога Кевина Лаландна (Kevin Laland) из Университета города Сент-Эндрюс в Великобритании разработали среду, имитирующую попадание группы незнакомых и не имеющих родственных связей людей на необитаемый остров, где им необходимо выжить, научившись использовать его природные ресурсы. Для этого индивидуумам, согласно программе, необходимо было совершать три типа действий: наблюдение за тем, как окружающие добывают ресурсы, разработку собственного, потенциально более эффективного, метода добычи ресурсов и собственно действий по добыче этих ресурсов, единственного из этих трех, которое приносило участникам выгоду.
При этом, согласно программе, внешние условия в этой среде постоянно меняются, а некоторые типы действий со временем становятся не так эффективны, как прежде, или наоборот. Разработчики этой среды предложили приз в 10 тысяч долларов США тому, что сможет разработать алгоритм, обеспечивающий наиболее выгодное существование в этой среде.
На предложение побороться за награду откликнулось более 100 команд, на основании каждого из алгоритмов которых в среде генерировалось 100 виртуальных индивидуумов, соревнующихся друг с другом за ресурсы. По мере того, как те или иные виртуальные индивидуумы набирали баллы, они "размножались", тогда как менее успешные "погибали" и уступали место в среде другим.
В результате нескольких месяцев попарных и групповых состязаний, осуществленных в течение 65 тысяч часов распределенных вычислений на компьютерах, ученые смогли вручить награду команде из двух канадских разработчиков, для которых изучение социального поведения вовсе не является профессиональной задачей.
Тимоти Лилликрэп (Timothy Lillicrap), студент, специализирующийся в области вычислительных нейронных сетей и математик Дэниеэл Коудэн (Daniel Cownden) выиграли свои награды, сделав ставку на максимально эффективное копирование поведения окружающих и активное использование полученных знаний, полностью отказавшись от разработки новых методов поведения в среде в своем алгоритме.
"Мало кто из наших соперников обратил внимание на то, что инновации в поведении никогда не принесли бы выгоды в условиях данного состязания, и что копирование поведения окружающих - единственно выгодная возможность", - сказал Коудэн в интервью. "Это своего рода паразитирование на свежих идеях, которые генерируются другими алгоритмами поведения в среде", - сказал Лаланд.
Среди других алгоритмов, занявших первую десятку в итоговом рейтинге, оказались те, которые уделяли не более 10% своего времени обучению, а остальное тратили на получение прямой выгоды от своих действий.
При этом, алгоритмы победителей продемонстрировали, как важно обращать внимание на вновь разработанные другими алгоритмы поведения, так как старые, в меняющихся условиях игры, могли оказаться малоэффективными. "Эти результаты наглядно показывают, что если вы будете слишком много учиться, жизнь попросту обойдет вас стороной", - сказал Люк Рэндэлл (Luke Rendell) соавтор публикации.
Авторы исследования признают, что их модель среды не отражает всех сторон реальной человеческой жизни, а потому готовят новые турниры алгоритмов поведения в средах с более сложными параметрами. В одной из них виртуальные индивидуумы будут ограничены в доступности информации и смогут копировать поведение только ограниченного количества соперников, а в другой будут способны обращать внимание на возраст и успешность того или иного индивидуума.