Компютрите превземат спорта?

Гуруто на съвременната теория за игрите Джон фон Нойман е казъл: „Реалният живот е основан на блъфа, на малките лъжи, които са следствие от предположенията за това, какво очаква от теб човекът отсреща. Така разбирам аз играта в моята теория.“

OLYMPUS DIGITAL CAMERA

Нойман е предвидил, че за да се създаде мощен изкуствен интелект (ИИ), компютърът трябва да се научи да играе игри, в които информацията не е пълна, тъй като такъв тип игри най-много съответстват на човешкото поведение в реалния живот. Една такава игра е покерът.

Настолните игри са сред най-популярните области за ескперименти, свързани с изкуствен интелект. С всяка година компютърът побеждава човека във все повече игри, от . китайския шах до видеоигрите, изкуственият интелект заема челни позиции и се превръща в играч номер 1И все пак, това са игри, в които играчите имат цялата информация за разпределението на силите. Покерът, обаче е друго нещо.

От известно време учените се опитват да създадат програма, която може да надиграе човек в безлимитния Texas Holdem. За разлика от останалите приложения на изкуствения интелект, в този случай една успешна разработка би се отблагодарила мигновенно, доколкото ежедневно в онлайн стаите за покер се разиграват милиони долари.

Известно е, че Нойман е имал нескрит интерес към покера и това не е учудващо, имайки предвид уникалните характеристики на играта. Всеки от играчите разполага само с част от информацията, която му е необходима и  за да победи трябва да може да я използва пълноценно като едновременно с това оценява и действията на другите играчи.

По-рано изкуственият интелект успяваше само в игра с ограничен залог – най-простият варинат на играта. Там играчът има само 1014 възможни сценария. За сравнение – в безлимитния Holdem възможните сценарии са 10 160. Впрочем, в логическата игра Го те са 10 170, но Го е игра с пълна информация, така че задачата като цяло е по-проста.

В игри като покера правилното решение на изкуствения интелект зависи и от информацията, получена от действието на противника. Но от друга страна, тази информация е следствие от предишните действия на изкуствения интелект и информацията, която той е дал на противника си чрез тези действия. Това именно е рекурсивното мислене, с което се е захванала програмата DeepStack. И, както изглежда, се справя доста добре.

До момента DeepStack е спечелила 44 852 ръце от общо 120 000 и то срещу професионални покер играчи, селектирани от Международната федерация по покер. Играчите са получили и парични награди за участието си в експеримента, така че със сигурност са дали всичко от себе си. И все пак – програмата е на плюс.

DeepStack залага на „дълбоко учене“ (deep learning), за да постигне „интуитивен подход“. Според нейните създатели тя не генерира завършена стратегия преди началото на играта, а по-скоро дава моментни изчисления чрез дълбочинен анализ и приблизителна оценка, сходни с човешката интуиция.

И макар че покерът действително изисква определени умения, а играчите полагат огромни усилия да развиват определени стратегии, израствайки в кареиерата си, изглежда математиката все пак е способна да ги надмине!