Gram w to, w co wygrywam, czyli Skinnerem w planszówkę

Koty nie mają właścicieli, mają służących. I usługiwanie im przychodziło mi łatwo, jednak gdy zostałam właścicielką psa okazało się, że sprawa nie jest już taka prosta. Bo psu wypadałoby co nieco dobrych zachowań do głowy włożyć (kotom wystarczy regularnie wkładać coś do miski). Próbując znaleźć ratunek w fachowej literaturze natrafiłam na informacje o  behawioryzmie, warunkowaniu instrumentalnym, wzmocnieniach i wygaszeniach i wielu innych mądrze brzmiących rzeczach, w których najważniejsze okazało się to, że działają.

W artykule „Ulubiona mechanika, ulubiony autor?” Maciej Kwiatek wspomniał B.F Skinnera (gościa, który stworzył naukowe podwaliny tego co dumnie nazywa się pozytywnymi metodami szkolenia psów) w kontekście doboru ulubionych gier. I choć Karen Prior w książce „Najpierw wytresuj kurczaka” już wcześniej uświadomiła mi, że sztuczki ze wzmacnianiem można z powodzenie stosować na ludziach, to dopiero po przeczytaniu felietonu kwiatosza zaczęłam się zastanawiać czy te zjawiska mogą mieć jakiekolwiek znaczenie dla planszówek. I czy przypadkiem autorzy, a właściwie same gry, nie tresują graczy?

Pierwsze prawo uczenia się: zachowanie nagradzane będzie się powtarzać.

Drugie prawo uczenia się: zachowanie ignorowane będzie zanikać.

Jeśliby spojrzeć na sprawę właśnie pod kątem „ulubionych” gier wychodzi, że z czasem najchętniej (najczęściej) będziemy grali w gry, które w jakiś sposób nas nagradzają. I tu ta trudniejsza część zabawy, czyli próba określenia co taką nagrodą jest. Zwycięstwo? Wtedy gralibyśmy w tylko to, w co najczęściej wygrywamy. Możliwość spotkania ze znajomymi? Wtedy właściwie nie ma znaczenia w co zagramy, bo nagroda wędruje do nas zanim w ogóle planszówka wyląduje na stole. Próbując trochę zawęzić i sprecyzować moje własne pojęcie nagrody wyszło mi, że lubię gry, które dają mi możliwość kombinowania, realizacji samodzielnie wymyślonego planu. Co więcej, od finalizującej plan wygranej, ważniejszy jest dla mnie sam proces główkowania, obmyślania i dostosowywania strategii do zmieniających się warunków gry. Podobają mi się zatem gry z różnorodnymi drogami do zwycięstwa, gdyż przy każdej kolejnej rozgrywce mogę próbować czegoś innego. Nie lubię natomiast losowości, która uniemożliwia mój ulubiony odbiór gier. Trudno pod to podpiąć konkretny rodzaj planszówek czy gry jednego autora.

 

Przykładowo:

Zwykle mówię, że lubię eurogry. Zaliczające się do tego gatunku Il Vecchio prawdopodobnie już nigdy nie zejdzie z półki (chyba, że do nowego właściciela) po tym jak po kilku partiach okazało się, że nie potrafię już wymyślić w tej grze żadnych nowych rozwiązań.

Bardzo lubię gry Stefana Felda. Ostatnio grane Bora Bora odrzuciło mnie zbyt dużą ilością losowych zmiennych psujących moją długo wyczekiwaną nagrodę, która zwykle czekała mnie przy jego grach.

Podobny element kombinowania, czy też konieczności stworzenia koncepcji na daną partię występuje często w grach typu deck building. Także w karciankach z dużą ilością różnorodnych kart, które możemy odpowiednio dopasowywać by wzmocnić nawzajem ich działanie, np. Glory to Rome, Race for the Galaxy. Przestały dziwić mnie zestawienie BGG mówiące, że najbardziej lubię właśnie gry karciane.

W całej tej spiskowej teorii dziejów pojawia się jednak mały zgrzyt.

 

W przypadku psiego szkolenia chodzi o to by za pożądane zachowanie stosować różnorodne, niejednostajne nagrody, a nawet czasem specjalnie pomijać co którąś z nich. Sprawia to, że wykonywanie danej czynności staje się dla psa uzależniające niczym dla ludzi granie na automatach. Będzie często powtarzał wyuczone zachowanie, bo mimo iż czasem nie ma za to żadnej nagrody, to zdarza się, że „wygrywa” więcej niż się spodziewał. Jak to działa w kontekście ulubionych gier? Raczej marnie. Oczekuje przyjemnego pobudzenia szarych komórek przy każdej partii i wiem do jakich gier zasiąść, żeby je otrzymać. Czyżby przerwami od nagrody, które tylko wzmacniają wyuczone zachowanie (granie w takie gry) było zasiadanie do wszystkich pozostałych tytułów? Kiedyś lubiłam pędzić za nowościami, ostatnio po zagraniu w kilka gniotów, tym bardziej mam ochotę na powrót do ulubionych planszówek. Czy to efekt wyuczenia?

Jest też inna rzecz, która pojawia się niejednostajnie na koniec każdej partii… Zwycięstwo. Chyba Skinner mnie zdemaskował.

Temat zrobił się niewygodny, wróćmy do naukowego bełkotu (metoda, którą z powodzeniem lekarze stosują na pacjentach). Nie jest żadnym odkryciem, że mechanizmy gier manipulują nami wykorzystując proste zasady kija i marchewki, czyli zwyczajne karanie i nagradzanie. W teorii warunkowania instrumentalnego wyróżniamy:

wzmocnienie pozytywne – kiedy pojawia się czynnik, bodziec, który zwiększy prawdopodobieństwo powtórzenia danego zachowania.

wygaszenie pozytywne – kiedy pojawia się czynnik, bodziec, który zmniejszy prawdopodobieństwo powtórzenia danego zachowania.

wzmocnienie negatywne – gdy usunięcie czynnika, zwiększy prawdopodobieństwo powtórzenia danego zachowania.

wygaszenie negatywne – gdy usunięcie czynnika, zmniejszy prawdopodobieństwo powtórzenia danego zachowania.

To co najczęściej spotykamy w grach to oczywiście wzmocnienie pozytywne – po wykonaniu jakiejś akcji lub ich sekwencji otrzymujemy nagrodę – punkty zwycięstwa. Efekt – staramy się powtarzać korzystne ruchy, wybieramy akcje, które przyniosą jak najwięcej korzyści, w tle licząc na wygraną, ostateczne wzmocnienie. To właśnie ta komponenta warunkowania wykorzystywana jest najchętniej w szkoleniu psów – pies siada, dostaje smakołyk, rośnie prawdopodobieństwo, że będzie chętnie grzecznie siadał. W tresurze często stosuje się jako pomocnicze wygaszanie negatywne – gdy pies skacze na człowieka, odwracamy się od niego lub odchodzimy zabierając mu nagrodę czyli „siebie” – możemy liczyć na to, że w efekcie skakanie się wygasi i czworonóg następnym razem na nasz widok będzie siedział spokojnie (za co może dostać smakołyk i tak wracamy do wzmocnienia pozytywnego). W rezultacie oba te pojęcia są dla mnie podobne i czasem trudno oddzielić jedno od drugiego. W grach wygaszeniem negatywnym może być sytuacja kiedy nie otrzymujemy wygranej pomimo stosowania jakiejś strategii, najpewniej następnym razem postaramy się grać inaczej, a granie w poprzedni sposób zostaje „wygaszone”.

Druga strona medalu, to zjawisko wygaszania pozytywnego, a mówiąc potocznie „kar”. Otrzymanie karty żebraka w Agricoli ma na celu skłonienie nas do lepszego zarządzania jedzeniem – wygaszenie żywieniowego niedbalstwa. Gdyby się uprzeć, można by to także od biedy podciągnąć pod wzmocnienie negatywne – wzmacniamy akcje, które uchronią nas przed stratą punktów. Choć tu bardziej pasuje mi przykład z Osadników – blokujący nam dostęp do surowców złodziej sprawi, że zadbamy o pozyskanie kart rycerza – wzmacniamy zachowanie pozwalające uniknąć nieprzyjemnego bodźca. Przykład jak wygaszanie pozytywne może zmienić się we wzmocnienie negatywne napotkałam ostatnio w grze Police Precinct. Olewanie drobnych rzezimieszków sprawia, że mogą zamienić się w gang – wtedy wszystkich graczy spotykają przykre konsekwencje. Pojawienie się niedogodności to kara, która ma wygasić u graczy olewanie tego elementu gry (wygaszenie pozytywne). Walka z gangiem i usunięcie go doprowadzi do powrotu odebranych przywilejów – usunięcie nieprzyjemnego czynnika zwiększy prawdopodobieństwo chęci usunięcia zagrożenia lub niedopuszczenia do niego w przyszłości (wzmocnienie negatywne).

Co w takim razie powiedziałby planszówkowcom B.F. Skinner?  Że gry same uczą nas jak w nie grać. I że grając uczymy się co nam się podoba i czego szukać na przyszłość. Przynajmniej taką mam nadzieję. Bo mógłby też powiedzieć, że każdy z nas gra w to, w co wygrywa. Oczywiście, niejednostajnie. Co jakiś czas.

 

P.S. Sheldon pomoże Wam rozpocząć przygodę z warunkowaniem już dziś 😉

  • Wspomnieć o Big Bang Theory w każdym wpisie? Challenge accepted 😉

    • Katarzyna Ziółkowska

      Bo to fajny serial jest 🙂

  • kwiatoszZnadPlanszy

    Trzecie prawo można rozwinąć w szereg strategii wzmocnień: nagradzanie za każdorazowe wystąpienie zachowania daje najszybsze utrwalenie, ale po ustaniu wzmocnień zachowanie jest wygaszane i tak dalej. Samo rozważanie siły wzmocnienia daje ciekawe wnioski (dla ludzi) – małe wzmocnienia dają bardziej długofalowe utrwalenie, ponieważ często wymagają dorobienia wewnętrznego uzasadnienia dla utrwalania zachowania, z drugiej strony nawet nieregularne wzmocnienia, które będą zbyt mocne/atrakcyjne doprowadzą do wygaszenia zachowania po ustaniu wzmocnień, nawet jeżeli wygląda na to, że zachowanie zostało utrwalone w nawyk.
    Teraz mi wstyd że się za temat nie wziąłem 😉

    • Katarzyna Ziółkowska

      Nic nie szkodzi. Wyszło na to, że tu nikomu nie przeszkadza jak kilka osób pisze o tym samym 😉

      Nie wiem jak to jest z ludźmi. Z psami polecają każdorazowe nagradzanie do momentu utrwalenia zachowania, a następnie wzmacnianie niejednostajne/różnorodne nagrody dla podtrzymania efektu. Ale psy nie dorabiają sobie ideologii.

      Trochę w tym problem, bo jeśli popełnimy jakiś błąd to potem trudno go wyplenić. Np. przychodzi do nas co jakiś czas osoba, która karmi psa przy stole. Pies uczy się, że warto żebrać i mimo, że niedostanie nigdy nic od nas to niejednostajne wzmacnianie przez „miłosiernego” gościa tym mocniej utrwala mu nieporządane zachowanie.

  • Radek Gozdek

    bardzo trafne spostrzeżenia i jak zwykle ładnie napisane 🙂 No i ten pies 🙂

  • kwiatoszZnadPlanszy

    Swoją drogą – mam jeden taki głupi egzemplarz psa jak na zdjęciach – jak się trafi wybrakowany intelektualnie to masakra…