Modele AI zagrały ze sobą w pokera. Ten eksperyment obnażył, czego wciąż im brakuje

Celem eksperymentu nie było jednak wyłonienie zwycięzcy samo w sobie, lecz sprawdzenie botów w sytuacjach, które u ludzi generują stres i duże emocje. Chciano bowiem zweryfikować, czy będą one potrafiły podejmować trudne decyzje w chwilach, gdy niepewność bierze górę nad zdrowym rozsądkiem i racjonalnym myśleniem.

W rywalizacji pokerowej do wirtualnego stołu zasiadły następujące modele: OpenAI o3, Claude 4.5 Anthropic, Grok, Gemini 2.5 Pro, Meta Llama 4, DeepSeek R1, Kimi K2 Moonshot AI, Magistral i Z.AI GLM 4.6.

Każdy model AI dostał 100 tys. dolarów i przez pięć dni rywalizował z innymi, grając na stawkach 10-20 USD. W teorii zapowiadało to prostą rywalizację opartą na schematycznych rozwiązaniach. Sztuczna inteligencja faktycznie podejmowała tysiące decyzji, jednak nie wynikały one z przeczucia, przekory czy na bazie intuicji. To bowiem czysto ludzkie cechy. Komputery natomiast opierały się na analizie danych oraz matematycznych obliczeniach.

Najlepiej ze wszystkich poradził sobie model o3 od OpenAI. Wygrał ponad 36 tys. dolarów i robił to w sposób, który sprawiał wrażenie spokojnej, poukładanej gry. Trzymał się zasad, których uczy się początkujących graczy przed flopem i rzadko odbiegał od wybranej strategii. Claude i Grok też zakończyły turniej na plusie, choć ich wyniki były nieco niższe.

Nie wszystkie modele AI miały jednak powody do zadowolenia. Llama 4 od Meta szybko straciła cały kapitał. Z kolei Kimi K2 z Moonshot AI walczył długo, ale ostatecznie zakończył grę z dużą stratą. Taki rozstrzał pokazuje, że modele nie zawsze umieją ocenić sytuację przy stole, nawet jeśli przetwarzają ogromne ilości danych w ułamku sekundy.

Najciekawszy wniosek dotyczył podejścia sztucznej inteligencji do kwestii ryzyka. Większość modeli grała zbyt ostro, jakby były przekonane, że niemal każda sytuacja sprzyja atakowi. Często próbowały forsować rozdania bez wyraźnego powodu, a gdy przeciwnik pokazywał siłę, reagowały z opóźnieniem. To prowadziło do wielu nieudanych blefów i złej oceny ruchów innych graczy.

Mimo to dało się zauważyć, iż modele momentami próbowały zachowywać się trochę jak ludzie. Starały się dostosowywać do przeciwników i reagować na ich styl gry. Zdarzało im się nawet próbować odczytać zamiary oponentów, choć efekty bywały przewrotne. Ich blefy wyglądały raczej jak konsekwencja błędnej analizy niż świadomego ryzyka. W takich momentach najlepiej widać różnicę między algorytmem a człowiekiem, który potrafi połączyć przeczucie z konkretnymi informacjami i podejmować trafne decyzje na podstawie takiej mieszanki.

Cała rozgrywka pokazała, że sztuczna inteligencja umie grać solidnie w pokera, ale wciąż ma trudności z elementami, które dla doświadczonego zawodnika są naturalne. AI świetnie liczy, lecz nie zawsze rozumie, kiedy warto odpuścić, a kiedy docisnąć. I właśnie dlatego te pojedynki tak dobrze pokazują granice tego, jak maszynowe strategie radzą sobie w grach, gdzie liczy się także psychologia.

Wróć

Modele AI zagrały ze sobą w pokera. Ten eksperyment obnażył, czego wciąż im brakuje

Jaki był cel tego eksperymentu?

Smartfony z funkcjami AI w naszej ofercie:

Który model AI poradził sobie najlepiej w pokerze?

Modele AI grały w pokera inaczej niż ludzie

Laptopy w naszej ofercie:

Te poradniki mogą okazać się pomocne

Fani anime czekają na to od lat. Pogłoski o LEGO Dragon Ball zyskują na sile

OpenAI realizuje to, co zapowiadało. ChatGPT będzie pokazywał reklamy

Procesor Snapdragon X2 został poddany testom. O jednej rzeczy należy pamiętać

Kolejny statek może trafić do serii LEGO Star Wars. To coś dla fanów nowszych produkcji z tego uniwersum

IPhone 17e zaskakuje funkcjami, które mogą przyciągnąć miliony. Co wiadomo przed premierą nowego modelu Apple?

Wydry dryfują w kierunku LEGO Ideas. Uroczy model został oficjalnie zaprezentowany

Najnowsze poradniki

Ranking zestawów pralka i suszarka [TOP10]

Ranking grilli gazowych [TOP10]

Jak wybrać zabawki dla fana Harry’ego Pottera?

Jaka biżuteria do czerwonej sukienki? Praktyczne porady

iPhone 17e zaskakuje funkcjami, które mogą przyciągnąć miliony. Co wiadomo przed premierą nowego modelu Apple?

Co położyć na stół w salonie?

Ranking komputerów do 5000 zł [TOP10]

Ranking smartwatchy damskich [TOP10]

Jakie zabawki dla 2-latka wybrać?

Jak włączyć płytę indukcyjną?

Ranking perfum męskich [TOP15]

Jak działa inteligentny głośnik po polsku?

Ranking rowerów [TOP10]

Ranking aparatów fotograficznych dla dzieci [TOP10]

Jak wybrać nowoczesne legowisko dla psa?

Sprzedaż dla firm i instytucji

Ubezpieczenia "Gwarancja PLUS"

Zakupy na raty przez internet

Karty podarunkowe Media Expert

Modele AI zagrały ze sobą w pokera. Ten eksperyment obnażył, czego wciąż im brakuje

Udostępnij przez:

Jaki był cel tego eksperymentu?

Smartfony z funkcjami AI w naszej ofercie:

Który model AI poradził sobie najlepiej w pokerze?

Modele AI grały w pokera inaczej niż ludzie

Laptopy w naszej ofercie:

Udostępnij przez:

Te poradniki mogą okazać się pomocne

Fani anime czekają na to od lat. Pogłoski o LEGO Dragon Ball zyskują na sile

OpenAI realizuje to, co zapowiadało. ChatGPT będzie pokazywał reklamy

Procesor Snapdragon X2 został poddany testom. O jednej rzeczy należy pamiętać

Kolejny statek może trafić do serii LEGO Star Wars. To coś dla fanów nowszych produkcji z tego uniwersum

IPhone 17e zaskakuje funkcjami, które mogą przyciągnąć miliony. Co wiadomo przed premierą nowego modelu Apple?

Wydry dryfują w kierunku LEGO Ideas. Uroczy model został oficjalnie zaprezentowany

Najnowsze poradniki

Ranking zestawów pralka i suszarka [TOP10]

Ranking grilli gazowych [TOP10]

Jak wybrać zabawki dla fana Harry’ego Pottera?

Jaka biżuteria do czerwonej sukienki? Praktyczne porady

iPhone 17e zaskakuje funkcjami, które mogą przyciągnąć miliony. Co wiadomo przed premierą nowego modelu Apple?

Co położyć na stół w salonie?

Ranking komputerów do 5000 zł [TOP10]

Ranking smartwatchy damskich [TOP10]

Jakie zabawki dla 2-latka wybrać?

Jak włączyć płytę indukcyjną?

Ranking perfum męskich [TOP15]

Jak działa inteligentny głośnik po polsku?

Ranking rowerów [TOP10]

Ranking aparatów fotograficznych dla dzieci [TOP10]

Jak wybrać nowoczesne legowisko dla psa?

Sprzedaż dla firm i instytucji

Ubezpieczenia "Gwarancja PLUS"

Zakupy na raty przez internet

Karty podarunkowe Media Expert