텍사스홀덤의 진화

텍사스홀덤의 진화 – 온라인홀덤

오늘날 세계는 컴퓨터와 통신망의 발달로 짧은 시간 동안 많은 변화를 겪어 왔습니다. 컴퓨터로 주식을 거래하는 것은 이제 당연한 얘기가 되었고 수많은 사람이 기원이 아닌 집안에서 얼굴 한 번 본 적이 없는 사람들과 바둑을 두고 있습니다. 스타크래프트나 리니지 같은 온라인 게임은 집이나 피시방에서 세계 각국에 있는 불특정 다수와 게임이 이루어집니다. 최근에는 어떤 곳이라도 모바일 게임이 가능하고요.

텍사스홀덤
텍사스홀덤

이런 현상은 당연히 포커 세계에도 도입되었습니다. 지금도 온라인 게임 사이트에 들어가 보면 동일 시간에 수십만 명이 참가하여 게임을 하고 있습니다. 영국 사람, 캐나다 사람, 일본 사람, 이름도 생소한 나라의 사람들 그리고 대부분의 미국 사람과 같은 테이블에서 게임을 합니다.

이처럼 세계는 발달한 인터넷 환경으로 인하여 급격히 가까워졌고 예전처럼 어떤 장소에 모여야만 게임이 이루어지던 시대는 지나갔습니다. 이런 텍사스홀덤 온라인 포커의 등장은 포커판에 여러 가지 변화를 몰고 왔습니다. 우선 그것이 긍정적이든 부정적이든 포커 인구의 확산입니다.

누구나 쉽게 인터넷을 통하여 포커 테이블에 앉을 수 있게 된 것입니다. 그리고 포커 인구의 저령화입니다. 포커, 그중에서도 텍사스홀덤은 승부의 속성이 마치 스타크래프트와 비슷하여 심리를 이용한 전력과 전술이 사용되고 빠른 손놀림이 요구되는데 이런 것들이 젊은이들의 취향과 맞아서 많은 젊은 사람들이 이 강남홀덤 게임을 즐기고 있습니다.

텍사스홀덤 온라인홀덤은 손과 머리 회전이 빠른 젊은 선수들이 빨리 성장할 기회를 제공하였습니다. 이들은 짧은 기간에 상상하기 힘들 정도로 많은 게임 경험을 쌓았습니다. 이들은 보통 9 테이블에서 16개의 테이블을 동시에 켜 놓고 게임을 하는데 이런 방법을 통해 이들은 일 년에 백만 손 이상을 소화하며 실전 경험을 쌓고 있습니다.

실전에서 백만 손의 포커게임을 하려면 아마 평생을 두고 해도 끝내지 못할 것입니다. 만약 몇백만 판을 했다면 포커 게임에서 나올 수 있는 수많은 경우의 수를 모두 다 경험할 수 있을 것입니다. 이런 멀티플레이를 할 수 있는 환경이 조성되면서 지금의 텍사스홀덤 온라인홀덤은 더욱 빡빡해지고 실전의 오프라인 게임과는 조금 다른 모습으로 변화하였고 지금도 그런 여러 기술적 이론들과 함께 계속 변화하는 중입니다.

또 최근에는 인공지능 프로그램들이 등장해서 텍사스홀덤 온라인 홀덤사이트 시장 환경이 어떻게 변할지 예측하기 힘들게 되었습니다. 로봇 프로그램들은 초창기에도 있었지만, 초보 수준이었기에 사이트에서 해당 아이디를 막는 정도였지만 앞으로는 어떻게 진화된 로봇 프로그램들이 출현할지 예측하기 어렵습니다.

온라인홀덤 사이트 추천
온라인홀덤 사이트 추천

이세돌 프로를 이길 정도로 인공지능 컴퓨터가 발전했으니 홀덤 잘 두는 로봇은 벌써 출현했을 겁니다. 얼마 전 구글에서 검색해보니 미국 대학에서 홀덤 게임하는 알고리즘을 학위논문으로 발표했더군요.

이처럼 급변하는 환경에서 홀덤 플레이어들이 수익 내기는 더욱 힘들어졌고 더욱 공부하지 않으면 살아남기 힘든 환경이 되었습니다. 그래도 언젠가 미국 시장이 개방되고 포커 스타즈 같은 회사에서 새로운 환경을 제공한다면 지금처럼 메마른 환경도 언젠가 예전처럼 활성화될 날이 있을 것입니다.

또 언젠간 될지 모르겠지만, 국내 카지노가 오픈하면서 포커 방도 생길 수 있을 테고요. 그때를 대비해서 차근차근 이론 공부와 실전 연습을 해서 향후 수익 나는 플레이어가 되시기를 빌겠습니다.

포커 게임 이론 – 게임에 대해서 생각해야만 하는 방식

포커는 최근 몇 년간 빠르게 진화해왔다. 진화가 너무 빨라서몇 몇 비디오, 책, 디지털 컨텐츠에 나오는 전략이 구식이될 정도이다.

그 중에 가장 눈에 띄는 변화는 그 동안 올드 스쿨 플레이어가 익스플로잇 플레이로 수 백만 달러를 벌어왔던것과 반대로 최근에 수 백만 달러를 벌어들인 플레이어들의 대부분은 익스플로잇 플레이에 그 다음 레벨까지 혼합한 포커 게임 이론을 활용했다는 것이다.

이 글에서는 아래의 주제를 다룰 것이다:

  • 게임 이론과 포커의 기본
  • 게임이론에 기반한 전략을 사용해야 하는 이유
  • 게임이론의 중요성을 보여주는 더그 폴크의 예
  • 게임 이론에 기반한 전략을 사용했을 때의 이점 4가지

자 시작해보자!

게임 이론과 포커

존 내쉬는 1950년에 프린스턴 대학에서 수학의 한 갈래로 게임이론을 만들었다. 지난 15년간 포커의 인기가 커지면서 플레이어들의 전략은 극적이게 발전해서 게임이론에 대한 지식 없이 게임을 지속해서 비트하기 어려운 수준까지 발전했다.

수학에 대한 이해가 생기면서 포커는 점점 복잡해지기 시작했다. 포지션별오픈 핸드부터 리버에서 스몰 팟일 때에는 체크가 별로 중요해 보이지 않는다는 점까지 모든 의사 결정이 포커 플레이어의 승률에 영향을 줬다. 이런 개념은 기대 값(EV)으로 측정될 수 있다.

수익이 나는 의사결정은 +EV로, 수익이 나지 않는 의사결정은 -EV로 불린다.

플레이어가 오픈 레이즈 핸드 레인지를 활용하는 것이 게임 이론에 기반한 밸런스 전략 활용의 아주 간단한 예이다. 아래는 UTG에서의 일반적인 오픈 레인지이다.

UTG에서 아주 강한 핸드로 레이즈하는 것은 분명히 수익이 나는 플레이지만 그런 핸드로만 플레이를 한다면 너무 쉽게 예측 당할 수 있다. 가끔은 다소 수익성이 떨어지는 9s8s, 6h6c 같은 핸드로도 오픈을 해서 우리의 오픈 레인지를 밸런싱 시킨다면 다른 플레이어들이 우리를 상대하기가 더욱 힘들어질 것이다. 또 이렇게 플레이를 하면 플랍에 아래와 같이 로우 또는 미들 카드가 나올 경우 아주 강한 핸드로 발전할 수도 있다.

왜 GTO 포커 전략을 사용할까?

대부분 수익은 수준이 떨어지는 플레이어를 익스플로잇 하거나 게임에 집중하지 않는 플레이어들을 상대할 때 나오는데 왜 게임 이론을 바탕으로 한 전략을 사용하는 것이 중요한지 궁금할 수도 있다.

주된 2가지 이유는 아래와 같다.

  • GTO에 기반한 균형 된 전략을 활용하면 상대의 실력에 관계없이 장기적으로 수익을 낼 수 있다.
  • 사용하는 전략에 관한 기준점을 갖고 있다면 만나는 플레이어에 맞춰서 적응하기가 수월해진다. (이 내용은 뒤에서 좀 더 다루겠다.)

GTO 관점에서 보면 당신의 핸드 리뷰 세션은 얼마나 객관적으로 핸드 분석을 했나와 관련이 있다. 그런 관점을 통해 당신이 밸런스된 레인지로 플레이했는지를 결정할 수 있다. 게다가 GTO 관점에서 보면 당신이 실제로 가진 2장의 카드가 아니더라도 특정한 상황에서 어떤 식으로 플레이 해야만 하는지를 알 수 있다.

그래서 세션을 리뷰하는 동안 자신에게 들고 있는 카드에 따라 어떻게 행동했어야 했는지를 물어볼 수 있다.

밸류를 위해 벳을 해야 하는 특정한 상황이라면 당신은 당신의 레인지에 있는 다른 핸드로 블러프 벳을 할 수도 있고 그렇게 하면 상대는 당신이 밸류 벳을 하는지 블러프 벳을 하는지 헷갈리게 된다. 특저한 리버에서밸류 핸드로만 벳을 한다면 상대 플레이어는 매번 당신이 좋은 핸드를 들고 있다는 사실을 알고 쉽게 폴드해서 수익을 낼 수 있다.

반대로 특정 상황에서 블러프를 너무 자주 한다면 상대는 당신이 강한 핸드를 들고 있을 가능성이 작다는 사실을 알고 매번 콜을 해서 수익을 낼 수도 있다.

게임이론 포커의 예

리버에서 $100 팟에$100을 벳했다면 상대 플레이어는 $200을 위해 $100을 콜 해야만 한다. 그러므로 상대의 팟 오즈는 2대1이 되며 이런 플레이가 본전이 되기 위해서는 최소33% 빈도로 승리할 필요가 있다.

이 간단한 계산을 통해 당신의 리버 벳 레인지에 블러프가 얼마만큼 포함되어야 최적화 되는지 알 수 있다. 33% (밸류 2번당 블러프 1번)이다. 이 빈도는 최적화되어있다. 왜냐하면 패배할 가능성 없이 거의 모든 팟을 이길 수 있기 때문이다.

4가지의 서로 다른 블러프 – 밸류 벳 시나리오를 통해 왜 33% 블러프와 66%의 밸류 벳이 GTO상에서 최상의 옵션이 되고 상대 플레이어는 아무것도 할 수 없게 되는지를 살펴보자.

(간단하게 하려면 밸류 벳을 할 때는 매번 승리하고 블러프가콜을 당할 경우에는 매번 패배한다고 가정하자.)

시나리오 1 – 블러프 0%, 밸류 벳 100%:

상대는 100%의 빈도로 폴드할 수 있다. 그 결과 당신의 벳 레인지는 $100의 수익을 발생시킨다.

시나리오 2 – 블러프100%, 밸류 벳 0%:

상대는 100%의 빈도로 콜을 할 수 있다. 그 결과 당신의 벳 레인지는 $100의 손실을 발생시킨다.

시나리오 3 – 블러프50%, 밸류 벳 50%:

상대가 100%의 빈도로 콜을 하면 밸류 벳일 때에는 $200의 수익을, 블러프 일 때는 $100의 손실을 기록한다. 그러므로 상대가 매번 콜을 할 때만 당신은 이 베팅 레인지로 $50의 수익을 낼 수 있다.

(50% * -$100 = -$50; 50% * $200 = $100. $100 – $50 = $50).

시나리오 4 – 블러프33%, 밸류 벳 67%:

상대가 매번 콜을 한다면, 당신이 밸류 벳을 할 때는 $200의 수익을, 블러프를 할 때는 $100의 손실을 기록한다. 하지만 이번 레인지에서는 33%의 빈도일 때에만 $100를 잃고 67%의 빈도로 $200을 벌게 되므로 순수익은 $100이 된다.

(33% * $100 = -$33; 67% * $200 = $133.$133 – $33 = $100)

  • 상대가 매번 콜을 할 경우 $100의 수익
  • 상대가 매번 폴드 할 경우 $100의 수익

상대가 콜하느냐 폴드하느냐에에 관계없이 수익은 $100이다.

이 윈-윈 시나리오는 완벽하게 밸런스된 레인지일 때에만 가능하다. 상대의 입장에서는 콜하든 폴드하든 결과가 똑같다. 왜냐하면 상대가콜 또는 폴드를 하든 간에 당신의 레인지는 같은 양의 수익을 발생시키기 때문이다.

수준이 떨어지는 플레이어를 익스플로잇 시키기 위해 이 비율을 활용한다면 더욱 수익이 날 수 있겠지만 신뢰 할만한 근거를 바탕으로 정확하고 주의 깊게 적용해야 한다.

만약 더 수준이 높은 게임을 장기적으로 크러쉬하고 싶다면 GTO에 기반을 둔 전략을 이해하는 것은 필수이다.

GTO 활용의 4가지 이점

아래의 4가지의 이점의 결과물로 탄탄한 GTO 전략을 얻을 수 있다.

1. 원형적인 사고방식을 피해라

90년대의 포커 트레이닝의 잔재는 플레이어가 플레이하는 “레벨”을 이해하려고 노력하는 것이다.

  • 레벨에 근거한 사고는 당신이 당신 자신의 핸드만을 고려하면서 시작된다
  • 그다음으로 상대가 무엇을 가졌을지에 대한 사고로 옮겨간다
  • 그다음으로 상대가 당신이 무엇을 가졌을지에 대한 사고로 옮겨간다
  • 그다음으로 상대가 당신이 상대가 무엇을 가졌다고 생각하는 지에 대한 사고로 옮겨간다
  • 이런 식으로 계속 진행된다

이상적으로는 이렇게 “레벨을 정하는” 과정을 어느 순간에는 끝내야 한다. 즉, 상대가 어떤 레벨인지를 결정하고 그에 맞춰서 플레이해야 한다는 말이다. 하지만 현실에서 수준이 낮은 플레이어를 상대할 때에는 이 과정을 신뢰할 수 없다.

그리고 보다 수준이 높은 플레이어들을 상대로는 이론적으로는 가능하겠지만, 결론이 나올 때까지 계속 저 과정을 반복하면서 양측 플레이어 모두 서로의 씽킹 레벨을 알아내기 위해 노력한다.

2. 가정하는 것을 피해라

GTO에 기반을 둬서 포커에 접근할 경우의 또 다른 장점은 타플레이어에 대해 옳지 않은 가정을 할 가능성을 미리 방지한다는 것이다. 물론 충분한 샘플 핸드가 있는 플레이어를 상대할 때 특정한 가정을 할 수도 있지만, 극히 일반적인 가정은 비싼 대가를 치르게 한다.

예를 들어 “이건 절대 블러프가 아니야” 또는 “여기에서는 매번 그 핸드를 갖고 있지”와 같은 소리를 하는 것은 현명하지 않다. 마찬가지로 정보가 없는 상대(unknown)의 레인지에 특정한 핸드가 있을 수 없다는 가정이나 아주 넓거나 아주 타이트한레인지를 가졌다는 가정도 하면 안 된다.

잘 짜인 GTO전략은 이런 혼란을 없애주며 장기적으로 수익이 날 수 있도록 도움을 준다.

3. 객관적인 분석

많은 플레이어가 결과에 따라 플레이를 잘못 판단하는 오류를 범하고 있다. 하지만 장래에 자신의 포커 경험의 발전할수록 결과에 상관없는 분석을 하고 있다는 것을 깨닫게 될 것이다.

하지만 특히 핸드의 결과가 정말 좋거나 정말 나쁠 때는 객관적인 사고를 하기가 어려울 수도 있다. 마치 당신이 리버에 풀하우스를 완성해서 상대의 스택을 가져온 일이 두 번의 콜이 옳은 플레이를 의미하지는 않는 것과 같다.

특정 스팟에서의 올바른 GTO 전략을 알게 되면 그것을 나중의 세션 분석에 적용해서 장기적으로 자신의 레인지가 수익이 나는지를 파악해야지 단기적인 결과에 의존하면 안 된다.

모든 성공적인 플레이어는 자신의 실수를 인정하는 것이 지속해서 올바른 플레이를 하기 위한 핵심요소라는 사실을 분명히 알고 있다. 게임이론은 실수를 알아차리기 위한 좋은 토대를 제공해준다.

4. 게임 적응을 쉽게 해준다

왜 게임이론이 거친 적응을 해야 할 때 중요할까? 이를 알아내기 위해 예를 보자.

예를 보기 전에 지금 당신은 게임에 관한 기본적인 지식 외에 알고 있는 모든 포커 전략을 잊어버렸다고 해보자. 그리고 그 상태에서 처음으로 플레이하는 핸드라고 해보자.

라이브 $1/$2. 유효 스택 $200.

Hero BB A♦ 9♦.

버튼까지 전부 폴드. 버튼 레이즈 $7. SB폴드. Hero 콜.

Flop ($14) A♠ T♦ 3♥

Hero 체크.. BTN 벳 $9. Hero 콜.

Turn ($32) J♣

Hero 체크. 버튼벳 $21. Hero 콜.

River ($74) 9♣

Hero 체크. 버튼벳 $50. Hero 콜.

버튼의 핸드 A♥2♣. Hero가 투 페어로 $174 승리.

탑 페어에 약한 키커를 가진 버튼의 어그레션이 어떤가?

앞으로 그를 어떻게 익스플로잇 시킬 수 있겠는가? 이론적으로 버튼의 특정 핸드의 옳은 플레이 방법을 이해하지 못하고서는 어디서부터 시작해야 할지 모른다.

반대로 당신이 버튼의 상황에서 A2o를 이론적으로 올바르게 플레이하는 방법을 알고 있다면 그 상황에서 어떻게 벗어나야 하는지도 알 것이다. 이런 지식이 상대를 익스플로잇시키는 방법을 추론하는 것을 쉽게 해준다.

이 플레이어의 어그레시브한 씬 베팅 전략을 크러쉬 하기 위한 맞춤형 적응법은 아래와 같다.:

  • 작은 익스플로잇: 그가 벳이나 베럴을 할 때 더 가볍게 콜을해라.(너무 자주는 말고)
  • 큰 익스플로잇: 끊임없이 그의 첵백 레인지를 씬 밸류를 조합하여 적당한 블러프를 섞어서 빅 벳으로 공격해라, 분명히 약한 레인지일 것이다.

이론적으로 최적화된 핸드 플레이 방법을 이해함으로써 매우 자주 상대를 수월하게 익스플로잇 시킬 수 있다. 왜냐하면, 당신은 상대가 최적화와는 거리가 멀다는 사실을 분명히 알고 있기 때문이다. 무엇이 옳은지 알지 못한다면 무엇이 잘못되었는지 알 수 없지 않을까?

결론

완벽한 GTO 전략을 시도하면 논리적인 결론에 도달할 것처럼 보이지만 완벽히 최적화된 GTO로 플레이하는 사람은 아무도 없다는 것이 진실이다. 지금까지 포커는 사람이나 기계에 의해 풀리긴 했지만, 여전히 가능한 많이GTO 전략을 활용하는 것을 강하게 추천되고 있다.

늘 그렇듯 이 말은 게임을 하고 있을 때나 하고 있지 않을 때 모두에 적용된다.

이 글은 GTO가 포커에 어떻게 적용되는지에 대한 아주 기본적인 내용이지만 이 글에서도 뭔가를 얻어가길 바라며 아니면 적어도 게임이론 개념을 이용해서 어떻게 게임을 발전시킬지에 대한 호기심이라도 가졌길 바란다.

홈으로 이동하기