그란투리스모님이 말씀하신 딜레마를 기반으로 한 게임 이론에서 나온 전략이 바로 "Tit-for-Tat"이란 전략입니다. 일반적으로 자연계에서 가장 성공적인 전략이라고 평가받고 관찰된 전략이지요. 실제 이 죄수의 딜레마라는 규칙을 가지고 어느 게임 이론이 가장 성공적인지를 겨루는 대회가 있었습니다.
그 대회는 다음 가정을 따르고, 팃포탯 작전은 다음 구조를 따릅니다.
가정 1. 모든 반복 게임은 합리적인 의사결정을 한다
가정 2. 반복 게임 중, 당사자들은 자신과 게임을 하는 상대를 변별할 수 있다.
가정 3. 각 당사자들은 반복게임의 결과를 기억한다
가정 4. 게임의 결과는 바로 반영된다.
구조 1. 처음엔 항상 협력한다.
구조 2. 이후에는 상대방이 이전에 했던 판단을 똑같이 따라한다 (배신을 하면 배신을, 협력을 하면 협력을)
규칙은 위의 죄수의 딜레마와 같습니다.
다만 보수행렬을 약간 고쳐서, 협력-협력의 경우 3,3, 협력-배반의 경우 5,0 / 0,5, 배반-배반의 경우 1,1이 점수로 주어지도록 했습니다.
여기서 총 200 시행을 하면 수학적으로는 0~1000점을 얻지만 실제로는 200~600정도가 되고, 실제로 이 단순하기 그지없는 팃포탯 전략만 채택한 프로그램이 모든 프로그램을 압살하고 504.5점으로 1위를 차지하게 됩니다.
재미있는 것은, 2차 대회에서 팃포탯이 집중 연구 되었고, 그 전략을 카운터 치기 위해 다양한 수정이 가해졌음에도 불구하고, 팃포탯은 다시 434.74점으로 최고 득점을 차지하게 되었다는 겁니다.
재미있는 것은 다양한 전략중에 'Tester' 전략이 선을 보였다는 것입니다. 이 전략은 강자에게 약하고 약자에게 강한, 만나면 배반도 해보고 보복하는 패턴을 보면서 만만하다 싶으면 가혹하게 배반하고, 아니면 협력을 하는 패턴인데요.
이 전략이 Tit-for-Tat과 만났을 때, Tester는 그 사악한(?) 성향에도 불구하고 협력만을 할 수 밖에 없는 결과를 낳게 됩니다.
그란투리스모님은 여기까지 보시고 BCH가 아무리 공격해도, 결과적으로 총 볼륨상에서 BTC를 누르기 힘든 것을 파악하신 뒤 이 예시를 들어주신 것 같습니다. BCH에게 남은 선택지는, BTC와의 무한한 협력 뿐이 되는거죠.
재미있네요. 어떤 전략인지 쉽게 이해되었어요. 하지만 아직도 어려운게 어떤 형태의 보복인지 어떤 형태의 협력인지.. 초보눈엔 그런게 안보이네요.
무한한 협력이란 무엇을 말하는지,
어느 정도 비캐에 투자하고 있는데 비트와 대비하여 전혀 움직임이 없는게..수상하네요..