في اللعبة نفسها ، يتم تمثيل العقوبات (والمكافآت ، عند الاقتضاء) خدمة أعداد. تمثل الأرقام الإيجابية نتائج جيدة ، وتمثل الأرقام السلبية نتائج سيئة ، وتكون النتيجة أفضل من الأخرى إذا كان الرقم المرتبط بها أكبر. (كن حذرًا ، مع ذلك ، من كيفية عمل ذلك للأرقام السالبة ، لأن -5 ، على سبيل المثال ، أكبر من -20!)
في الجدول أعلاه ، يشير الرقم الأول في كل مربع إلى نتيجة اللاعب 1 والرقم الثاني يمثل نتيجة اللاعب 2. تمثل هذه الأرقام مجرد مجموعة واحدة من مجموعات عديدة تتوافق مع معضلة السجناء.
بمجرد تحديد اللعبة ، فإن الخطوة التالية في تحليل اللعبة هي تقييم استراتيجيات اللاعبين ومحاولة فهم كيف من المحتمل أن يتصرف اللاعبون. يضع الاقتصاديون بعض الافتراضات عندما يحللون الألعاب - أولاً ، يفترضون أن كلا اللاعبين على علم بذلك المكافآت لأنفسهم ولللاعب الآخر ، وثانيًا ، يفترضون أن كلا اللاعبين يبحثان إلى بعقلانية تعظيم مردودهم من اللعبة.
أحد الأساليب الأولية السهلة هو البحث عما يسمى الاستراتيجيات السائدة- الإستراتيجيات الأفضل بغض النظر عن الإستراتيجية التي يختارها اللاعب الآخر. في المثال أعلاه ، يعد اختيار الاعتراف استراتيجية سائدة لكلا اللاعبين:
بالنظر إلى أن الاعتراف هو الأفضل لكلا اللاعبين ، فليس من المستغرب أن النتيجة التي يعترف بها كلا اللاعبين هي نتيجة توازن اللعبة. ومع ذلك ، من المهم أن تكون أكثر دقة مع تعريفنا.
مفهوم أ توازن ناش تم تدوينه من قبل عالم الرياضيات ونظري اللعبة جون ناش. ببساطة ، توازن ناش هو مجموعة من أفضل استراتيجيات الاستجابة. بالنسبة للعبة ثنائية اللاعبين ، فإن توازن ناش هو نتيجة حيث تكون إستراتيجية اللاعب 2 أفضل استجابة لاستراتيجية اللاعب 1 واستراتيجية اللاعب 1 هي أفضل استجابة لاستراتيجية اللاعب 2.
يمكن توضيح إيجاد توازن ناش من خلال هذا المبدأ في جدول النتائج. في هذا المثال ، فإن أفضل استجابات اللاعب 2 للاعب الأول محاطة بدائرة باللون الأخضر. إذا اعترف اللاعب 1 ، فإن أفضل استجابة للاعب 2 هي الاعتراف ، حيث أن -6 أفضل من -10. إذا لم يعترف اللاعب 1 ، فإن أفضل استجابة للاعب 2 هي الاعتراف ، حيث أن 0 أفضل من -1. (لاحظ أن هذا المنطق يشبه إلى حد كبير المنطق المستخدم لتحديد الاستراتيجيات السائدة).
أفضل استجابات اللاعب 1 محاطة بدائرة باللون الأزرق. إذا اعترف اللاعب 2 ، فإن أفضل استجابة للاعب 1 هي الاعتراف ، حيث أن -6 أفضل من -10. إذا لم يعترف اللاعب 2 ، فإن أفضل استجابة للاعب 1 هي الاعتراف ، حيث أن 0 أفضل من -1.
توازن ناش هو النتيجة حيث توجد كل من دائرة خضراء ودائرة زرقاء لأن هذا يمثل مجموعة من أفضل استراتيجيات الاستجابة لكلا اللاعبين. بشكل عام ، من الممكن أن يكون لديك العديد من توازنات ناش أو لا شيء على الإطلاق (على الأقل في الاستراتيجيات البحتة كما هو موضح هنا).
ربما لاحظت أن توازن ناش في هذا المثال يبدو دون المستوى الأمثل بطريقة ما (على وجه التحديد ، أنه ليس باريتو الأمثل) لأنه من الممكن أن يحصل كلا اللاعبين على -1 بدلاً من -6. هذه نتيجة طبيعية للتفاعل الموجود في اللعبة - من الناحية النظرية ، لن يكون الاعتراف الإستراتيجية المثلى للمجموعة بشكل جماعي ، لكن الحوافز الفردية تمنع هذه النتيجة من أن تكون حقق. على سبيل المثال ، إذا اعتقد اللاعب 1 أن اللاعب 2 سيبقى صامتًا ، فسيكون لديه حافزًا لتصويبه بدلاً من التزام الصمت ، والعكس صحيح.
لهذا السبب ، يمكن أيضًا اعتبار توازن ناش نتيجةً حيث لا يوجد لاعب لديه حافز للانفراد من جانب واحد (أي بمفرده) عن الاستراتيجية التي أدت إلى تلك النتيجة. في المثال أعلاه ، بمجرد أن يختار اللاعبون الاعتراف ، لا يمكن لأي لاعب أن يفعل أفضل من خلال تغيير رأيه بنفسه.