Advertisement

Responsive Advertisement

Pengantar Teori Permainan: Strategi Dominan dan Nash Equilibrium

Pengantar Teori Permainan: Strategi Dominan dan Nash Equilibrium

Bagaimana seseorang membuat keputusan terbaik ketika hasilnya bergantung pada keputusan orang lain — yang juga sedang mempertimbangkan keputusanmu? Itulah pertanyaan inti teori permainan. Dari dilema tahanan hingga perang harga antar perusahaan, teori ini memberikan kerangka formal yang sangat berguna untuk menganalisis situasi strategis di mana kepentingan individual dan kolektif sering bertabrakan.

1. Ketika Hasil Bergantung pada Pilihan Orang Lain

Bayangkan dua maskapai penerbangan yang sedang mempertimbangkan apakah akan memangkas harga tiket. Jika Maskapai A menurunkan harga tapi B tidak, A akan merebut banyak penumpang dari B. Tapi jika keduanya memangkas harga sekaligus, keduanya hanya kehilangan pendapatan tanpa ada yang lebih unggul. Maskapai A harus memutuskan — dan keputusannya tidak bisa dilepas dari antisipasi terhadap apa yang akan dilakukan B.

Inilah inti dari situasi strategis — kondisi di mana hasil yang diperoleh satu pemain bergantung bukan hanya pada pilihannya sendiri, tapi juga pada pilihan pemain lain. Ekonomi mikro klasik yang kita pelajari sebelumnya membahas konsumen dan produsen yang menghadapi harga sebagai "given" — mereka tidak perlu memikirkan reaksi orang lain. Teori permainan hadir untuk menganalisis situasi yang jauh lebih realistis dan kompleks ini.

Definisi

Teori permainan (game theory) adalah cabang matematika dan ekonomi yang mempelajari pengambilan keputusan strategis dalam situasi di mana hasil yang diperoleh satu pihak bergantung pada pilihan pihak lain. Dikembangkan oleh John von Neumann dan Oskar Morgenstern (1944), lalu diperluas secara revolusioner oleh John Nash — pemenang Nobel Ekonomi 1994 — yang merumuskan konsep keseimbangan yang menjadi fondasi seluruh bidang ini.

Teori permainan digunakan di mana-mana: oligopoli yang mempertimbangkan harga dan produksi, perundingan serikat pekerja vs. manajemen, lelang spectrum frekuensi, negosiasi diplomatik antarnegara, bahkan evolusi biologi. Di artikel ini kita fokus pada aplikasinya dalam ekonomi dan bisnis.

Sebelum masuk ke permainan yang lebih kompleks, kita perlu memahami tiga komponen dasar yang mendefinisikan setiap situasi strategis.

2. Komponen Dasar Sebuah Permainan

Setiap situasi strategis yang dianalisis teori permainan terdiri dari tiga komponen dasar:

  • Pemain (Players) — pihak-pihak yang mengambil keputusan strategis. Bisa berupa individu, perusahaan, negara, atau agen lainnya. Diasumsikan setiap pemain adalah rasional — selalu memilih strategi yang memaksimalkan payoff mereka sendiri.
  • Strategi (Strategies) — pilihan-pilihan yang tersedia bagi setiap pemain. Dalam permainan sederhana, strategi bisa berupa pilihan diskrit (tinggi/rendah, masuk/tidak masuk, kerja sama/khianat). Dalam permainan lebih kompleks, strategi bisa berupa rencana kontingen yang jauh lebih rumit.
  • Payoff — hasil atau imbalan yang diterima setiap pemain untuk setiap kombinasi strategi. Payoff bisa berupa keuntungan, utilitas, tahun penjara, atau metrik lainnya tergantung konteks.
Pengetahuan bersama (Common knowledge of rationality): Teori permainan tidak hanya mengasumsikan setiap pemain rasional — tapi juga bahwa setiap pemain tahu semua pemain lain rasional, dan tahu bahwa semua pemain lain tahu hal itu, dan seterusnya. Asumsi ini kuat dan sering tidak terpenuhi dalam praktik — namun memberi fondasi analitik yang kuat untuk memahami logika situasi strategis.
Permainan strategis hadir dalam berbagai bentuk. Memahami jenisnya membantu kita memilih alat analisis yang tepat.

3. Jenis-Jenis Permainan

🎲
Tipe 1

Permainan Simultan

Semua pemain memilih strategi secara bersamaan tanpa mengetahui pilihan lawan. Direpresentasikan dengan payoff matrix. Contoh: penetapan harga maskapai, penawaran lelang tertutup.

♟️
Tipe 2

Permainan Sekuensial

Pemain bergerak bergantian; pemain berikutnya bisa mengamati pilihan sebelumnya. Direpresentasikan dengan game tree. Contoh: catur, negosiasi gaji, keputusan masuk pasar.

🔄
Tipe 3

Permainan Berulang

Permainan dasar yang sama dimainkan berkali-kali antara pemain yang sama. Memungkinkan strategi berbasis reputasi yang mendorong kerja sama. Contoh: persaingan harga jangka panjang, hubungan bisnis berkelanjutan.

🔍
Tipe 4

Informasi Tak Lengkap

Pemain tidak mengetahui semua informasi tentang lawan — tipe, biaya, atau payoff lawan tersembunyi. Memunculkan sinyal dan penyaringan. Contoh: negosiasi dengan informasi privat, lelang dengan valuasi tersembunyi.

Kita mulai dengan permainan yang paling terkenal — sebuah skenario sederhana yang menyingkap paradoks mendalam tentang rasionalitas dan kepentingan bersama.

4. Dilema Tahanan: Permainan Paling Terkenal dalam Ekonomi

4.1 Struktur dan Payoff Matrix

Dilema tahanan diperkenalkan oleh Merrill Flood dan Melvin Dresher (1950) dan diberi nama oleh Albert Tucker. Skenario aslinya: dua tersangka ditangkap dan diinterogasi secara terpisah. Jaksa menawarkan kesepakatan kepada masing-masing: jika kamu bersaksi melawan rekanmu sementara dia diam, kamu bebas dan dia dihukum 10 tahun. Jika keduanya bersaksi, keduanya dihukum 6 tahun. Jika keduanya diam, keduanya hanya dihukum 1 tahun atas dakwaan ringan.

Tersangka B
Diam (Kerja Sama) Bersaksi (Khianat)
A: Diam A: −1 th
B: −1 th
A: −10 th
B: 0 th
A: Bersaksi A: 0 th
B: −10 th
A: −6 th ★
B: −6 th ★

★ = Nash Equilibrium. Payoff dalam tahun penjara (negatif = hukuman lebih berat)

4.2 Strategi Dominan

Analisis Strategi Dominan Tersangka A
  JIKA B MEMILIH DIAM:
    A diam     → A dihukum 1 tahun
    A bersaksi → A bebas (0 tahun) ← LEBIH BAIK

  JIKA B MEMILIH BERSAKSI:
    A diam     → A dihukum 10 tahun
    A bersaksi → A dihukum 6 tahun ← LEBIH BAIK

  Terlepas dari apa yang dilakukan B, A selalu lebih baik BERSAKSI.
  → BERSAKSI adalah STRATEGI DOMINAN bagi A
  → Logika identik berlaku untuk B
  → Kedua pemain akan memilih BERSAKSI
Strategi Dominan

Strategi dominan adalah strategi yang memberikan payoff lebih tinggi bagi pemain terlepas dari strategi apa yang dipilih lawan. Jika seorang pemain memiliki strategi dominan, ia akan selalu memilih strategi itu — tidak perlu menebak-nebak apa yang akan dilakukan lawan.

4.3 Paradoks: Rasional tapi Tidak Optimal

Paradoks dilema tahanan: Kedua pemain yang sepenuhnya rasional mencapai hasil yang lebih buruk bagi keduanya dibanding jika keduanya bekerja sama. Rasionalitas individual menghasilkan irrasionalitas kolektif.

Keduanya bersaksi → total 12 tahun penjara
Keduanya diam → total hanya 2 tahun penjara

Namun tanpa koordinasi dan kepercayaan, tidak ada yang bisa berkomitmen untuk diam.

Struktur dilema tahanan muncul di mana-mana: kartel yang ingin mempertahankan harga tinggi tapi setiap anggota tergoda curang, perlombaan senjata antarnegara, dan iklan perusahaan saingan yang keduanya lebih baik tidak beriklan tapi masing-masing takut kehilangan pangsa pasar.

Dilema tahanan hanya satu jenis permainan. John Nash merumuskan konsep keseimbangan yang lebih umum — berlaku untuk permainan apapun, tidak hanya yang memiliki strategi dominan.

5. Nash Equilibrium

5.1 Definisi dan Cara Menemukan

Nash Equilibrium

Nash Equilibrium adalah kombinasi strategi di mana tidak ada satu pun pemain yang bisa meningkatkan payoff-nya dengan mengubah strateginya secara sepihak, asalkan pemain lain mempertahankan strategi mereka. Di Nash Equilibrium, setiap pemain sedang memainkan best response terhadap strategi yang dipilih pemain lain.

Cara Menemukan Nash Equilibrium — Permainan Penetapan Harga
  LANGKAH 1: Untuk setiap kolom, tandai baris payoff tertinggi bagi A
  LANGKAH 2: Untuk setiap baris, tandai kolom payoff tertinggi bagi B
  LANGKAH 3: Sel bertanda KEDUANYA = Nash Equilibrium

  Dua Maskapai: Harga Tinggi atau Harga Rendah?

  ┌────────────────┬───────────────┬───────────────┐
  │                │  B: Harga Tinggi│ B: Harga Rendah│
  ├────────────────┼───────────────┼───────────────┤
  │ A: Harga Tinggi│  A:10, B:10   │  A: 2, B:15   │
  ├────────────────┼───────────────┼───────────────┤
  │ A: Harga Rendah│  A:15, B: 2   │  A: 5, B: 5 ★ │
  └────────────────┴───────────────┴───────────────┘

  Kolom "B Tinggi": A pilih Rendah (15 > 10) → tandai bawah
  Kolom "B Rendah": A pilih Rendah (5 > 2) → tandai bawah ★
  Baris "A Tinggi": B pilih Rendah (15 > 10) → tandai kanan
  Baris "A Rendah": B pilih Rendah (5 > 2) → tandai kanan ★

  → (Rendah, Rendah) adalah Nash Equilibrium
  Ini juga dilema tahanan: (Tinggi, Tinggi) = (10,10) lebih baik
  bagi keduanya namun tidak stabil — selalu ada godaan untuk khianat.

5.2 Permainan dengan Banyak Nash Equilibrium

Tidak semua permainan memiliki satu Nash Equilibrium. Permainan koordinasi menghasilkan lebih dari satu, karena pemain hanya peduli untuk membuat pilihan yang sama.

Pemain B
Kiri Kanan
A: Kiri A:1, B:1 ★ A:0, B:0
A: Kanan A:0, B:0 A:1, B:1 ★

Permainan Koordinasi — dua Nash Equilibrium: (Kiri, Kiri) dan (Kanan, Kanan)

Contoh nyata: standar teknologi (VHS vs. Betamax), aturan lalu lintas (mengemudi di sisi kiri atau kanan), dan standar format file. Ketika ada banyak Nash Equilibrium, pertanyaannya adalah bagaimana pemain berkoordinasi — di sinilah peran focal point Schelling, yaitu solusi yang secara budaya atau kontekstual menonjol dan membantu koordinasi tanpa komunikasi eksplisit.

5.3 Strategi Campuran (Mixed Strategy)

Beberapa permainan tidak memiliki Nash Equilibrium dalam strategi murni. John Nash membuktikan bahwa setiap permainan terhingga memiliki setidaknya satu Nash Equilibrium jika pemain diizinkan menggunakan strategi campuran — mengacak pilihan dengan probabilitas tertentu.

Contoh intuitif — Tendangan Penalti: Penyerang bisa menendang ke kiri atau kanan; kiper bisa menyelam ke kiri atau kanan. Tidak ada Nash Equilibrium strategi murni: jika penyerang selalu tendang kiri, kiper selalu selam kiri dan penyerang ingin ganti — siklus tak berujung. Nash Equilibrium terjadi ketika keduanya mengacak dengan probabilitas tertentu sehingga lawan tidak bisa mengeksploitasi pola. Studi empiris data penalti sepak bola profesional menunjukkan distribusi pilihan pemain sangat mendekati prediksi Nash Equilibrium strategi campuran.
Sejauh ini kita menganalisis permainan yang dimainkan sekali. Namun sebagian besar interaksi ekonomi bersifat berulang — dan ini mengubah dinamika strategis secara fundamental.

6. Permainan Berulang dan Kerja Sama

Dalam dilema tahanan yang dimainkan sekali, mengkhianati adalah strategi dominan. Namun jika permainan yang sama dimainkan berulang kali antara pemain yang sama, logika berubah secara dramatis.

Logika Kerja Sama dalam Permainan Berulang
  PERMAINAN SEKALI:
  Mengkhianati selalu menghasilkan payoff lebih tinggi hari ini
  → Kedua pihak mengkhianati → hasil buruk bagi keduanya

  PERMAINAN BERULANG (jumlah putaran tidak diketahui):
  Pengkhianatan hari ini → lawan akan MEMBALAS di putaran berikutnya
  → Kehilangan keuntungan kerja sama di semua putaran masa depan

  Kerja sama bisa stabil jika:
  δ (discount factor) cukup tinggi — masa depan cukup berharga

  STRATEGI TIT-FOR-TAT (Axelrod, 1984):
  Putaran 1 : Mulai dengan KERJA SAMA
  Putaran t : Lakukan apa yang lawan lakukan di putaran t-1
    → Lawan kerja sama kemarin → kerja sama hari ini
    → Lawan khianat kemarin → balas khianati hari ini
    → Lawan kembali kerja sama → maafkan, kerja sama lagi

  Mengapa tit-for-tat efektif:
  + Baik hati: mulai dengan bekerja sama
  + Provokatif: langsung membalas pengkhianatan
  + Pemaaf: tidak dendam setelah lawan berubah
  + Transparan: mudah dipahami dan diantisipasi lawan

  FOLK THEOREM: Dalam permainan berulang tanpa batas dengan
  δ cukup tinggi, hampir semua outcome yang lebih baik dari
  Nash one-shot bisa dicapai sebagai Nash Equilibrium.

Implikasi penting untuk oligopoli: perusahaan yang berinteraksi berulang kali bisa mempertahankan harga tinggi tanpa perjanjian formal — cukup dengan ancaman implisit bahwa pengurangan harga akan dibalas. Inilah tacit collusion (kolusi diam-diam): sah secara hukum karena tidak ada perjanjian eksplisit, namun menghasilkan outcome anticompetitive. Membedakan tacit collusion dari persaingan yang kebetulan menghasilkan harga serupa adalah salah satu tantangan terbesar bagi regulator persaingan usaha.

Selain dimensi waktu, banyak permainan nyata bersifat sekuensial — satu pihak bergerak lebih dulu dan pihak lain merespons setelah mengamati pilihan itu.

7. Permainan Sekuensial dan Pohon Keputusan

Dalam permainan sekuensial, urutan pengambilan keputusan menjadi krusial. Analisisnya menggunakan game tree dan solusinya ditemukan melalui backward induction — mulai dari akhir, mundur ke awal.

Game Tree: Keputusan Masuk Pasar
                     [Perusahaan Baru]
                    /                 \
               MASUK               TIDAK MASUK
              /                         \
    [Pemain Lama]                (Baru: 0, Lama: 10)
        /        \
   PERANG         DAMAI
   HARGA          HARGA
      |               |
  (Baru:−3,      (Baru: 5,
   Lama:−1)       Lama: 7)

  BACKWARD INDUCTION:
  Node [Pemain Lama]: pilih Damai (7) vs. Perang (−1)
  → Pemain Lama akan pilih DAMAI

  Node [Perusahaan Baru]: antisipasi Lama akan DAMAI
  → Baru pilih MASUK (5 > 0)

  Nash Equilibrium Sempurna: (MASUK, DAMAI)

  ANCAMAN TIDAK CREDIBLE:
  Pemain Lama mungkin mengancam akan berperang harga jika Baru masuk.
  Namun ancaman ini TIDAK CREDIBLE — jika Baru sudah masuk,
  Lama lebih baik berdamai (7 > −1). Baru tahu ini dan tidak takut.

  Untuk membuat ancaman CREDIBLE: komitmen ireversibel
  (investasi kapasitas besar yang menandakan kesungguhan berperang)
Komitmen sebagai strategi: Kemampuan membuat komitmen yang credible dan ireversibel adalah sumber kekuatan strategis dalam permainan sekuensial. Dengan "membakar jembatan" secara figuratif — membatasi pilihan sendiri — pemain bisa membuat lawan mengubah strategi mereka menjadi menguntungkan pihak yang berkomitmen. Investasi kapasitas berlebih, kontrak jangka panjang, atau keputusan lokasi yang tidak bisa dibatalkan semuanya bisa berfungsi sebagai komitmen strategis.
Dengan fondasi konseptual ini, kita bisa melihat betapa luas teori permainan diterapkan dalam ekonomi dan bisnis nyata.

8. Aplikasi dalam Ekonomi dan Bisnis

KonteksJenis PermainanInsight Utama
Oligopoli dan Penetapan Harga Dilema tahanan berulang Kolusi diam-diam bisa stabil jika perusahaan berinteraksi jangka panjang dan saling memonitor harga. Perang harga adalah ancaman yang mendisiplinkan.
Lelang Informasi tak lengkap Desain lelang menentukan insentif peserta. Lelang terbuka (English ascending) vs. tertutup menghasilkan strategi penawaran yang berbeda.
Negosiasi Sekuensial (Rubinstein) Kesabaran adalah kekuatan — pihak yang lebih sabar (discount rate lebih rendah) mendapat bagian lebih besar dari surplus negosiasi.
Masuk Pasar vs. Pencegahan Entry game sekuensial Incumbent bisa mencegah masuk dengan komitmen kapasitas berlebih yang credible. Ancaman yang tidak credible akan diabaikan pendatang rasional.
R&D dan Paten Perlombaan (Race game) Perusahaan berinvestasi R&D berlebihan untuk memenangkan paten — tragedy of the commons dalam inovasi. Terlalu banyak sumber daya terbuang untuk perlombaan satu pemenang.
Standar Teknologi Permainan koordinasi Banyak Nash Equilibrium — hasil bergantung pada siapa yang pertama membangun basis pengguna kritis melalui network effect. First-mover advantage sangat kuat.

9. Studi Kasus Indonesia

Kasus 1 · Dilema Tahanan

Perang Tarif dan Tacit Collusion Maskapai Penerbangan

Konsep: Dilema Tahanan, Tacit Collusion, Permainan Berulang

Industri penerbangan Indonesia yang didominasi beberapa maskapai besar memiliki struktur dilema tahanan yang klasik: jika semua mempertahankan harga tinggi, semua menghasilkan margin baik. Namun setiap maskapai tergoda memangkas harga untuk merebut pangsa pasar — dan jika semua melakukan itu, semua rugi.

Periode 2018–2019 menyaksikan dinamika menarik: setelah bertahun-tahun perang harga yang melemahkan semua maskapai, harga tiket tiba-tiba melonjak sangat tinggi dan mendapat kritik publik serta perhatian KPPU. KPPU menyelidiki apakah ada koordinasi eksplisit (kartel ilegal) atau hanya tacit collusion (legal). Ini adalah tantangan klasik regulasi: bagaimana membedakan paralel perilaku yang wajar dari koordinasi anticompetitive?

Pelajaran teori permainan: Dalam industri dengan sedikit pemain yang berinteraksi berulang dan bisa saling memonitor harga, tacit collusion adalah outcome yang bisa muncul secara alami tanpa perjanjian eksplisit. Regulator perlu mempertimbangkan struktur insentif industri, bukan hanya mencari bukti komunikasi langsung, untuk mengevaluasi apakah harga tinggi adalah hasil persaingan sehat atau kolusi.
Kasus 2 · Permainan Koordinasi

Standar QRIS: Solusi Pemerintah untuk Kegagalan Koordinasi

Konsep: Permainan Koordinasi, Network Effect, Focal Point, Intervensi Standarisasi

Sebelum QRIS diperkenalkan Bank Indonesia pada 2019, pasar pembayaran digital Indonesia menghadapi masalah koordinasi serius. Setiap platform — GoPay, OVO, Dana, LinkAja — menggunakan kode QR berbeda yang tidak kompatibel. Ini adalah situasi banyak Nash Equilibrium: setiap standar yang diadopsi semua pihak adalah equilibrium, namun tanpa koordinasi semua stuck dengan standar berbeda yang tidak efisien.

Bank Indonesia menyelesaikan kegagalan koordinasi ini dengan menetapkan QRIS sebagai standar wajib — bertindak sebagai otoritas eksternal yang memilih satu dari sekian Nash Equilibrium. Hasilnya: QRIS mencapai lebih dari 30 juta merchant pada 2023, ekosistem pembayaran digital meledak, dan biaya transaksi turun signifikan untuk pedagang kecil.

Pelajaran permainan koordinasi: Ketika pasar memiliki banyak Nash Equilibrium yang setara secara teknis, intervensi pemerintah untuk memilih satu standar bisa meningkatkan kesejahteraan semua pihak. Nilai QRIS bukan pada standar itu sendiri, melainkan pada koordinasi yang dihasilkannya — network effect yang membuat ekosistem jauh lebih berharga dari sebelumnya.
Kasus 3 · Permainan Sekuensial

Tokopedia vs. Shopee: First-Mover vs. Second-Mover Advantage

Konsep: First-Mover Advantage, Permainan Sekuensial, Komitmen Strategis

Tokopedia adalah first-mover e-commerce Indonesia (2009) yang membangun basis pengguna awal kuat. Shopee masuk jauh kemudian (2015) sebagai late-mover, namun dengan strategi berbeda: investasi masif dalam subsidi pengiriman, gamifikasi, dan live-streaming yang tidak dimiliki Tokopedia saat itu.

Studi kasus ini memperlihatkan bahwa first-mover advantage tidak otomatis menentukan siapa yang menang. Second-mover dengan sumber daya lebih besar dan strategi diferensiasi yang tepat bisa mengimbangi bahkan mengungguli first-mover. Shopee akhirnya melampaui Tokopedia dalam GMV. Komitmen strategis Shopee — investasi besar yang menandakan keseriusan dan menunjukkan mereka tidak akan menyerah meski merugi di awal — adalah sinyal credible yang mempengaruhi respons pesaing.

Pelajaran permainan sekuensial: First-mover advantage sangat kuat ketika pasar memiliki network effect kuat dan biaya berpindah tinggi. Namun bisa diimbangi oleh second-mover yang membawa inovasi dan sumber daya signifikan. Komitmen strategis yang mahal dan terlihat adalah sinyal credible tentang intensi jangka panjang.
Kasus 4 · Permainan Berulang

Hubungan Industrial: Serikat Pekerja vs. Manajemen

Konsep: Permainan Berulang, Reputasi, Tit-for-Tat, Bargaining

Negosiasi upah antara serikat pekerja dan manajemen adalah permainan berulang yang dimainkan setiap tahun. Strukturnya adalah tawar-menawar tentang surplus perusahaan — berapa masuk ke upah pekerja dan berapa ke laba pemilik. Karena negosiasi ini berulang, reputasi menjadi sangat penting.

Manajemen yang selalu menekan upah hingga minimum legal akan menghadapi mogok kerja, moral yang rendah, dan turnover tinggi — memperburuk produktivitas jangka panjang. Serikat yang selalu menuntut di luar kemampuan perusahaan berisiko penutupan pabrik atau relokasi. Hubungan industrial yang sehat — di mana kedua pihak menghormati kepentingan jangka panjang satu sama lain — adalah outcome dari permainan berulang yang berjalan baik dengan strategi tit-for-tat yang diadopsi secara implisit.

Pelajaran permainan berulang: Dalam hubungan jangka panjang, reputasi adalah aset sangat berharga. Mengambil keuntungan jangka pendek dengan mengkhianati kepercayaan partner menghancurkan reputasi dan mengurangi nilai semua interaksi masa depan. Strategi tit-for-tat yang kooperatif tapi responsif terhadap provokasi menstabilkan hubungan industrial yang saling menguntungkan.

Teori permainan mengubah cara kita melihat konflik dan kerja sama — bukan sebagai fenomena moral, tapi sebagai hasil dari insentif dan informasi yang terstruktur. Dari negosiasi bisnis hingga kebijakan internasional, kerangka ini membantu memprediksi perilaku dan merancang mekanisme yang menghasilkan kerja sama bahkan ketika kepentingan individual mendorong ke arah sebaliknya.

10. Pertanyaan yang Sering Ditanyakan (FAQ)

Apa itu teori permainan dalam ekonomi?
Teori permainan adalah cabang matematika dan ekonomi yang mempelajari pengambilan keputusan strategis — situasi di mana hasil yang diperoleh satu pihak bergantung tidak hanya pada pilihannya sendiri, tapi juga pada pilihan pihak lain. Dikembangkan oleh Von Neumann dan Morgenstern (1944) lalu diperluas oleh John Nash (Nobel 1994). Digunakan untuk menganalisis persaingan oligopoli, negosiasi, lelang, strategi bisnis, kebijakan publik, dan banyak situasi sosial lainnya.
Apa itu Nash Equilibrium dan bagaimana cara menemukannya?
Nash Equilibrium adalah kombinasi strategi di mana tidak ada pemain yang bisa meningkatkan payoff-nya dengan mengubah strategi secara sepihak, asalkan pemain lain tidak berubah. Cara menemukannya: untuk setiap kolom, tandai baris dengan payoff tertinggi bagi pemain baris; untuk setiap baris, tandai kolom dengan payoff tertinggi bagi pemain kolom. Sel yang mendapat tanda dari kedua pemain adalah Nash Equilibrium. Setiap permainan terhingga memiliki setidaknya satu Nash Equilibrium dalam strategi murni atau campuran.
Apa perbedaan strategi dominan dan Nash Equilibrium?
Strategi dominan memberikan payoff lebih tinggi terlepas dari strategi lawan — selalu menjadi pilihan terbaik dalam kondisi apapun. Nash Equilibrium lebih lemah: setiap pemain memilih best response terhadap strategi yang dipilih lawan. Jika semua pemain memiliki strategi dominan, kombinasinya otomatis menjadi Nash Equilibrium. Namun Nash Equilibrium bisa ada meski tidak ada strategi dominan. Setiap kombinasi strategi dominan adalah Nash Equilibrium, tapi tidak sebaliknya.
Mengapa hasil dilema tahanan tidak efisien meski kedua pemain rasional?
Karena setiap pemain membuat keputusan secara individual tanpa koordinasi. Mengkhianati adalah strategi dominan bagi keduanya sehingga keduanya mengkhianati — mencapai Nash Equilibrium. Namun hasil ini lebih buruk dari jika keduanya berhasil berkoordinasi untuk sama-sama diam. Paradoks intinya: rasionalitas individual menghasilkan irrasionalitas kolektif. Struktur yang sama muncul dalam banyak kegagalan pasar — eksternalitas, tragedy of the commons, dan perlombaan senjata antarnegara.
Bagaimana permainan berulang bisa memunculkan kerja sama?
Dalam permainan berulang, pengkhianatan hari ini bisa dibalas di putaran berikutnya — kehilangan keuntungan kerja sama di semua putaran masa depan. Jika nilai interaksi masa depan cukup tinggi, insentif untuk bekerja sama menjadi kuat. Strategi tit-for-tat — mulai kooperatif, lalu lakukan apa yang lawan lakukan di putaran sebelumnya — terbukti sangat efektif karena baik hati, provokatif, pemaaf, dan transparan. Folk Theorem menyatakan hampir semua outcome yang lebih baik dari Nash one-shot bisa dicapai sebagai equilibrium dalam permainan berulang yang cukup sabar.
Apa itu keunggulan first-mover dalam permainan sekuensial?
Dalam permainan sekuensial, pemain pertama kadang memiliki keunggulan karena bisa menggunakan komitmen untuk membatasi pilihan lawan. Dalam model Stackelberg, pemimpin yang menentukan output lebih dulu menghasilkan output lebih besar dan keuntungan lebih tinggi. Namun first-mover advantage tidak selalu terjadi — ada situasi di mana second-mover lebih menguntungkan karena bisa melihat pilihan lawan dan merespons optimal. Keunggulan first-mover sangat kuat ketika pasar memiliki network effect kuat dan biaya berpindah tinggi.

📚 Referensi & Sumber

  • 1
    Nash, J.F. — "Non-Cooperative Games" (1951) Annals of Mathematics, Vol. 54, No. 2. Makalah seminal yang memperkenalkan konsep Nash Equilibrium — salah satu kontribusi paling berpengaruh dalam sejarah ekonomi, yang memberi Nash Nobel pada 1994.
  • 2
    Pindyck, R.S. & Rubinfeld, D.L. — Microeconomics (9th ed.) Pearson Education, 2018. Bab 13: Game Theory and Competitive Strategy. Pengantar teori permainan dalam konteks ekonomi mikro dengan aplikasi bisnis yang kaya.
  • 3
    Axelrod, R. — The Evolution of Cooperation (1984) Basic Books. Karya klasik yang menunjukkan bagaimana kerja sama bisa berkembang dalam populasi agen egois melalui kompetisi strategi tit-for-tat dalam simulasi dilema tahanan berulang.
  • 4
    Dixit, A.K. & Nalebuff, B.J. — Thinking Strategically (1991) W.W. Norton. Pengantar teori permainan paling aksesibel dan kaya contoh — mengajarkan logika strategis melalui kasus nyata dari bisnis, politik, dan kehidupan sehari-hari.
  • 5
    Bank Indonesia — Laporan Perkembangan QRIS (berbagai tahun) Data adopsi QRIS, jumlah merchant, dan nilai transaksi — basis studi kasus permainan koordinasi dalam ekosistem pembayaran digital Indonesia.
    bi.go.id
  • 6
    Osborne, M.J. — An Introduction to Game Theory (2004) Oxford University Press. Teks standar teori permainan tingkat sarjana yang membangun dari definisi dasar hingga permainan berulang, sekuensial, dan informasi tak lengkap secara sistematis.

Ringkasan: Apa yang Sudah Kita Pelajari

  • Teori permainan menganalisis situasi strategis di mana hasil satu pemain bergantung pada pilihan pemain lain. Komponen dasar: pemain, strategi, dan payoff.
  • Strategi dominan memberikan payoff lebih tinggi terlepas dari strategi lawan. Kombinasi strategi dominan semua pemain otomatis menjadi Nash Equilibrium.
  • Dilema tahanan: keduanya memiliki strategi dominan untuk mengkhianati, namun hasil Nash Equilibrium lebih buruk dari jika keduanya bekerja sama — paradoks rasionalitas individual vs. kolektif.
  • Nash Equilibrium: tidak ada pemain yang bisa meningkatkan payoff dengan mengubah strategi sepihak. Setiap permainan terhingga memiliki minimal satu NE dalam strategi murni atau campuran.
  • Permainan koordinasi memiliki banyak Nash Equilibrium. Focal point dan intervensi standarisasi membantu pemain berkoordinasi ke satu equilibrium yang efisien.
  • Permainan berulang memungkinkan kerja sama melalui ancaman balas dendam di masa depan. Strategi tit-for-tat sangat efektif: baik hati, provokatif, pemaaf, transparan.
  • Backward induction dalam permainan sekuensial: selesaikan dari akhir mundur ke awal. Ancaman tidak credible diabaikan — komitmen ireversibel membuat ancaman credible.
  • Tacit collusion bisa muncul alami dalam oligopoli berulang tanpa perjanjian eksplisit — tantangan utama bagi regulator persaingan usaha.

Posting Komentar

0 Komentar