Bagaimana seseorang membuat keputusan terbaik ketika hasilnya bergantung pada keputusan orang lain — yang juga sedang mempertimbangkan keputusanmu? Itulah pertanyaan inti teori permainan. Dari dilema tahanan hingga perang harga antar perusahaan, teori ini memberikan kerangka formal yang sangat berguna untuk menganalisis situasi strategis di mana kepentingan individual dan kolektif sering bertabrakan.
1. Ketika Hasil Bergantung pada Pilihan Orang Lain
Bayangkan dua maskapai penerbangan yang sedang mempertimbangkan apakah akan memangkas harga tiket. Jika Maskapai A menurunkan harga tapi B tidak, A akan merebut banyak penumpang dari B. Tapi jika keduanya memangkas harga sekaligus, keduanya hanya kehilangan pendapatan tanpa ada yang lebih unggul. Maskapai A harus memutuskan — dan keputusannya tidak bisa dilepas dari antisipasi terhadap apa yang akan dilakukan B.
Inilah inti dari situasi strategis — kondisi di mana hasil yang diperoleh satu pemain bergantung bukan hanya pada pilihannya sendiri, tapi juga pada pilihan pemain lain. Ekonomi mikro klasik yang kita pelajari sebelumnya membahas konsumen dan produsen yang menghadapi harga sebagai "given" — mereka tidak perlu memikirkan reaksi orang lain. Teori permainan hadir untuk menganalisis situasi yang jauh lebih realistis dan kompleks ini.
Teori permainan (game theory) adalah cabang matematika dan ekonomi yang mempelajari pengambilan keputusan strategis dalam situasi di mana hasil yang diperoleh satu pihak bergantung pada pilihan pihak lain. Dikembangkan oleh John von Neumann dan Oskar Morgenstern (1944), lalu diperluas secara revolusioner oleh John Nash — pemenang Nobel Ekonomi 1994 — yang merumuskan konsep keseimbangan yang menjadi fondasi seluruh bidang ini.
Teori permainan digunakan di mana-mana: oligopoli yang mempertimbangkan harga dan produksi, perundingan serikat pekerja vs. manajemen, lelang spectrum frekuensi, negosiasi diplomatik antarnegara, bahkan evolusi biologi. Di artikel ini kita fokus pada aplikasinya dalam ekonomi dan bisnis.
2. Komponen Dasar Sebuah Permainan
Setiap situasi strategis yang dianalisis teori permainan terdiri dari tiga komponen dasar:
- Pemain (Players) — pihak-pihak yang mengambil keputusan strategis. Bisa berupa individu, perusahaan, negara, atau agen lainnya. Diasumsikan setiap pemain adalah rasional — selalu memilih strategi yang memaksimalkan payoff mereka sendiri.
- Strategi (Strategies) — pilihan-pilihan yang tersedia bagi setiap pemain. Dalam permainan sederhana, strategi bisa berupa pilihan diskrit (tinggi/rendah, masuk/tidak masuk, kerja sama/khianat). Dalam permainan lebih kompleks, strategi bisa berupa rencana kontingen yang jauh lebih rumit.
- Payoff — hasil atau imbalan yang diterima setiap pemain untuk setiap kombinasi strategi. Payoff bisa berupa keuntungan, utilitas, tahun penjara, atau metrik lainnya tergantung konteks.
3. Jenis-Jenis Permainan
Permainan Simultan
Semua pemain memilih strategi secara bersamaan tanpa mengetahui pilihan lawan. Direpresentasikan dengan payoff matrix. Contoh: penetapan harga maskapai, penawaran lelang tertutup.
Permainan Sekuensial
Pemain bergerak bergantian; pemain berikutnya bisa mengamati pilihan sebelumnya. Direpresentasikan dengan game tree. Contoh: catur, negosiasi gaji, keputusan masuk pasar.
Permainan Berulang
Permainan dasar yang sama dimainkan berkali-kali antara pemain yang sama. Memungkinkan strategi berbasis reputasi yang mendorong kerja sama. Contoh: persaingan harga jangka panjang, hubungan bisnis berkelanjutan.
Informasi Tak Lengkap
Pemain tidak mengetahui semua informasi tentang lawan — tipe, biaya, atau payoff lawan tersembunyi. Memunculkan sinyal dan penyaringan. Contoh: negosiasi dengan informasi privat, lelang dengan valuasi tersembunyi.
4. Dilema Tahanan: Permainan Paling Terkenal dalam Ekonomi
4.1 Struktur dan Payoff Matrix
Dilema tahanan diperkenalkan oleh Merrill Flood dan Melvin Dresher (1950) dan diberi nama oleh Albert Tucker. Skenario aslinya: dua tersangka ditangkap dan diinterogasi secara terpisah. Jaksa menawarkan kesepakatan kepada masing-masing: jika kamu bersaksi melawan rekanmu sementara dia diam, kamu bebas dan dia dihukum 10 tahun. Jika keduanya bersaksi, keduanya dihukum 6 tahun. Jika keduanya diam, keduanya hanya dihukum 1 tahun atas dakwaan ringan.
| Tersangka B | ||
|---|---|---|
| Diam (Kerja Sama) | Bersaksi (Khianat) | |
| A: Diam | A: −1 th B: −1 th |
A: −10 th B: 0 th |
| A: Bersaksi | A: 0 th B: −10 th |
A: −6 th ★ B: −6 th ★ |
★ = Nash Equilibrium. Payoff dalam tahun penjara (negatif = hukuman lebih berat)
4.2 Strategi Dominan
JIKA B MEMILIH DIAM:
A diam → A dihukum 1 tahun
A bersaksi → A bebas (0 tahun) ← LEBIH BAIK
JIKA B MEMILIH BERSAKSI:
A diam → A dihukum 10 tahun
A bersaksi → A dihukum 6 tahun ← LEBIH BAIK
Terlepas dari apa yang dilakukan B, A selalu lebih baik BERSAKSI.
→ BERSAKSI adalah STRATEGI DOMINAN bagi A
→ Logika identik berlaku untuk B
→ Kedua pemain akan memilih BERSAKSI
Strategi dominan adalah strategi yang memberikan payoff lebih tinggi bagi pemain terlepas dari strategi apa yang dipilih lawan. Jika seorang pemain memiliki strategi dominan, ia akan selalu memilih strategi itu — tidak perlu menebak-nebak apa yang akan dilakukan lawan.
4.3 Paradoks: Rasional tapi Tidak Optimal
Keduanya bersaksi → total 12 tahun penjara
Keduanya diam → total hanya 2 tahun penjara
Namun tanpa koordinasi dan kepercayaan, tidak ada yang bisa berkomitmen untuk diam.
Struktur dilema tahanan muncul di mana-mana: kartel yang ingin mempertahankan harga tinggi tapi setiap anggota tergoda curang, perlombaan senjata antarnegara, dan iklan perusahaan saingan yang keduanya lebih baik tidak beriklan tapi masing-masing takut kehilangan pangsa pasar.
5. Nash Equilibrium
5.1 Definisi dan Cara Menemukan
Nash Equilibrium adalah kombinasi strategi di mana tidak ada satu pun pemain yang bisa meningkatkan payoff-nya dengan mengubah strateginya secara sepihak, asalkan pemain lain mempertahankan strategi mereka. Di Nash Equilibrium, setiap pemain sedang memainkan best response terhadap strategi yang dipilih pemain lain.
LANGKAH 1: Untuk setiap kolom, tandai baris payoff tertinggi bagi A LANGKAH 2: Untuk setiap baris, tandai kolom payoff tertinggi bagi B LANGKAH 3: Sel bertanda KEDUANYA = Nash Equilibrium Dua Maskapai: Harga Tinggi atau Harga Rendah? ┌────────────────┬───────────────┬───────────────┐ │ │ B: Harga Tinggi│ B: Harga Rendah│ ├────────────────┼───────────────┼───────────────┤ │ A: Harga Tinggi│ A:10, B:10 │ A: 2, B:15 │ ├────────────────┼───────────────┼───────────────┤ │ A: Harga Rendah│ A:15, B: 2 │ A: 5, B: 5 ★ │ └────────────────┴───────────────┴───────────────┘ Kolom "B Tinggi": A pilih Rendah (15 > 10) → tandai bawah Kolom "B Rendah": A pilih Rendah (5 > 2) → tandai bawah ★ Baris "A Tinggi": B pilih Rendah (15 > 10) → tandai kanan Baris "A Rendah": B pilih Rendah (5 > 2) → tandai kanan ★ → (Rendah, Rendah) adalah Nash Equilibrium Ini juga dilema tahanan: (Tinggi, Tinggi) = (10,10) lebih baik bagi keduanya namun tidak stabil — selalu ada godaan untuk khianat.
5.2 Permainan dengan Banyak Nash Equilibrium
Tidak semua permainan memiliki satu Nash Equilibrium. Permainan koordinasi menghasilkan lebih dari satu, karena pemain hanya peduli untuk membuat pilihan yang sama.
| Pemain B | ||
|---|---|---|
| Kiri | Kanan | |
| A: Kiri | A:1, B:1 ★ | A:0, B:0 |
| A: Kanan | A:0, B:0 | A:1, B:1 ★ |
Permainan Koordinasi — dua Nash Equilibrium: (Kiri, Kiri) dan (Kanan, Kanan)
Contoh nyata: standar teknologi (VHS vs. Betamax), aturan lalu lintas (mengemudi di sisi kiri atau kanan), dan standar format file. Ketika ada banyak Nash Equilibrium, pertanyaannya adalah bagaimana pemain berkoordinasi — di sinilah peran focal point Schelling, yaitu solusi yang secara budaya atau kontekstual menonjol dan membantu koordinasi tanpa komunikasi eksplisit.
5.3 Strategi Campuran (Mixed Strategy)
Beberapa permainan tidak memiliki Nash Equilibrium dalam strategi murni. John Nash membuktikan bahwa setiap permainan terhingga memiliki setidaknya satu Nash Equilibrium jika pemain diizinkan menggunakan strategi campuran — mengacak pilihan dengan probabilitas tertentu.
6. Permainan Berulang dan Kerja Sama
Dalam dilema tahanan yang dimainkan sekali, mengkhianati adalah strategi dominan. Namun jika permainan yang sama dimainkan berulang kali antara pemain yang sama, logika berubah secara dramatis.
PERMAINAN SEKALI:
Mengkhianati selalu menghasilkan payoff lebih tinggi hari ini
→ Kedua pihak mengkhianati → hasil buruk bagi keduanya
PERMAINAN BERULANG (jumlah putaran tidak diketahui):
Pengkhianatan hari ini → lawan akan MEMBALAS di putaran berikutnya
→ Kehilangan keuntungan kerja sama di semua putaran masa depan
Kerja sama bisa stabil jika:
δ (discount factor) cukup tinggi — masa depan cukup berharga
STRATEGI TIT-FOR-TAT (Axelrod, 1984):
Putaran 1 : Mulai dengan KERJA SAMA
Putaran t : Lakukan apa yang lawan lakukan di putaran t-1
→ Lawan kerja sama kemarin → kerja sama hari ini
→ Lawan khianat kemarin → balas khianati hari ini
→ Lawan kembali kerja sama → maafkan, kerja sama lagi
Mengapa tit-for-tat efektif:
+ Baik hati: mulai dengan bekerja sama
+ Provokatif: langsung membalas pengkhianatan
+ Pemaaf: tidak dendam setelah lawan berubah
+ Transparan: mudah dipahami dan diantisipasi lawan
FOLK THEOREM: Dalam permainan berulang tanpa batas dengan
δ cukup tinggi, hampir semua outcome yang lebih baik dari
Nash one-shot bisa dicapai sebagai Nash Equilibrium.
Implikasi penting untuk oligopoli: perusahaan yang berinteraksi berulang kali bisa mempertahankan harga tinggi tanpa perjanjian formal — cukup dengan ancaman implisit bahwa pengurangan harga akan dibalas. Inilah tacit collusion (kolusi diam-diam): sah secara hukum karena tidak ada perjanjian eksplisit, namun menghasilkan outcome anticompetitive. Membedakan tacit collusion dari persaingan yang kebetulan menghasilkan harga serupa adalah salah satu tantangan terbesar bagi regulator persaingan usaha.
7. Permainan Sekuensial dan Pohon Keputusan
Dalam permainan sekuensial, urutan pengambilan keputusan menjadi krusial. Analisisnya menggunakan game tree dan solusinya ditemukan melalui backward induction — mulai dari akhir, mundur ke awal.
[Perusahaan Baru]
/ \
MASUK TIDAK MASUK
/ \
[Pemain Lama] (Baru: 0, Lama: 10)
/ \
PERANG DAMAI
HARGA HARGA
| |
(Baru:−3, (Baru: 5,
Lama:−1) Lama: 7)
BACKWARD INDUCTION:
Node [Pemain Lama]: pilih Damai (7) vs. Perang (−1)
→ Pemain Lama akan pilih DAMAI
Node [Perusahaan Baru]: antisipasi Lama akan DAMAI
→ Baru pilih MASUK (5 > 0)
Nash Equilibrium Sempurna: (MASUK, DAMAI)
ANCAMAN TIDAK CREDIBLE:
Pemain Lama mungkin mengancam akan berperang harga jika Baru masuk.
Namun ancaman ini TIDAK CREDIBLE — jika Baru sudah masuk,
Lama lebih baik berdamai (7 > −1). Baru tahu ini dan tidak takut.
Untuk membuat ancaman CREDIBLE: komitmen ireversibel
(investasi kapasitas besar yang menandakan kesungguhan berperang)
8. Aplikasi dalam Ekonomi dan Bisnis
| Konteks | Jenis Permainan | Insight Utama |
|---|---|---|
| Oligopoli dan Penetapan Harga | Dilema tahanan berulang | Kolusi diam-diam bisa stabil jika perusahaan berinteraksi jangka panjang dan saling memonitor harga. Perang harga adalah ancaman yang mendisiplinkan. |
| Lelang | Informasi tak lengkap | Desain lelang menentukan insentif peserta. Lelang terbuka (English ascending) vs. tertutup menghasilkan strategi penawaran yang berbeda. |
| Negosiasi | Sekuensial (Rubinstein) | Kesabaran adalah kekuatan — pihak yang lebih sabar (discount rate lebih rendah) mendapat bagian lebih besar dari surplus negosiasi. |
| Masuk Pasar vs. Pencegahan | Entry game sekuensial | Incumbent bisa mencegah masuk dengan komitmen kapasitas berlebih yang credible. Ancaman yang tidak credible akan diabaikan pendatang rasional. |
| R&D dan Paten | Perlombaan (Race game) | Perusahaan berinvestasi R&D berlebihan untuk memenangkan paten — tragedy of the commons dalam inovasi. Terlalu banyak sumber daya terbuang untuk perlombaan satu pemenang. |
| Standar Teknologi | Permainan koordinasi | Banyak Nash Equilibrium — hasil bergantung pada siapa yang pertama membangun basis pengguna kritis melalui network effect. First-mover advantage sangat kuat. |
9. Studi Kasus Indonesia
Perang Tarif dan Tacit Collusion Maskapai Penerbangan
Industri penerbangan Indonesia yang didominasi beberapa maskapai besar memiliki struktur dilema tahanan yang klasik: jika semua mempertahankan harga tinggi, semua menghasilkan margin baik. Namun setiap maskapai tergoda memangkas harga untuk merebut pangsa pasar — dan jika semua melakukan itu, semua rugi.
Periode 2018–2019 menyaksikan dinamika menarik: setelah bertahun-tahun perang harga yang melemahkan semua maskapai, harga tiket tiba-tiba melonjak sangat tinggi dan mendapat kritik publik serta perhatian KPPU. KPPU menyelidiki apakah ada koordinasi eksplisit (kartel ilegal) atau hanya tacit collusion (legal). Ini adalah tantangan klasik regulasi: bagaimana membedakan paralel perilaku yang wajar dari koordinasi anticompetitive?
Standar QRIS: Solusi Pemerintah untuk Kegagalan Koordinasi
Sebelum QRIS diperkenalkan Bank Indonesia pada 2019, pasar pembayaran digital Indonesia menghadapi masalah koordinasi serius. Setiap platform — GoPay, OVO, Dana, LinkAja — menggunakan kode QR berbeda yang tidak kompatibel. Ini adalah situasi banyak Nash Equilibrium: setiap standar yang diadopsi semua pihak adalah equilibrium, namun tanpa koordinasi semua stuck dengan standar berbeda yang tidak efisien.
Bank Indonesia menyelesaikan kegagalan koordinasi ini dengan menetapkan QRIS sebagai standar wajib — bertindak sebagai otoritas eksternal yang memilih satu dari sekian Nash Equilibrium. Hasilnya: QRIS mencapai lebih dari 30 juta merchant pada 2023, ekosistem pembayaran digital meledak, dan biaya transaksi turun signifikan untuk pedagang kecil.
Tokopedia vs. Shopee: First-Mover vs. Second-Mover Advantage
Tokopedia adalah first-mover e-commerce Indonesia (2009) yang membangun basis pengguna awal kuat. Shopee masuk jauh kemudian (2015) sebagai late-mover, namun dengan strategi berbeda: investasi masif dalam subsidi pengiriman, gamifikasi, dan live-streaming yang tidak dimiliki Tokopedia saat itu.
Studi kasus ini memperlihatkan bahwa first-mover advantage tidak otomatis menentukan siapa yang menang. Second-mover dengan sumber daya lebih besar dan strategi diferensiasi yang tepat bisa mengimbangi bahkan mengungguli first-mover. Shopee akhirnya melampaui Tokopedia dalam GMV. Komitmen strategis Shopee — investasi besar yang menandakan keseriusan dan menunjukkan mereka tidak akan menyerah meski merugi di awal — adalah sinyal credible yang mempengaruhi respons pesaing.
Hubungan Industrial: Serikat Pekerja vs. Manajemen
Negosiasi upah antara serikat pekerja dan manajemen adalah permainan berulang yang dimainkan setiap tahun. Strukturnya adalah tawar-menawar tentang surplus perusahaan — berapa masuk ke upah pekerja dan berapa ke laba pemilik. Karena negosiasi ini berulang, reputasi menjadi sangat penting.
Manajemen yang selalu menekan upah hingga minimum legal akan menghadapi mogok kerja, moral yang rendah, dan turnover tinggi — memperburuk produktivitas jangka panjang. Serikat yang selalu menuntut di luar kemampuan perusahaan berisiko penutupan pabrik atau relokasi. Hubungan industrial yang sehat — di mana kedua pihak menghormati kepentingan jangka panjang satu sama lain — adalah outcome dari permainan berulang yang berjalan baik dengan strategi tit-for-tat yang diadopsi secara implisit.
Teori permainan mengubah cara kita melihat konflik dan kerja sama — bukan sebagai fenomena moral, tapi sebagai hasil dari insentif dan informasi yang terstruktur. Dari negosiasi bisnis hingga kebijakan internasional, kerangka ini membantu memprediksi perilaku dan merancang mekanisme yang menghasilkan kerja sama bahkan ketika kepentingan individual mendorong ke arah sebaliknya.
10. Pertanyaan yang Sering Ditanyakan (FAQ)
📚 Referensi & Sumber
-
1Nash, J.F. — "Non-Cooperative Games" (1951) Annals of Mathematics, Vol. 54, No. 2. Makalah seminal yang memperkenalkan konsep Nash Equilibrium — salah satu kontribusi paling berpengaruh dalam sejarah ekonomi, yang memberi Nash Nobel pada 1994.
-
2Pindyck, R.S. & Rubinfeld, D.L. — Microeconomics (9th ed.) Pearson Education, 2018. Bab 13: Game Theory and Competitive Strategy. Pengantar teori permainan dalam konteks ekonomi mikro dengan aplikasi bisnis yang kaya.
-
3Axelrod, R. — The Evolution of Cooperation (1984) Basic Books. Karya klasik yang menunjukkan bagaimana kerja sama bisa berkembang dalam populasi agen egois melalui kompetisi strategi tit-for-tat dalam simulasi dilema tahanan berulang.
-
4Dixit, A.K. & Nalebuff, B.J. — Thinking Strategically (1991) W.W. Norton. Pengantar teori permainan paling aksesibel dan kaya contoh — mengajarkan logika strategis melalui kasus nyata dari bisnis, politik, dan kehidupan sehari-hari.
-
5Bank Indonesia — Laporan Perkembangan QRIS (berbagai tahun) Data adopsi QRIS, jumlah merchant, dan nilai transaksi — basis studi kasus permainan koordinasi dalam ekosistem pembayaran digital Indonesia.
bi.go.id -
6Osborne, M.J. — An Introduction to Game Theory (2004) Oxford University Press. Teks standar teori permainan tingkat sarjana yang membangun dari definisi dasar hingga permainan berulang, sekuensial, dan informasi tak lengkap secara sistematis.
Ringkasan: Apa yang Sudah Kita Pelajari
- Teori permainan menganalisis situasi strategis di mana hasil satu pemain bergantung pada pilihan pemain lain. Komponen dasar: pemain, strategi, dan payoff.
- Strategi dominan memberikan payoff lebih tinggi terlepas dari strategi lawan. Kombinasi strategi dominan semua pemain otomatis menjadi Nash Equilibrium.
- Dilema tahanan: keduanya memiliki strategi dominan untuk mengkhianati, namun hasil Nash Equilibrium lebih buruk dari jika keduanya bekerja sama — paradoks rasionalitas individual vs. kolektif.
- Nash Equilibrium: tidak ada pemain yang bisa meningkatkan payoff dengan mengubah strategi sepihak. Setiap permainan terhingga memiliki minimal satu NE dalam strategi murni atau campuran.
- Permainan koordinasi memiliki banyak Nash Equilibrium. Focal point dan intervensi standarisasi membantu pemain berkoordinasi ke satu equilibrium yang efisien.
- Permainan berulang memungkinkan kerja sama melalui ancaman balas dendam di masa depan. Strategi tit-for-tat sangat efektif: baik hati, provokatif, pemaaf, transparan.
- Backward induction dalam permainan sekuensial: selesaikan dari akhir mundur ke awal. Ancaman tidak credible diabaikan — komitmen ireversibel membuat ancaman credible.
- Tacit collusion bisa muncul alami dalam oligopoli berulang tanpa perjanjian eksplisit — tantangan utama bagi regulator persaingan usaha.
0 Komentar
Punya pertanyaan? Silahkan komen dibawah.