Peluang Kemenangan Di Sebuah Prediksi
Masalah umum yang dihadapi oleh analis data Prediksi adalah memutuskan ukuran sampel yang diperlukan .
Ini dapat diperkirakan dengan menggunakan berbagai fungsi penghitungan dan distribusi. Namun, bahkan jika seorang ahli statistik sudah tersedia, jawabannya belum tentu mudah, dan tentu saja tidak mudah dimengerti.
Ukuran sampel yang tepat tergantung pada berbagai parameter desain penelitian: perbedaan minimum yang diharapkan; variabilitas pengukuran; kekuatan statistik yang diinginkan; kriteria signifikansi, dll.
Saya tidak ingin terlalu memperumit masalah dan mencoba menjelaskan secara terperinci apa arti terminologi di atas. Google hanya mencari beberapa dari kata-kata ini untuk menyelam lebih dalam dan lebih mengerti.
Dalam pelajaran matematika sekolah Anda, Anda mungkin telah belajar bahwa ukuran sampel penting. Ini benar! Tetapi apa yang pada dasarnya tidak diajarkan di sekolah, karena mungkin telah membebani pelajaran (dan bahkan beberapa otak!) , Adalah bahwa ukuran sampel yang lebih besar tidak selalu berarti tingkat kepercayaan yang lebih tinggi (= tingkat kepastian) .
Karenanya, kita sering ditanya oleh pembaca:
Berapa banyak set data yang benar-benar diperlukan untuk mencapai tingkat akurasi yang baik?
Dengan kata lain, berapa banyak kecocokan yang perlu saya analisis untuk prediksi yang akurat?
Analisis liga terkecil yang kami tawarkan untuk dijual, Swiss Super League, mencakup semua 882 pertandingan yang dimainkan dalam lima musim terakhir. Secara matematis, menganalisis set data ini akan menghasilkan estimasi dan prediksi dalam interval kepercayaan 3,3% .
Liga terbesar, Liga Inggris Satu dan Kejuaraan, keduanya berisi 2.760 pertandingan. Analisis statistik dari data ini akan menghasilkan perhitungan di bawah tingkat kesalahan standar 1% , dan interval kepercayaan 1,8% , yang lebih dari dapat diterima.
Setiap periode yang lebih lama, misalnya, melihat data lebih dari lima musim, menurut pendapat kami , tidak perlu , setidaknya untuk simulasi dan strategi HDA.
Menumpuk pada lebih banyak set data kemungkinan tidak akan membuat peningkatan signifikan pada kesalahan standar atau interval kepercayaan.
Data lima musim benar-benar cukup; bahkan tiga musim melakukan pekerjaan yang cukup akurat untuk banyak liga, dan kalkulator nilai kami bahkan didasarkan pada 25 pertandingan terakhir saja (= bahkan 2 musim) .
(2) Kalkulator Nilai Taruhan untuk Pertandingan Liga dengan Sejarah Head-to-Head (grad)
Setelah perhitungan peluang dipahami menggunakan lima musim data maka peluang untuk menyederhanakan muncul.
Untuk memprediksi distribusi dengan akurasi yang cukup untuk subset pertandingan tertentu, tidak selalu diperlukan untuk melakukan seluruh rangkaian perhitungan lengkap. The Benar Odds kalkulator & Nilai detektor Bet untuk Liga Game dengan sejarah H2H hanya seperti contoh.
Menggunakan 25 pertandingan terakhir plus pertandingan untuk pertandingan liga adalah semacam "perhitungan back-of-the-envelope", atau snapshot dari data yang sebanding. Itu tidak membahas pertandingan yang tidak begitu mudah untuk dihitung (misalnya pertandingan piala, perlengkapan klub internasional, pertandingan tanpa sejarah pertandingan, pertandingan antar tim tanpa sejarah bermain di liga yang sama, dll . ) .
Rasi bintang permainan ini mungkin tidak hanya membutuhkan ukuran sampel dan kumpulan data yang berbeda, tetapi juga berbagai rumus dan perhitungan.


No comments:
Write comments