Как мы делаем прогнозы
BetScoper использует статистическую модель для оценки вероятностей исходов спортивных событий. Здесь мы объясняем, как это работает, какие данные используем и какие ограничения есть у нашей системы.
Источники данных
Мы получаем данные из нескольких источников:
- API-Football — статистика матчей, составы, форма команд (860+ лиг)
- The Odds API — коэффициенты от международных букмекеров для кросс-валидации
- Скраперы БК — коэффициенты 10 лицензированных российских букмекеров в реальном времени
- ESPN, TheSportsDB — дополнительная статистика и метаданные
Как работает модель
Наша модель использует взвешенный эвристический подход, комбинирующий несколько сигналов:
- Implied probability из коэффициентов — вероятности, заложенные букмекерами в линии. Это основной сигнал, так как линии букмекеров отражают коллективное мнение рынка.
- Форма команд — результаты последних 5 матчей, разница забитых/пропущенных мячей. Корректирует базовую вероятность на ±5%.
- Кросс-валидация — сравнение с линиями Pinnacle (считаются эталонными на рынке).
Что означает confidence
Каждый прогноз имеет показатель confidence (уверенность) от 0% до 100%. Это НЕ вероятность правильного прогноза. Это мера того, насколько модель «уверена» в разнице между своей оценкой и линией букмекера.
- 60-70% — умеренная уверенность, небольшое расхождение с линией
- 70-80% — высокая уверенность, заметный edge
- 80%+ — очень высокая уверенность (редко, требует проверки)
Value Betting
Value bet — ставка, где коэффициент букмекера выше, чем «справедливый» по нашей оценке. Мы используем критерий Келли для расчёта оптимального размера ставки. Минимальный edge для value bet: 3%.
Ограничения
- Модель не учитывает травмы, дисквалификации, погодные условия — только статистику и линии.
- Текущая версия — эвристическая (не Machine Learning в полном смысле). Планируется переход на XGBoost при накоплении достаточного объёма тренировочных данных.
- Точность модели составляет ~52-55% на выборке, что выше случайного, но НЕ гарантирует прибыль.
- Прошлые результаты не гарантируют будущих. Рынок ставок эффективен.
Обновления модели
Модель обновляется при появлении новых данных. Текущая версия: heuristic_v1 (март 2026). Все изменения в алгоритме документируются. Мы планируем публиковать отчёты о точности ежемесячно.