טניסאי הגיש טוב יותר מהיריב, חבט יותר ווינרים, טעה פחות, השיג יותר נקודות שבירה ובכל זאת הפסיד. מה קרה? יכול מאוד להיות שהוא פשוט לא גילה עליונות היכן שהכי חשוב. על הפרמטרים הסטטיסטיים המובהקים ביותר בניבוי תוצאות טניס
***
"כל ספורט עוסק במספרים. כמה נקודות השגת, כמה ניצחונות.. זה הרי כמו לצפות בסופר קלפים משחק בלאק-ג'ק. עכשיו – מהרגע שלמדת לספור קלפים, האם תחזור אי פעם להסתמך על תחושה?"
על התרומה של בילי בין, האחראי על הציטוט הנ"ל, להחדרת האנליטיקה לבייסבול האמריקני, ומשם לכל עולם הספורט, נכתבו עשרות, אם לא מאות, אלפי מילים. מתחילת המילניום והלאה, גישת המאניבול שאימץ חילחלה והשפיעה על ענפים רבים בספורט האמריקני (ובכלל), ונראה שאין כמו הציטוט כאן למעלה כדי להסביר במשפט את ההיגיון המבני הפשוט שלה: המדע נותן לך סט כלים אמפירי ומוכח שיכול לעזור לך להכריע. לנצח משחקים, לבחור הרכב נכון, לאמץ את הטקטיקה היעילה ביותר – אם כך, איזו סיבה בעולם יש לך לא להשתמש בו?
המהפכה הסטטיסטית בעולם הספורט עדיין לא כבשה לחלוטין את הטניס
ובכל זאת. גם אם הכיוון ברור – גם אם בעולם הטכנולוגיה הגבוהה והמדידה שאנו חיים בו, לספורט אין דרך שלא להישאב למהפכה – יש ענפים שקצת נותרו מאחור. אחד מהם הוא הטניס. זה לא שטניסאים לא עושים שימוש כזה או אחר במערכות מידע, ניתוחים ופילוחים סטטיסטיים שניתנים להם (נובאק ג'וקוביץ' היה עד לא מזמן דוגמא טובה, גם רוג'ר פדרר), אבל התופעה אינה נרחבת דיה. בטח לא אם נזנח לרגע את הצד של הספורטאים ונסתכל על מקורות המידע הסטטיסטיים שזמינים לנו כחובבי טניס.
קרייג אושנסי, אולי אנליסט הטניס המוכר בעולם כיום, סיפר לאחרונה כי החל מ-2015 צילם במכשיר הסלולרי האישי שלו למעלה מ-3,000 סקרין שוטס של סטטיסטיקות משחקים, מכיוון שהטורנירים הגדולים (פרט לווימבלדון) לא שומרים את הנתונים בעצמם. "יש היום טורנירים בסבב שבאתר שלהם לא תוכל למצוא אפילו את תוצאת הגמר מהעונה הקודמת", הוא מספר. "ב-NBA יראו לך מפת חום של משחקים מ-1962, אבל אם תרצה לבדוק מה היה אחוז ההכנסה הממוצע של סרב ראשון ברולאן גארוס 2018, אני ממליץ לך להכין קפה שחור ולהיות מאוד סבלני כי זו משימה בלתי אפשרית. בלתי נתפס בעיניי שהנתונים כבר מתועדים ושמורים, אבל לא נמצאים באף בסיס נתונים שאנחנו – תקשורת, אוהדים, שחקנים ומאמנים, יכולים לגשת אליו".
***
ג'ף סאקמן, האיש שמאחורי אתר Tennis Abstract נתקל בדיוק באותה בעיה. בתגובה הוא השיק פרוייקט מיפוי ותיעוד שנכון לכרגע מונה כ-8,300 משחקי ATP ו-WTA. כמעט מדי שבוע, אפילו יום, מועלים לאתר נתונים סטטיסטיים מאנשים שיושבים וצופים במשחקי עבר קרוב ורחוק באורך מלא ומתעדים כל נקודה. המטרה היתה לייצר בסיס נתונים שממנו אפשר יהיה לגזור מסקנות סטטיסטיות ומחקריות לגבי הטניס. ואחד המחקרים שנעזרו במאגר הזה הוא הבסיסי והמסקרן ביותר להתחיל עימו. מחקר שבחן שאלה אחת: באילו סטטיסטיקות הכי חשוב לטניסאי להתעלות על יריבו בכדי לנצח משחק?
שתי קטגוריות סטטיסטיות בולטות מעל האחרות בקביעת מנצח במשחק טניס
כעת, עצרו לרגע ונסו לענות לשאלה הזו בעצמכם. מאינטואיציה בלבד. איזה פרמטר סטטיסטי יביא לך את הסיכוי הגבוה ביותר לנצח? האם כל מה שצריך זה לזכות ביותר נקודות סה"כ? אולי לייצר יחס עדיף מהיריב שלך בין ווינרים לטעויות בלתי מחוייבות או בין אייסים לשגיאות כפולות? ואולי התשובה נמצאת בכלל בסרב – להשיג אחוז הצלחה גבוה מהיריב בהגשה ראשונה/שנייה או באחוז ההכנסה של הראשונה? רגע, ומה עם אחוז ההצלחה ברשת? לנצח ביותר ראלים קצרים/ארוכים? להשיג יותר אפשרויות שבירה??
ובכן, מסתבר שישנן שתי קטגוריות סטטיסטיות שמנבאות היטב איזה שחקן עומד לזכות בהתמודדות. שתי קטגוריות ששווה לנו כחובבי טניס לשים לב אליהן, תוך כדי צפייה מורטת עצבים בטלוויזיה, ולהבין מה הסיכוי של הפייבוריט שלנו לחייך בסיום (אגב, בהתחשב באופי הסימטרי-סכום אפס של הטניס, המסקנות רלוונטיות גם עבור שחקנים חובבים שמתחרים ברמה נאותה ומעלה). הקטגוריה הראשונה לא תפתיע אף אחד. השניה אולי כן.
קטגוריה 1: TPW (סך הנקודות בהן זכה טניסאי לאורך משחק – Total points won)
ב-2015, לראג'יב רם יצא לפגוש שני יריבים בצ'לנג'ר במנצ'סטר. את הראשון ניצח למרות שזכה ב-6 נקודות פחות ממנו. לשני הפסיד למרות שלקח 5 נקודות יותר. לאחר שירד מנוצח, סינן: "טניס זה בוודאות לא כדורסל". והוא צודק, אבל גם טועה. אמנם, בכדורסל זכייה בנקודה אחת יותר מהיריב שלך מבטיחה לך ניצחון. בטניס זה לא המצב, אבל זה לא רחוק מדי משם. במילים אחרות: גם בטניס, גם היום, זכייה ביותר נקודות מהיריב היא עדיין הקטגוריה שמקרבת שחקן לנצח בהתמודדות יותר מכל פרמטר אחר.
כמה מקרבת? ובכן, שימו לב: מאמר שפורסם באתר "Inpredictable" ירד לעומק הסוגיה. ומנתונים שנאספו שם מתברר ש-4.5% אחוז בלבד מהמשחקים בסבב ה-ATP מנוצחים על ידי שחקן שזכה בפחות נקודות לאורך המשחק. כשיורדים לרמת המערכות המסקנות אפילו יותר חד משמעיות – רק ב-2.4% מהסטים זוכה שחקן שלקח פחות נקודות במערכה. די מדהים (אבל גם די מסתדר לנוכח העובדה שבטניס שחקן יכול לקחת 6 משחקוני הגשה על האפס רק כדי להפסיד לאחר מכן בטיי ברייק).
אבל בכמה נקודות יותר מהיריב "כדאי" לך לזכות כדי להיות רגוע לחלוטין? עד כמה הסטטיסטיקה נחרצת? ובכן, אם חשבתם תמיד שבטניס המקצועני ההבדל בין ניצחון להפסד הוא מיקרוסקופי, צדקתם לחלוטין. ככה: ניצחון ב-51% אחוז מהנקודות, לא יותר, מבטיח לטניסאי 85% אחוז סיכוי לנצח משחק של הטוב מ-3 (ולמעלה מ-90% אחוז במשחקי הטוב מ-5). לקחת 52% אחוז מהנקודות? חצית את רף 95 אחוזי הסיכוי לסיים מבסוט. חשבו לרגע על מפגש מאסטרס סטנדרטי בין נדאל לתים בו שוחקו, נאמר, 100 נקודות. אם רפא לקח 51 מהן ותים 49, לאוסטרי יישארו על הנייר כ-15% לנצח. אכן מיקרוסקופי.
סיכוי זכיה במשחק ביחס לכמות נקודות (קרדיט: אתר Inpredictable)
קטגוריה 2: DR (זכייה באחוז גבוה יותר של נקודות החזרה מהיריב – Dominance ratio)
אינטואיטיבית, אולי לא זו הקטגוריה שרובנו היינו מהמרים עליה. אבל יש בה מלוא היגיון וגם היא חד משמעית כמעט כמו הראשונה. קודם כל, חשוב לא להתבלבל. לא מדובר בכאן בזכייה ביותר נקודות כמחזיר, אלא באחוז גבוה יותר. או בתרגום חופשי: להיות "מסוכן" יותר בגיימים שאתה לא מגיש בהם, ויותר קרוב לשבירה (גם אם בפועל לא תשיג יותר אפשרויות לשבור, ולמרות שבדרך כלל יש קורלציה).
עד כמה מדובר בנתון משמעותי? רק 7.2% אחוז מהמשחקים מנוצחים על ידי שחקן שהיה נחות בקטגוריה הזו מול יריבו, ורק 7.4% מהמערכות. לא נחרץ כמו הקטגוריה הראשונה אבל לא רחוק מדי ממנה. ומה קורה כשמשלבים בין צמד הקטגוריות? הסיכוי של טניסאי להפסיד משחק בו גם לקח יותר נקודות וגם זכה באחוז גבוה יותר של נקודות שבירה עומד על 4% בלבד.
אבל מה קורה כשהסטטיסטיקה לא מתיישרת?
אוקיי, אז ראינו והבנו שהסיכויים של שחקן לשמוט משחק כשהוא מנצח בפרמטרים הנכונים והחשובים היא נמוכה מאוד. אבל זה הרי לא תמיד קורה נכון? קרל ביאליק, עוד איש של מספרים, שפירסם ומפרסם לא מעט מאמרים מעניינים על טניס, קורא למקרים הללו "Lottery matches" – משחקים שבהם פרמטר סטטיסטי אחר, אולי שניים מהם, היו מספיק משמעותיים, חריגים וחשובים כדי לנצח את ההסתברות. זו יכולה להיות התעלות קסומה ברגעי מאני טיים, מימוש של נקודת שבירה אחת שהשגת לאורך כל ההתמודדות מול כשל של היריב לנצל את ה-10 שהיו לו, כמות חריגה של שגיאות כפולות. ועוד ועוד ועוד.
ב-14 ביולי 2019 עלו נובאק ג'וקוביץ' ורוג'ר פדרר למגרש המרכזי בווימבלדון. לאחר 4:57 דקות הם לחצו ידיים ברשת, בסיומו של גמר שבאתר The Economist הכריזו עליו אמפירית כמשחק הטניס הדרמטי אי פעם. במהלך 4:57 הדקות הללו, פדרר (תמונה למטה) זכה ביותר נקודות והחזיר טוב יותר, השיג יותר נקודות שבירה והמיר אחוז גבוה יותר שלהן, הכה יותר ווינרים, היה עדיף משמעותית ברשת וגם עליון בכל פרמטר שקשור להגשה. אז איך לעזאזל הוא הפסיד למרות ששיחק נהדר? מה קרה?
ובכן, מה שקרה זה טניס, ובטניס יש גם אנומליות. ובגמר ההוא נובאק ג'וקוביץ' סידר חתיכת אנומליה. הוא שרד רק כדי להישאר בסטים, נאחז ושרט ואז, בשלושה טייברייקים ביצע 0 טעויות בלתי מחוייבות, לעומת 11 של פדרר. לא טעות אחת, לא שתיים. אפס עגול. ביצוע טעויות בלתי מחוייבות היתה הקטגוריה היחידה במשחק בו הוא היה עדיף על השוייצרי, אבל היא היתה כל כך משמעותית וכל כך בזמן הנכון עד שניצחה את האחוז הסטטיסטי הזניח שהיה לו להניף את הגביע.
ואם להשתולל עם מונחים מפוצצים ופומפוזיים – אולי זה הקסם בטניס. אנחנו לא נוטים להתעכב על כך עד שמקרים כאלה קורים במעמדים כמו גמרי סלאמים, אבל שיטת הניקוד בספורט הזה יכולה להיות אכזרית. אתה לא מתוגמל על ניצחון חד צדדי בסטים שלקחת ולא מקבל בונוסים, גלגלי הצלה או הגשה שלישית רק כי היית טוב יותר בסה"כ.
ובכל זאת, אם בא לך לקרב את עצמך לשתייה מהבאר, עשה לעצמך טובה קטנה: תתחיל בלקחת יותר נקודות מהיריב.
***
יותר משקף, יותר רלוונטי: הכירו את ELO – הדירוג האלטרנטיבי ל-ATP
אז איך ועד כמה באמת משפיעים תנאי סביבה חיצוניים על משחק טניס?