מדויק מה-ATP: האם זהו דירוג הטניס האמיתי?

By | נובמבר 11, 2020
פודיום אולימפי

התרגלנו להתבסס על הדירוגים הרשמיים של סבבי ה-ATP וה-WTA, אבל מה אם יש בנמצא דרך אחרת להביט על הנתונים? כזו שמשקפת יותר, מנטרלת יותר הטיות, וברוח התקופה – גם מאפשרת לנו השוואה נכונה יותר בין טניסאי ענק מאותו דור (כן, גם 3 הגדולים), ואפילו מתקופות שונות? היכרות עם דירוג ELO

***

כל מה שארפד אילו רצה לעשות זה לעזור לשפר את שיטת הדירוג בענף השחמט בארה"ב.

אילו, פרופסור לפיזיקה ושחקן שחמט תחרותי בעצמו, היה חבר בפדרציית השח האמריקני בזמן שזו חיפשה בשנות ה-50 מתודה מבוססת סטטיסטיקה חדש לדירוג. עד אז, היא עשתה שימוש בשיטה אשר בבסיסה היה רעיון פשוט: שחקן מקבל נקודות דירוג על פי מידת התפקוד שלו, וביחס לחוזק הממוצע של היריבים בטורניר בו שיחק. לא לגמרי בלתי הגיוני, אפילו הגיוני הרבה יותר משיטות אחרות שקיימות. ובכל זאת, עולם השחמט חיפש שינוי. שדרוג. באמצע שנות ה-50, אילו האמין שמצא אותו.

בשנת 1960 האמונה שלו קיבלה ביסוס כשבענף אימצו את מה שעד לימינו נקרא "דירוג ELO". מדוע היא רלוונטית לטניס? למה במובנים רבים היא מדוייקת ומשקפת יותר מאשר דירוג ה-ATP? לאחר שהעיקרון והמהות הפשוטים שלה יובנו, יהיה קל יותר לענות על השאלות הללו. משם יהיה גם נוח יותר להבין את היתרונות העצומים שיש לה בלנסות ליישב בצורה אמפירית דיונים תיאורטיים על גדולה על זמנית של ספורטאים. דיונים שהפכו, נרצה או לא, לחלון הראווה של הספורט.

אז מהו בעצם ELO?

ELO rating system היא שיטת דירוג שמחשבת יכולת יחסית של מתמודדים במשחקי סכום אפס, בהם הפסד של מתחרה אחד הוא רווח של האחר (כמו טניס). כאמור, היא נועדה במקורה לשפר את אופן הדירוג בשחמט אבל בהמשך נעשה בה שימוש גם במגוון ענפים, כמו כדורגל, NBA, NFL וה-MLB. אחד היתרונות הבולטים שלה היא יכולתה לייצר כן השוואה בין ספורטאי עבר והווה באותו הענף, ואפילו בין ספורטאים ששיחקו באותו עידן והגיעו לפיק בתקופות שונות.

אז איך זה עובד, מבלי לסבך? הנה הפואנטה הבסיסית בשני משפטים: שני שחקנים נכנסים לתחרות עם דירוג שמבוסס על תוצאותיהם הקודמות. ELO משתמש בדירוג המוקדם הזה כדי לחזות את תוצאת מפגש הראש בראש שלהם, ובכך "להכתיר" פייבוריט טרם ההתמודדות. לאחר מכן, ובהתחשב בתוצאה, הוא משתמש בתחזית המוקדמת כדי לעדכן את הדירוג שלהם. המשמעות בפועל היא כזו – ניצחת משחק שהיית "אמור" לנצח? תרוויח נקודות ותתקדם בדירוג אבל לא יותר מדי. הפתעת שחקן שעדיף עליך משמעותית? תקבל הרבה יותר נקודות ותזנק בדירוג. כמות הנקודות שתרוויח היא זו שתילקח מהמפסיד, וככזו – תהיה תלויה תמיד במצב בו יריבך ואתה נכנסתם לתחרות.

או במילים אחרות: אתה טוב כמו חוזקו של היריב שניצחת נכון לאותו רגע נתון. ללא קשר לזהותו, אבל עם הרבה קשר לכושרו באותה נקודת זמן.

המאפיינים של דירוג ELO והשוני מדירוג ה-ATP

1) בראש ובראשונה, ELO בודק אך ורק מול מי שיחקת ולא מתחשב בטורניר או בסיבוב בהם זה קרה. ייתכן שיש בכך אי התחשבות בהתעלויות מנטליות/התפוצצויות ספורטיביות (עוד על כך בסעיף 3) אך באופן הזה ELO מנטרל הטיות של דירוגים והגרלות. לצורך העניין, לשיטת הדירוג הזו לא אכפת אם המדורג 89 הדהים את המדורג 15 בסיבוב הראשון ב-ATP 500 בבאזל או בחצי גמר גרנד סלאם. אכפת לו רק מהעובדה שהמדורג 89 ניצח, ומאיכות היריב אותו ניצח.

2) ELO היא שיטה שבאופן אינהרנטי מתקנת את עצמה לאורך זמן. מדוע? ובכן, חשבו על זה: שחקן שמחזיק בדירוג ELO גבוה או נמוך מדי צפוי הרי בטווח הארוך לתפקד טוב פחות/יותר ממה שהשיטה מנבאת לו, ובכך להפסיד או להרוויח נקודות עד שהדירוג ישקף את מיקומו האמיתי. הווה אומר, ריצה נדירה אחת (הזכייה של ילנה אוסטפנקו ברולאן גארוס 2017, למשל) בהחלט יכולה להפוך שחקנ/ית לגדול/ה בעיני ELO, אבל אם יהיה מדובר בעניין חריג, הוא/היא ימצאו עצמם מדרדרים בדירוג מהר מאוד.

3) בניגוד לדירוג ה-ATP, ELO בוחן הישגים של שחקנים לאורך זמן, ולא רק נכון ל-12 החודשים האחרונים. אין שמירה/איבוד נקודות מהשנה שעברה, אלא מערכת גמישה שהולכת ונבנית לאורך זמן. פירמידה של עוד ועוד תוצאות שבנויות על עוד ועוד תחזיות, שמייצרות, בתקווה, דירוג משקף ועדכני.

4) חלוקה למשטחים: כמעט כל דירוג ELO כולל, בנוסף לדירוג הכללי, דירוג על פי משטחים (חימר, דשא, משטח קשה). זהו פקטור חשוב שמאפשר קודם כל לאזן את העובדה שכמות שונה של משחקים/תחרויות משוחקים על כל משטח, ויותר חשוב – לייצר תחזיות ספציפיות ומדוייקות יותר לפני טורנירים (על הדרך, ניתן גם לגלות מיהם באמת מומחי המשטחים השונים. לעיתים התוצאות מפתיעות).

ELO הוא דירוג שמאבחן "גדולה" היסטורית של ספורטאים

אם העקרון של ELO הובן עד כה, אז קל להבין גם את אחת החוזקות הגדולות שלו, שרלוונטית מאוד לאופי הדיון הספורטיבי בימינו: הוא מאפשר לנו להשוות גדולה של ספורטאים. לא דרך שלל קטגוריות שמי יודע ומי מחליט מי מהן אמורה להיחשב יותר או פחות (וכמה יותר או פחות), אלא דרך אלמנט של עקביות. ELO מספר סיפור של כמה גדול היית באמת, לאורך כמה זמן עשית זאת ומול איזו איכות תחרות.

אם פדרר ונדאל לקחו אותו מספר סלאמים, אבל הדרך לשם של אחד מהם היתה קלה יותר, ELO יעלה על זה. אם ג'וקוביץ' הביס את נדאל בטורניר X אבל תפס אותו באמצע תקופה נוראית שלו, ELO יפקטר את זה לחישוב שלו. ואם נעשה החלטה לתת משקל לדירוג מבוסס משטח, וניק קיריוס ידהים את רפא על חימר – הוא ייהנה מפירות הניצחון יותר מאשר אם ינצח אותו על דשא למשל.

ELO מתוכנת לספר לנו מתי בדיוק הגיע כל שחקן לפיק שלו ובדיוק כמה שחקנים שהיו בשיא שלהם עמדו מולו באותו זמן. ואם נחליט לשרטט בעצמנו גבול שמכריע מהי גדולה (כמות שיא של נקודות דירוג או לאורך כמה שנים דורגת בטופ 3 למשל), הוא נותן לנו את היכולת להבדיל בין שחקני על שחוו פיקים בני מספר שנים בהן זללו תארים, לבין אלו שאולי זכו בפחות אבל היו שם למעלה לאורך קריירה שלמה. ומול דורות שונים של יריבים.

טיעונים על עידן חלש או חזק הופכים להרבה פחות רלוונטיים, ודיונים בלתי נגמרים בטוויטר על מי הכי גדול – שחלקם הגדול ממילא נופלים לנישת הטעם האישי – יכולים, לכל הפחות, לקבל בסיס אמפירי מסויים. ובל נשכח: הטניס לא התחיל במילניום הנוכחי, וספורטאי על היו פה תמיד. את חלקם ראינו ואת חלקם לא, אבל רובם שיחקו בתקופות בהן הציוד והטכנולוגיה היו שונים, ההבדלים בין המשטחים היה עצום לעומת היום, והקריירות קצרות. ELO יידע למדוד אותם לפחות בצורה יותר הגונה, ובמידה רבה יעזור לנו להבין עד כמה הדומיננטיות של סמפראס היתה דומה לזו של פדרר, כמה בורג היה ענק למרות הקריירה הקצרה יחסית, והאם המאבק של גיז'רמו וילאס להכרה בהיותו מספר 1 לקראת סוף שנות ה-70 הינה מוצדקת.

נקודות השוני בין דירוגי ELO וחולשת השיטה

אוקיי, אז הבנו ש-ELO לוקח בחשבון תוצאות משחקים ותו לא. אבל הנה הקאץ'. למעשה שניים:

1) התוצאה וזהות היריב הם חזות הכל, אבל האם זה הוגן? האם דין משחק הטוב מ-3 שווה לזה של הטוב מ-5? אם פאביו פוניני חוזר מ-2:0 ומעיף את רפא בסיבוב ה-3 בארה"ב ב-2015 ובאותה שנה מנצח אותו בשני סטים בטורניר ATP 500 בברצלונה, הניצחון הוא אותו ניצחון? ELO אומר שכן, בהנחה שרפא היה פחות או יותר באותו כושר באותו זמן. לנו מותר לפקפק.

2) נקודת חולשה אחת שיש לדירוג ה-ATP ואותה ELO לא פותר, היא עניין הפציעות/פרישות במהלך משחקים. חצי עולם ראה את פדרר פצוע מול דימיטרוב ב-US OPEN 2019. מה ש-ELO ראה זה את המדורג שלישי בעולם מפסיד ליריב לא מדורג, שקופץ בעקבות כך דרמטית בדירוג (לפחות עד שיוכח שהוא לא ראוי לכך). והנה לכם דוגמא לסוגיה שמודל סטטיסטי יכול לפספס. אבל לא העין.

* בהמשך יובאו כאן מאמרים נוספים שיציגו מחקרים, נתונים, בתקווה מסקנות, שניתן ללמוד מדירוגי ELO השונים.
** אתרים מקצועיים שונים ברשת עושים שימוש בדירוגי ELO, ולא באלו של ה-ATP. למטה לינקים לחלקם.

דירוגי ELO שונים מאתרים נבחרים ברשת

דירוג ה-ELO של Tennis Abstract (גברים)

דירוג ה-ELO של Tennis Abstract (נשים)

דירוגי ה-ELO של Stats on the T (גברים + נשים)

דירוג ELO של Ultimate Tennis Statistics

כתיבת תגובה

האימייל לא יוצג באתר.