ההטיות של אלגוריתמים בהערכת שחקני העתיד
מונדיאל 2026 יפתח בעוד כשבוע ומיטב הכדורגלנים בעולם יגיעו ליבשת אמריקה בכדי לקבוע מי הנבחרת הטובה בעולם. אינספור חידושים טכנולוגיים משרתים את ההישג התחרותי על הדשא, אולם לצד פיתוחים אלו, חוקרים מאוניברסיטת בן-גוריון בנגב והמכללה האקדמית קיי, חושפים את הסכנות מאחורי בינה מלאכותית (AI) שמדרגת בני אדם. המחקר פורסם בכתב העת Big Data and Cognitive Computing.
לקראת פתיחת המונדיאל הודיעה FIFA על שיתוף פעולה עם ענקית הטכנולוגיה LENOVO, שבמסגרתו פותחה פלטפורמת Football AI Pro, מערכת בינה מלאכותית מתקדמת לניתוח טקטי והערכת ביצועי שחקנים וקבוצות, המבוססת על מיליוני נקודות מידע, ניתוח וידאו, הדמיות תלת־ממד, וסימולציות מבוססות למידת מכונה. יוזמה זו מצטרפת לשיתוף פעולה שקיים בין אינטל לוועד האולימפי הבינלאומי במסגרתו פותח כלי מבוסס AI לאיתור כישרונות צעירים בספורט. כלי דירוג מבוססי אלגוריתמים החלו להיות מיושמים בסלבדור, יפן, ישראל ומדינות נוספות.
מחקר שנערך על ידי פרופ' עופר עזר, ראש המחלקה למנהל עסקים באוניברסיטת בן-גוריון בנגב וד"ר איליה מורגולב, ראש תוכנית MPE לחינוך גופני במכללה האקדמית לחינוך ע"ש קיי, מונה את הסכנות הטמונות בשימוש בכלים אלו.
ניתוח ביצועים מבוסס ביג דאטה משפיע באופן ישיר על קבלת החלטות בתחומים רבים בתעשיית הספורט, בין היתר ניהול עומסים, הכנה טקטית, מעורבות של אוהדים ותמחור כרטיסים. שיטות ניתוח מתקדמות מיושמות גם לזיהוי שחקני כדורגל מוכשרים כבר בגיל הצעיר, כאשר מערכות מבוססות למידת מכונה (machine learning) מנסות ללמוד מה ייחודי בנתוני העבר של ספורטאי העילית של היום.
פלטפורמות איתור (סקאוטינג) הפכו לכלי מרכזי לזיהוי ראשוני של שחקנים פוטנציאליים בכדורגל. פלטפורמות אלו אוספות וידאו ממשחקים, נתונים על אירועים ופעולות, נפח עבודה ומידע היקפי על פני ליגות רבות בקבוצות גיל שונות. מאגרים אלו מאפשרים לנטר אוכלוסיות שחקנים גדולות מרחוק בצורה אוטומטית, כאשר אנליסטים מיישמים קריטריונים מוגדרים מראש הקשורים לגיל, עמדה, רמת תחרות, מדדי ביצוע ומגבלות תקציב לסינון ראשוני. תת-קבוצה נבחרת של השחקנים המתאימים ביותר עוברת לאחר הסינון בדיקה מדוקדקת יותר של הצוות המקצועי. לאחרונה תומכות פלטפורמות אלו בשילוב בין מאפיינים פסיכולוגיים ופיזיולוגיים מתקדמים כגון חוסן מנטאלי, קבלת החלטות וכוח מתפרץ, לצד מדדים טכניים קלאסיים כגון חטיפות, בעיטות למסגרת, מסירות מפתח ועוד.
בדומה לזירות עסקיות, חינוכיות ורפואיות, כלי דירוג מבוססי למידת מכונה בספורט מאומנים בדרך כלל על נתוני החתמה והצלחה היסטוריים, המשקפים ניסיון ארגוני וקריטריונים של החלטות קודמות. כאשר הצלחת עבר קשורה ברקע סוציו-אקונומי, דת, גזע או גישה למוסדות עילית, עלולים מאפיינים אלו להיכנס למודל בדרך עקיפה מכיוון שמשתני פרוקסי (מקום מגורים, מספר אחים ואחיות, בית ספר) מקודדים רקע סוציו-דמוגרפי גם מבלי שהתכוונו לכך.
עד היום, ככל שהמועדונים והאקדמיות לכדורגל ביקשו לנתח ביצועים ומאפיינים של מתבגרים וילדים בגיל חטיבת ביניים ובית הספר היסודי, הם נתקלו בחומה- לשום גוף וארגון לא היו המשאבים למדוד ולשמר בצורה מתוקננת ואחידה את כל מה שקורה על המגרשים בגילאים המאוד צעירים. אולם כיום מופעלות מערכות צילום ושידור אוטומטיות בעשרות אלפי מגרשים בהם מתקיים ספורט ילדים.
מעבר לצילום על ידי מערכות ייעודיות באולמות הספורט, הכלים הטכנולוגיים זמינים לילדים ברחבי העולם בכדי להסריט את עצמם מבצעים מבדקי יכולת ולקבל דירוג התאמה לענפי ספורט שונים. כך, בעוד מספר שנים כאשר קומץ קטן של אותם ילדים המוסרטים היום יגיע לרמה העילית, האלגוריתם ינתח את צילום הוידאו שלהם מגיל ילדות וילמד את התנועה, המהירות, הזריזות, הניתור, הגודל, היציבה, מנח הידיים, הבשלות, העוררות ושפת הגוף שייחודיים לילדים שהצליחו ומבדילים אותם מכאלו שהצליחו פחות.
כאשר מנסים למדוד את הפוטנציאל הספורטיבי של ילד, ברוב המקרים מודדים בעיקר את ההבדל שקיים בין הילדים, באמצעות חשיפה מוקדמת במסגרת חוגים בגיל מאוד צעיר ומשחק חופשי עם בני המשפחה. הבעיה מעמיקה כאשר מדידה זו שמורה במערכות הדיגיטליות והיא זו שקובעת את מתן ההזדמנויות הספורטיביות שהילד יקבל (או לא יקבל). מצב זה מתואר בספרות המדעית כ"דטרמיניזם דיגיטלי".
לצד אלו, כלים מבוססי AI יוכלו לסרוק עמודים ברשתות החברתיות, אייטמים חדשותיים, עמודי ויקיפדיה וכדומה, במטרה לזקק גם משתנים פיזיים, אישיותיים וחברתיים שמאפיינים ספורטאים מוצלחים.
פריסה רוחבית של מערכות צילום ודירוג מבוסס AI, שהחלה לאחרונה בישראל ובעולם תסייע בוודאי לא לפספס אף כישרון יוצא דופן, אך החוקרים מתריעים שזו גם עלולה לשרת מטרות הפוכות ובעלות השלכות אתיות. איסוף נתונים בקרב ילדים ובני נוער לשם יצירת פרופיל התאמה גופני ואישיותי לספורט הישגי עלול ליצור הסללה מוקדמת ואף לדלוף לגופים מסחריים שיעשו שימוש פסול בדירוגים מחוץ לזירת הספורט. פרטיות והגנה על מידע אישי דורשים תשומת לב מיוחדת גם כאשר מדובר בנתונים ביולוגיים שנאספים כדרך קבע באימונים לשם אופטימיזציה של עומסים ומניעת פציעות.
"המציאות מלמדת שהספורט ההישגי מקדש קודם כל את ההישג התחרותי, גם על חשבון ערכים אחרים", אומר ד"ר מורגולב. "ספורט תחרותי הישגי זו זירה ייחודית, קיצונית, הנשענת על נתונים גופניים יוצאי דופן לצד נחישות, חוסן ומוטיבציה. תמהיל המאפיין במקרה הטוב רק כאחוז אחד מכלל האוכלוסייה".
"זו העת לחשוב יחד כחברה על המקום ומידת האוטונומיה שאנחנו מוכנים לתת לאלגוריתמים בצילום, דירוג, ניבוי וקביעת נתיב התפתחות של דור העתיד כאשר הספורט ההישגי מלכתחילה לא רלוונטי לרובם המוחלט", מתריע פרופ' עזר. "נראה הגיוני שאנחנו כחברה נדאג קודם שהילדים ישחקו, יתאמנו, ייהנו ויתפתחו תחת עין אנושית אוהדת ותומכת, יגדלו לאזרחים בריאים, אמפתיים, ערכיים ואוהבי פעילות".