לראשונה בעברית: אלגוריתם יזהה מקרי אובדנות ברשת
שימוש ברשתות החברתיות כמקור לתמיכה נפשית הפך לעניין שגרתי בשנים האחרונות, אולם לא תמיד ניתן למנוע מקרי אובדנות ברשת. על מנת לאפשר זיהוי ואיתור מקדים של סכנת אובדנות ממשית, חוקרים מאוניברסיטת בן גוריון בנגב פיתחו אלגוריתם שמזהה דו-שיח אובדני בזמן אמת במרכזי תמיכה מקוונים.
פיתוח המודל פורסם בכנס COLING 2022.
האלגוריתם "SI-BERT" מנתח תמלול שיחות של תמיכה נפשית באמצעות צ'אט תוך שילוב תיאוריות פסיכולוגיות בתחום אובדנות ומצוקות נפשיות עם אלגוריתמי בינה מלאכותית מתקדמים לעיבוד שפה וטקסט. שיחות התמיכה מתבצעות על ידי עמותות המעניקות מענה נפשי מקוון באמצעות צ'אטים, ווטסאפ ופורומים אונליין.
זהו המחקר הראשון שנערך בשפה העברית לזיהוי ממוחשב של סיכון אובדני במהלך שיחות תמיכה ברשת. האלגוריתם מנתח דו-שיח בין פונה ומתנדב שעבר הכשרה מקצועית ומתריע בזמן אמת אם השיח מצביע על רמת סיכון גבוהה של אובדנות. כך למשל, טקסטים המעידים על מצוקה נפשית קשה, שיכללו מידה מסוימת של החמרה במצב הנפשי, יתריעו בפני המתנדב על סיכון אובדני מוגבר ובהתאם לכך יחליט המתנדב האם לערב גורמים חיצוניים כגון כונן חירום ו/או להפעיל גורמים חיצוניים נוספים שיצילו חיים באופן מיידי.
האלגוריתם לזיהוי אובדנות שפיתחו חוקרי אוניברסיטת בן-גוריון בנגב מבוסס על מודל ושמו BERT שפותח על ידי גוגל בשנת 2018. מודל זה הביא לפריצת דרך משמעותית בתחום של עיבוד שפה על יד המחשב. פריצת הדרך של BERT נובעת מהיכולת שלו להתייחס להקשר שבין חלקי המשפט ובכך ״להבין״ את המשמעות האמיתית של המשפט. כך למשל, ניתן להתבונן במשפט הבא: "הייתי אתמול בהופעה ורציתי למות מרוב צחוק". משפט זה אינו מכיל אמירה שעלולה להיחשב כאובדנית, אבל ללא תשומת לב להקשר אפשר לשגות בזיהוי הביטוי "רציתי למות". הדוגמא ממחישה כמה זה חשוב לזהות את המשמעות האמיתית של המשפט.
BERT מבוסס על היכולת של רשתות נוירונים לעבד כמויות עצומות של מידע אינטרנטי, שלא היה זמין עד כה. הדבר המאפשר לו להצטיין במשימות שונות של עיבוד שפה כגון חיזוי רגשות בטקסט, סיכום טקסט, חיזוי המשפט הבא ועוד. בנוסף, האלגוריתם שפותח מכיל מילון נרחב של צירופי מילים ומשפטים שזוהו על ידי התיאוריה הפסיכולוגית כרלוונטיים לזיהוי ומניעת אובדנות. מילון זה משולב באופן חדשני עם מודל השפה של BERT לקבלת פתרון בעל ביצועים גבוהים בתחום.
"בקרב 5,000 גברים ו12,000 נשים בטווח גילאי 10-65 המחקר הראה מעל 91 אחוזים של דיוק בזיהוי שיח אובדני במדד המקובל בתחום" ציין פרופ' קובי גל, החוקר המוביל מהמחלקה להנדסת מערכות תוכנה ומידע באוניברסיטת בן גוריון בנגב.
המחקר נערך בישראל באמצעות איסוף נתונים וניתוח של למעלה מ- 17,000 שיחות צ'אט אנונימיות שנאספו במשך 5 שנים. השיחות התקיימו במערכת הדיגיטלית של עמותת סה"ר (סיוע והקשבה ברשת) הנותנת מענה וסיוע נפשי מקוון ופועלת למניעה של אובדנות. קבוצת המחקר שילבה חוקרים מתחום הנדסת מערכות מידע ותוכנה, ניתוח שפה וגם פסיכולוגיה, שיתוף פעולה שאפשר לבנות אלגוריתם מדויק היודע לנתח את המלל ולזהות חשיבה אובדנית במהלך השיחה המקוונת בעזרת כלים פסיכולוגיים.
במחקר הושקעו מאמצים רבים במטרה לוודא שהאלגוריתם יהיה שוויני והוגן, כך שהביצועים של האלגוריתם נשארים זהים ללא הבדלים במין ובגיל של הפונה. הדבר הכרחי בעידן הנוכחי שבו מערכות מבוססות בינה מלאכותית לוקחות חלק בלתי נפרד מחיינו ומשפיעות על קבלת ההחלטות.
"הוספת רקע תיאורטי מתחום הפסיכולוגיה ועבודה עם עמותת סה"ר אפשרו לנו לבנות אלגוריתמים מדויקים הרבה יותר", הסביר החוקר ד"ר אבי סגל, מהמחלקה להנדסת תוכנה ומידע באוניברסיטת בן גוריון בנגב. "הדבר מדגיש את חשיבות שיתופי הפעולה הבין תחומיים עם חוקרים מעולמות ידע אחרים ועם ארגונים הפועלים בשטח".
"חשוב לציין שניתוח שיחות בשפה העברית מאתגר בצורה משמעותית מאשר עיבוד של טקסטים באנגלית וזאת בשל המורכבות המורפולוגית של העברית" הוסיף ד"ר אורן צור ראש המרכז לחקר פוליטיקה ואסטרטגיה דיגיטלית וחוקר מהמחלקה להנדסת מערכות תוכנה ומידע באוניברסיטת בן גוריון בנגב.
"על אף היכולות המרשימות של המודל, איננו מתכננים בשום שלב להחליף את המתנדב אלא רק לשמש כמערכת תומכת החלטה, שכן אנחנו סבורים שהרגישות האנושית חשובה ביותר בשיחות מהסוג הזה", סיכמו החוקרים.
חוקרים נוספים שלקחו חלק במחקר: פרופ' יוסי לוי-בלז, מהפקולטה למדעי החברה במרכז האקדמי רופין והמאסטרנטים אמיר ביאלר ודניאל יזמאילוב מאוניברסיטת בן-גוריון בנגב.
מחקר זה (מס' 1302/21 ISF) נתמך על-ידי הקרן הלאומית למדע.