סרטן שד הינו הסרטן הנפוץ ביותר בקרב נשים והסיבה העיקרית לתמותה מסרטן בנשים. לנוכח השיפור המתמיד בטיפול במחלה, לגילוי מוקדם השפעה מכרעת על תמותה. בדיקות ממוגרפיה כבדיקות סקר משמשות ככלי העיקרי לאבחון סרטן שד. נשים מוזמנות מדי שנה-שנתיים כתלות בסיפור המשפחתי לביצוע הבדיקה, וזאת מפוענחת על ידי רדיולוגים אשר מגדירים את החשד לקיומו של ממצא ממאיר בעזרת ציון BI-RADS (Breast Imaging-Reporting and Data System).
פענוח תמונות ממגורפיה הינו משימה מאתגרת. ההבדלים בין הממצאים לרקע יכולים להיות דקים מאד; ישנן קטגוריות רבות של ממצאים, והם יכולים להיות שונים זה מזה בגודל, צורה, טקסטורה, פיזור וכדומה. קריאה שנייה של תמונות ממוגרפיה על ידי רדיולוג נוסף כבר הוכיחה את עצמה במקרים רבים כמשפרת את הרגישות והסגוליות, אך מגבלות כח אדם וזמן הופכות אותה לבלתי-אפשרית כחלק מהפרוצדורה הרגילה בבדיקות סקר. הביצועים של מערכות מבוססות למידה חישובית במשימות רדיולוגיה הולכים ומשתפרים, בין אם מדובר בפענוח צילומי רנטגן של בית החזה לחיזוי סרטן ריאות או פענוח צילומי נגעים בעור לחיזוי סרטן העור. יתרה מזאת, למערכות מבוססות למידה חישובית יש את האפשרות לעבד מאפיינים קליניים נוספים שאינם מופיעים בתמונה או בשאלון הכניסה של הנבדקת, למצוא קשרים בין מאפיינים אלו למאפיינים בתמונה, ולהגיע להסקה שמתקרבת לזו של רדיולוגים מנוסים.
עד כה, השימוש במאפיינים קליניים הוגבל לחיזוי רמת סיכון לסרטן שד. אלגוריתמי חיזוי אלה התבססו על מספר מוגבל של מדדים רפואיים, בעיקר כאלה הקשורים בהיסטוריה הגינקולוגית של האישה, ופקטורי סיכון המוערכים על אוכלוסיית רקע. כתוצאה מכך, יכולות החיזוי של סרטן שד עבור אישה מסויימת על ידי אלגוריתמים אלו מוגבלות ביותר.
במחקרנו שילבנו לראשונה בין מידע מתמונות לתיק הרפואי המלא של האישה. התמקדנו במבוטחות מכבי שירותי בריאות שעוברות בדיקת סקר ממגורפיה בבתי החולים של אסותא. לכל נבדקת, בנוסף לארבע תמונות הממוגרפיה הסטנדרטיות, קיים תיק רפואי אלקטרוני במכבי הכולל: אבחנות, בדיקות מעבדה, פרוצדורות וטיפולים, מידע על רכישת תרופות, מידע דמוגרפי ועוד. היסטוריה גינקולוגית והיסטוריה משפחתית של סרטן שד ושחלות מתקבלות משאלון הכניסה של הנבדקות כאשר הן עוברות את בדיקת הממוגרפיה באסותא. במידה והאישה עברה ממוגרפיה בעבר, צפיפות השד וה-BI-RADS הקודמים זמינים לנו אף הם.
בהתבסס על נתונים אלה, פיתחנו מודלים חישוביים לחיזוי סרטן שד. בעבודה זו נציג את התרומה של המאפיינים הקליניים למודלים המשלבים מידע מהתמונות ומידע מהתיק הרפואי, וכן את יכולות החיזוי של מודלים המבוססים על מאפיינים מהתיק הרפואי בלבד. כמו כן, נבחן מהם המאפיינים העיקריים המשפיעים על יכולת החיזוי ובאיזה אופן הם משפיעים עליו.