רקע ורציונאל: ניתוח נתוני עתק (big data) וכריית מידע (Data Mining) מקבלים כעת דגש רב ועניין בעולם העסקי, בעולם המחקרי ובעולם הרפואי, למטרות של גילוי ידע. מערכות בריאות במדינות מפותחות מחפשות כלים מתקדמים לניתוח נתונים על-מנת לשפר תהליכי טיפול רפואי, לקבל תובנות על גורמים שמונעים/בולמים התקדמות של מחלות כרוניות וגם כדי לחסוך בעלויות. מאחר שאי-ספיקת לב (Congestive Heart Failure) היא מחלה כרונית נפוצה, שהחולים בה מתאשפזים תכופות ואף נפטרים עקב המחלה, לעיתים קרובות סמוך למועד השחרור מאשפוז, יש חשיבות למחקר שישפר את איכות הטיפול הרפואי בחולים אלו ספציפית. בייחוד בעידן הקורונה שבו יש יותר מקרים של בעיות בשריר הלב, אי ספיקה ועוד. לאחרונה התפרסמו מחקרים שפיתחו כלי חיזוי, שהתבססו על בסיסי נתונים פחות עשירים מזה שעמד לרשות המחקר הנוכחי.
מטרות: בניגוד למגמת השימוש הנפוץ בכלי ML, מחקר זה עוסק בניסיון לזהות מספר גדול של גורמים משפיעים, מעבר לקיים בספרות, לתמותה של חולי CHF באמצעות ניתוחי שרידות כגון Cox Regression. במחקר זה נשלב גם תוספים מתקדמים לשיטה זו מסוג Shared Frailty Models שלוקחים בחשבון גם את השונות בין חולים ואת התלויות עקב אשפוזים חוזרים של אותם החולים.
תוצאות וממצאים עיקריים: המחקר בוצע על הרשומות הממוחשבות של חולי אי-ספיקת לב שהתאשפזו בשיבא בשנים 2010 – 2017. כל רשומה הכילה אלפי שדות הכוללים מאפייני רקע ומאפיינים דמוגרפיים של החולה, מחלות רקע וגורמי סיכון, טיפול תרופתי כרוני, תוצאות מבחני הדמיה, צנתורים לבביים, תוצאות מעבדה ומדדים פיזיולוגיים במהלך האשפוז.
תחילה תוכנתו בפייטון והופעלו שיטות של למידת מכונה לבחירת מאפיינים (Feature Selection) כגון Random Forest ובאמצעותן נבחרו 15 המשתנים המשפיעים ביותר לצורך מחקר ראשוני זה.
ולאחר מכן בוצע שימוש במודלים של Cox Regression ובשילוב עם Shared Frailty Models באמצעות תוכנת R, שהניבו שיפורים במדדי הערכה של ביצועי ניתוחי השרידות והובילו לתוצאות הערכת מודלים טובות יותר ביחס לספרות הקיימת. מדד ה- Concordance קיבל 85% עבור Cox Regression ו- 89% בשילוב נוסף של Shared Frailty Models. תוצאות אלו טובות יותר מאלו שהתקבלו במדדים קודמים לבחינת תמותה מ CHF כגון BI-EFFECT ו ADHERE.
מסקנות ותובנות: התוצאות מעידות על חשיבות השימוש בכלים סטטיסטיים מתאימים ומגוונים, ועל חשיבות שיטות הניתוח לצד שיטות בחירת המשתנים - Feature Selection.
מחקר זה מוכיח את החשיבות הרבה של ניתוח נתונים רפואיים בבתי חולים, ואת הצורך באיסוף נתונים ממערכות רבות ככל האפשר (כולל מחוץ לבית החולים) למרות הקושי והעלויות הגבוהות. מידע מקיף על כל חולה עשוי לשפר משמעותית את בחינת ההשפעה של גורמים קליניים.
תרומה והשלכות להמשך: רופאים זקוקים למידע על מנת להצליח במשימתם לספק שירותים רפואיים. התוצאות מובילות למסקנה, ששימוש בניתוח נתונים מתקדם על נתונים עשירים, יכול לתרום לזהות את הכוח של כל משתנה\גורם קליני ולבחון טוב יותר מה עוזר לשרידות של החולים. גם ובייחוד בעידן הקורונה יש צורך בשימוש בכלים חכמים לאור העומסים שחלים על ארגוני הבריאות.
בשלב הבא נבצע שיפור למודל ונכניס מידע על חולים נוספים, נשתמש במאפיינים נוספים של החולים, כאלו שאינם מופיעים במודלים הקיימים בספרות, ונשכלל את מודל ההסבר לשרידות חולי CHF לאחר אשפוזם.