הגידול בגישה למאגרי רשומות רפואיות מאפשרים הזדמנויות לגילוי ידע לניבוי תוצאים וארועים רפואיים. אך מאגרי רשומות רפואיות שמטבעם מאופינים בנתונים דלילים לאורך זמן, שאינם שלמים מרובי משתנים וכו`[1]. אנו מציעים לפשט את הנתונים העתיים למשכי זמן בעלי משמעות ומהם לגלות תבניות משכי זמן שכיחות אשר משמשות לניבוי ארועים רפואיים כגון אבחנות ופרוצדורות רפואיות. אנו מציגים את[3,4] MAITREYA שהיא תשתית לניבוי תוצאים קליניים בהתבסס על תבניות משכי זמן שכיחות. עיקר מרכיביה מבוססים על [2] KARMALEGO לגילוי תבניות משכי זמן שכיחות והן [3] SINGLEKARMALEGO לזיהוין אצל חולים חדשים על מנת לבצע ניבוי. MAITREYA מציעה שני סוגי מדדים בנוסף לייצוג בוליאני כברירת מחדל, הכוללים את ה`HORIZONTAL SUPPORT` שמייצג את מספר המופעים של התבנית ברשומת החולה והן את ה`MEAN DURATION` אשר מיצגת את ממוצע משך המופעים, לטובת ייצוג התבניות במודל הניבוי. המתודלוגיה מבוססת על גילוי תבניות מקבוצת חולים שאצלהם נמצאו הארועים וכן לטובת הערכת המודל משתמשים בקבוצת בקרה של חולים שאצלהם לא נמצא הארוע, או התוצא הרפואי. בעבודה הנוכחית השתמשנו לטובת הניבוי בפרוצדורות, אבחנות ומתן תרופות ובעתיד נוסיף בדיקות מעבדה. לטובת הערכת MAITREYA השתמשנו בבסיס הנתונים של המרכז הרפואי של אוניברסיטת קולומביה שבניו יורק (ניו יורק פרסביטריין) המכיל כשלושים מליון אבחנות, עשרים מליון מרשמי תרופות, תשע מליון פרוצדורות וחמש מאות מליון תוצאות בדיקות מעבדה. הקונספטים הרפואיים הומרו למשכי זמן סימבוליים אשר נכרו לגילוי תבניות שכיחות וללמידת מודלי ניבוי. בצענו ניסויים על עשרות פרוצדורות ואבחנות ומצאנו שהשימוש בתבניות משכי הזמן השכיחות היו אפקטיביות יותר מהשימוש במנבאים סטטיים, וכן השימוש בייצוגים העשירים על פני ייצוג בוליאני היו טובים יותר. אנו נתאר את MAITREYA ונדגים את הפעלתה והערכתה בניבוי עשרות פרצדורות ואבחנות רפואיות.
REFERENCES
1 G. Hripcsak, D. Albers, Next-Generation Phenotyping of Electronic Health Records, Journal of American Medical Informatics Association, 20: 117-121, 2013.
2 R. Moskovitch, Y. Shahar, Fast Time Intervals Mining Using Transitivity of Temporal Relations, Knowledge and Information Systems, 45, 1, 2015.
3 R. Moskovitch, Y. Shahar, Classification of Multivariate Time Series via Temporal Abstraction and Time Intervals Mining, Knowledge and Information Systems, 42, 1, 2015.
4 R. Moskovitch, C. Walsh, F. Wang, G. Hripcsak, N. Tatonetti, Outcomes Prediction via Time Intervals Related Patterns, IEEE International Conference on Data Mining, Atlantic City, USA, 2015.
5. R. Moskovitch, H. Choi, G. Hripcsak, N. Tatonetti, Prognosis of Clinical Outcomes with Temporal Patterns and Experiences with One Class Feature Selection, IEEE/ACM Transactions on Computational Biology and Bioinformatics, In Press.