Using Machine Learning to Detect Redaction and Transmission in the Talmudim - The 18th World Congress of Jewish Studies

הפרויקט "שיכוני מילים בשפה הארמית" משתמש באלגוריתמים של למידת מכונה כדי להבחין בין דיאלקטים שונים של הארמית. בשלב ראשון, אימנו את האלגוריתמים על מסכתות מקבילות בשני התלמודים. בשלב שני בדקנו את האלגוריתם על כל מסכתות התלמוד. הבדיקה שלנו העלתה דיוק של 92% בשיוך נכון של משפט שלא נכלל בטקסט האימון לתלמוד ממנו הוא בא, כאשר אלגוריתם מתבסס רק על מילים בודדות ללא התייחסות לסדר המילים במשפט ו-95% כאשר האלגוריתם מתבסס גם על צירופי מילים. חשוב מכך, כאשר בוחנים מקרים שבהם האלגוריתם משייך משפטים מהבבלי לירושלמי ולהפך, מתגלה שהאלגוריתם מסוגל להבחין בצורות חריגות. חלק מן הדוגמאות נזכרו קודם במחקר קודם, ואחרות חדשות. דבר זה מאפשר לזהות תהליכי עריכה ומסירה של התלמודים.