מחקרים מראים כי כמות החשיפה של התינוק לשפת אמו והאינטראקציה שלו עם הסביבה הקבועה משפיעים משמעותית על ההתפתחות השפתית שלו. יתרה מכן, תינוקות שנחשפו לכמות מילים מועטה נמצאו בסיכון לאיחור בהתפתחות השפה ופיתחו אוצר מילים דל ביחס לתינוקות החשופים לכמות מילים רבה. לאור האמור, קיימת חשיבות בהערכה מוקדמת של כמות המלל המופנה לתינוק, כמות האינטראקציה של התינוק עם סביבתו וכן כמות הווקליזציה של התינוק. לאחרונה פותחה מערכת מחברת LENA המאפשרת 16 שעות הקלטה ברצף ולאחר מכן ניתוח כמותי של קולות התינוק והקולות בסביבתו הטבעית. הניתוח אוטומטי ונעשה תוך פרק זמן קצר. הטכנולוגיה פותחה לזיהוי דיבור באנגלית ונמצאת בשימוש נרחב בארה"ב.
מטרת המחקר: לבחון האם האלגוריתם לזיהוי דיבור של הלנה מתאים לזיהוי דיבור בשפה העברית.
שיטה: במחקר השתתפו 12 תינוקות דוברי עברית בגילאי 3 עד 10 חודשים, בעלי התפתחות תקינה ממיצב בינוני-גבוה. המשתתפים קיבלו מכשיר הקלטה ובגד לתינוק עם כיס ייעודי כך שהמרחק בין המיקרופון לפה התינוק היה זהה לכולם. ההורים תודרכו בביצוע הקלטה ביום טיפוסי בחייו של התינוק כאשר ההקלטה נמשכה 16 שעות ברציפות. מכל הקלטה של תינוק תועתקו ידנית 6 סגמנטים של 10 דקות (60 דקות לתינוק וסה"כ 720 דקות של תיעתוק ידני) ונספרו המדדים הבאים: כמות המילים שהפיק המבוגר, כמות ההפקות של התינוק ומספר חילופי התור בין המבוגר לתינוק. הנתונים שהתקבלו בספירה הידנית השוו לאלה שהתקבלו על ידי תוכנת הלנה .
תוצאות: באפן כללי נמצאה התאמה טובה בכל שלושת המדדים בין הספירה הידנית לספירה האוטומטית. ההתאמה הטובה ביותר נמצאה בספירת כמות המילים ואילו ההתאמה הנמוכה ביותר נמצאה בספירת חילופי התור. נמצאה עלייה בכל המדדים בין גיל 3 ל-6 ח` על פי הספירה האוטומטית ונמצאה התאמה קרובה בין הגיל הקולי כפי שנקבע על ידי התוכנה לבין הגיל הכרונולוגי של התינוקות.
מסקנה: הטכנולוגיה נמצאה מתאימה לשימוש בתינוקות דוברי עברית בגילאי 3-10 חודשים ועל כן ניתן להשתמש בה בגילאים אלה להערכה כמותית של שלושת המדדים באוכלוסיות שונות של תינוקות. בשלב הבא אנו מתכננים לבחון את התאמת האלגוריתם של לנה למדידת כמות ההפקות של תינוקות וילדים גדולים יותר שלהפקותיהן אפיונים שונים מאילו של תינוקות צעירים.