איתור מילות מפתח מדיבור שוטף

PRISM כחול לבן: במסגרת הכנס הבינלאומי השלישי של המרכז לעיבוד שפה שנערך במכללת אפקה, הוצג פרויקט משותף למרכז לעיבוד שפה במכללת אפקה ולחטיבה הביטחונית של חברת נייס לפיתוח אלגוריתם לאיתור מילות מפתח בשפות המעניינות את התחום המודיעיני

הכנס הבינלאומי השלישי של המרכז לעיבוד שפה במכללת אפקה (צילום: עמי רוחקס דומבה)

היום (שני) נפתח במכללת אפקה להנדסה בתל אביב הכנס הבינלאומי השלישי של המרכז לעיבוד שפה, בנושא טכנולוגיות עיבוד דיבור. לכבוד הכנס הגיעו לישראל כמה מהחוקרים הבכירים בעולם בתחום עיבוד הדיבור: פרופ' צ'ין הו-לי (Chin-Hui Lee), מ- Georgia Institute of Technology – ארה"ב, הנחשב לאחד המומחים העולמיים בתחום ופרופ' לארי רבינר מאוניברסיטת ראטגרס שנחשב לאבי טכנולוגיית זיהוי הדיבור, וכן מומחים נוספים מאוניברסיטאות בכירות ברחבי העולם. בראש הכנס עומד פרופ' עמי מויאל, ראש המרכז לעיבוד שפה, מכללת אפקה להנדסה.

הכנס נערך על רקע פרשת ההאזנות שביצע הממשל האמריקאי למאות אלפי אזרחים פרטיים. בהקשר זה הוצג  פרויקט המשותף למרכז לעיבוד שפה במכללת אפקה ולחטיבה הביטחונית של חברת נייס במסגרתו מפתחים שני הגופים אלגוריתם לאיתור מילות מפתח  בשפות המעניינות את התחום המודיעיני.

עוד נדון בכנס בין השאר נושאי טכנולוגיות עיבוד דיבור השונות: זיהוי דיבור, איתור מילות מפתח, זיהוי דובר, ממשק אדם מכונה, אפליקציות מבוססות עיבוד דיבור, התפתחויות מסחריות בתחום ועוד. כנס זה מהווה במה מרכזית למפגש בין תעשיה לאקדמיה, הצגת חדשנות טכנולוגית, ליצירת הזדמנויות עסקיות ולהפניית זרקור למחקר האקדמי בתחום עיבוד דיבור במוסדות אקדמיים שונים בארץ ובעולם.

יומו הראשון של הכנס הוקדש למושבים מקצועיים מרכזיים במגוון נושאים. בין היתר  פרופ' לארי רבינר הוביל מושב בו הוצגו מחקרים בנושאים: זיהוי דיבור ספונטני, זיהוי מילות מפתח במידע מוגבל כחלק מתכנית באבל של המודיעין האמריקאי לזיהוי מילות מפתח בשפות שונות. לאחר מכן הנחה פרופ' עידו דגן מושב בו הוצגו מחקרים בנושאים: זיהוי דיבור בממשקי רכב, הבנת שפה באמצעות מערכת הסקה אוטומטית ושימושים בהקשר להבנת פלט מעוות.

בהמשך היום ד"ר נאוה שקד הובילה מושב בו הוצגו מחקרים בנושאים: מידול הגייה, מימוש אקוסטי של מתח לקסיקלי בעברית וסמנים קוליים לניטור חולה דמנציה. ד"ר ורד אהרונסון הובילה מושב בו הוצגו מחקרים בנושאים: הפקת וקטור שאינו ליניארי לזיהוי דובר, איתור דום נשימה חסימתית באמצעות זיהוי דיבור ואיתור רגש לניטור חולי דמנציה.

מחר, יום ג', יומו השני של הכנס ובו ייערכו סמינרים וקבוצות עבודה במסגרתן ינחה פרופ' רבינר סמינר בנושא ספרית  MATLAB חדשה שפיתח לזיהוי דיבור וכן ייערכו קבוצות עבודה בחלוקה לפי נושאים בהם זיהוי רגשות, זיהוי דיבור נייד, זיהוי והכרת הדובר, ניתוח דיבור וממשק עבודה קולי.

"תחום עיבוד דיבור ובפרט זיהוי דיבור צובר תאוצה בשנים האחרונות בשני שימושים עיקריים. האחד תקשורת אדם-מכונה באפליקציות כמו סירי והשני לצורך חיפוש במאגרים קוליים כאשר בהקשר זה השוק המודיעיני בטחוני הינו רלוונטי מאוד ואכן מספר הרצאות בכנס עוסקות בנושא זה", אמר פרופ' מויאל.