מפא"ת משקיעים בעיבוד שפה

"אנחנו רוצים להגיע בשנים הקרובות למצב בו נדע גם לזהות רגשות ולהצביע האם הדובר נמצא במקום סגור או פתוח", אמר אל"מ יניב רותם, רמ"ח מערכות במפא"ת בכנס לעיבוד שפה שנערך במכללת אפקה בתל אביב. "היום אנחנו צריכים אלפי אנשים שיישבו על כל כמויות המידע העצומות ועדיין אנחנו יודעים שיש ידע שאנחנו מאבדים"

כנס עיבוד שפה שנערך במכללת אפקה בתל אביב (יח"צ)

ביומיים האחרונים (7-8 ביולי) נערך במכללת אפקה להנדסה הכנס הבינ"ל השנתי לעיבוד דיבור אותו עורך המרכז לעיבוד שפה במכללה בראשות הפרופ' עמי מויאל. פתח את סדר היום אל"מ יניב רותם, רמ"ח מערכות במפא"ת, שהציג את חזון מפא"ת לשנים הקרובות בכל הקישור לפיתוח טכנולוגיות מבוססות עיבוד וזיהוי דיבור.

אל"מ רותם הכריז בכנס על שיתוף פעולה רב שנתי של מפא"ת עם המרכז לעיבוד שפה במכללת אפקה במסגרתו יערוך המרכז בשנים הקרובות מחקרים ופרויקטים בתחום עיבוד הדיבור עבור מפא"ת. הפרויקטים הצפויים במסגרת שיתוף הפעולה יעסקו בטכנולוגיות שונות לעיבוד דיבור וביניהן: זיהוי דיבור, איתור מילות מפתח, זיהוי דובר ותקשורת אדם-מכונה. כידוע, בשנים האחרונות הלך והתרחב השימוש של גופי ביטחון בעולם המערבי בטכנולוגיות זיהוי הדיבור לצרכים מודיעיניים וביטחוניים. לדבריו: "אנחנו רוצים בשנים הקרובות של שיתוף הפעולה להגיע לרמה גבוהה של התמודדות עם זיהוי דיבור וזיהוי דובר, מסיבות מובנות".

בדברים התייחס אל"מ רותם לאתגרים שעומדים כיום בפני מפא"ת בפיתוח טכנולוגיות עיבוד וזיהוי דיבור: "כיום אנחנו אוספים מידע רב שאנחנו צריכים לשלוט בו. אנחנו עובדים על איך להפוך את הביג דאטה לידע שאפשר להשתמש בו. מובן כי כדי להתכונן לאיומים מולנו אנחנו צריכים להעריך כמה שאפשר ולנסות לדעת מה מתכננים נגדנו". אל"מ רותם הוסיף כי "כיום המצב הוא שבישראל מתמודדים עם שפה קשה ולא עם אנגליה טהורה ונקיה. אנחנו צריכים אלפי אנשים שיישבו על כל כמויות המידע העצומות ועדיין אנחנו יודעים שיש ידע שאנחנו מאבדים מתוך בסיס הנתונים שלנו".

אל"מ רותם הציג גם גרף שהדגים כי בשפה הערבית ובשפה המנדרינית יש שגיאות רבות יותר בזיהוי הדיבור לעומת השפה האנגלית. "רוב המערכות שאנחנו עובדים איתם מבוססות השפה האנגלית ואנחנו רוצים להגיע למצב בו נתמודד דווקא עם השפה שאנחנו צריכים. אנחנו רוצים גם להגיע בשנים הקרובות למצב בו נדע גם לזהות רגשות ולהצביע האם הדובר נמצא במקום סגור או פתוח. במצב כיום, לא פעם אנחנו מתמודדים גם עם הפרעות ורעשים שהופכים את זיהוי ועיבוד הדיבור לאתגר גדול עוד יותר. הכלים שעומדים לרשותנו כיום אינם מספיקים למטרות שלנו. בין היתר אלה מבוססי כח אדם שהוא משאב מוגבל מטבעו".

ביחס לשיתוף הפעולה הצפוי עם מכללת אפקה אמר: ""אנו עדים לצורך הולך וגדל בטכנולוגיות השונות לעיבוד דיבור בקשת רחבה של יישומים. אנו שמחים כי מצאנו במכללת אפקה להנדסה שותף לפרויקטים שונים בהם המרכז יבצע פעילות מו"פ בתחומים השונים של עיבוד דיבור. מודל העבודה שגיבשנו הינו ייחודי תוך שימת דגש על ראייה אסטרטגית ויעדים רב-שנתיים. זהו בהחלט מודל מוצלח לשיתוף פעולה בין מפא"ת לאקדמיה."

ראש המרכז לעיבוד שפה במכללת אפקה, פרופ' עמי מויאל, הוסיף כי: "אנו גאים על בחירת מפא"ת במרכז לעיבוד שפה כמרכז ידע בתחום עיבוד דיבור. התוכנית הרב שנתית מעידה על האמון של מפא"ת בפעילות המחקר ופיתוח שמתקיימת במכללת אפקה והוכחה לכך שיש בהחלט מקום למרכזי ידע שיעסקו במו"פ יישומי באקדמיה."

על התכנית הרב שנתית ושיתוף הפעולה בין הגופים הוכרז בכנס הבינ"ל השנתי לעיבוד דיבור שעורכת מכללת אפקה. בכנס משתתפים מומחים וחוקרים בכירים בעולם העוסקים בתחומים שונים של עיבוד הדיבור: זיהוי דיבור, זיהוי דובר, אימות דובר ועוד. בין היתר יגיעו להציג בכנס את ניסיונם רב השנים וחזונם בתחום: מר ג'יי ווילפון, מנהל תחום עיבוד שפה ב-AT&T, פרופ' גו'ן בונסטרה סגן נשיא אוניברסיטת אביניון שבצרפת, פרופ' הרמן ניי מאוניברסיטת אאכן בגרמניה, פרופ' ריצ'רד סטרן מאוניברסיטת קרנגי מלון שבפנסילבניה, ארה"ב. כמו כן תיערך בשידור חי הרצאה מיוחדת של העתידן ריי קורצווייל המשמש כמנהל הפיתוח של חברת גוגל ואחראי על הפעילות בתחום עיבוד שפה ואינטליגנציה מלאכותית בנושא עתיד השפה בעידן של התפתחות מואצת של טכנולוגיות שונות.