שיבוט קול: בין נגישות להונאה - כך הטכנולוגיה משנה את כללי המשחק

האמת המדאיגה היא שהונאות באמצעות חיקוי קול מלאכותי הפכו למציאות מטרידה

שיבוט קול: בין נגישות להונאה - כך הטכנולוגיה משנה את כללי המשחק

Photo by Tim Mossholder on Unsplash

טכנולוגיות חדשות מאפשרות "לשבט" קולות אנושיים, מה שפותח פתח להזדמנויות מדהימות, אך גם לסכנות מטרידות. האם אנחנו מוכנים לעידן שבו כל קול יכול להיות מזויף?

דמיינו תרחיש: אתם מקבלים שיחת טלפון ממספר לא מוכר, ובצד השני נשמע קול מוכר ואהוב, קולו של בן משפחה במצוקה, המבקש עזרה כספית דחופה. האם תחשדו? האם תהססו לפני שתושיטו יד לעזרה?

האמת המדאיגה היא שהונאות באמצעות חיקוי קול מלאכותי הפכו למציאות מטרידה. מקרים של זיוף קול של בני משפחה, אנשי אכיפת חוק ומנהלי כספים כבר דווחו, והטכנולוגיה מאחורי התופעה, המכונה "שיבוט קול", הופכת נגישה ומשוכללת יותר ויותר.

שיבוט קול, אם תהיתם, הוא שימוש בדגימת קול של אדם על מנת ליצור העתק קולי מטעה באמצעות טכנולוגיה מתקדמת. התוצאה? אפשרות להפיק כל תסריט שמע שעולה על הדעת, ולהטעות את השומע לחשוב שמדובר בקולו האמיתי של האדם.

כיצד זה עובד?

חברת מיקרוסופט, לדוגמה, פיתחה כלי חדשני בשם VALL-E, המאפשר "לשבט" קול על סמך דגימת דיבור קצרה להפליא - שלוש שניות בלבד! כלים אלו משתמשים בהמרת טקסט כתוב לקול מלאכותי, ומספקים חיקוי אמין לא רק של הקול האנושי ככלל, אלא גם של קול ספציפי, עם דקויות וניואנסים.

אך לצד השימושים החיוביים הפוטנציאליים, כמו נגישות לאנשים עיוורים וכבדי ראייה, טמון פה פוטנציאל הרסני.

הצד האפל של הטכנולוגיה

בעוד ג'יימס ארל ג'ונס, קולו המאיים של דארת' ויידר, אישר לחברת דיסני להשתמש בהקלטות שלו כדי ליצור קטעי שמע חדשים גם לאחר מותו, ההשלכות של שיבוט קול חורגות הרבה מעבר לבידור.

הטכנולוגיה מאפשרת יצירת קטעי שמע מותאמים אישית, אך גם פותחת פתח להונאות ושימושים זדוניים בקול משובט של אישיות מוכרת, או גרוע מכך - של אדם קרוב.

הסוד מאחורי הקסם (והאימה)

מערכות שיבוט קול מנתחות דוגמאות קוליות רבות, מפרקות מילים לפונמות ומקודדות את מאפייני הקול לערכים מספריים. כך, המערכת לומדת את הקשרים בין הפונמות לשמע ומייצרת טקסט בקול ספציפי. אפילו הסביבה האקוסטית של הדיבור ניתנת לחיקוי, מה שהופך את השיחה המלאכותית לאמינה במיוחד.

מאחר שדגימת קול קצרה מספיקה כדי לשבט קול, ניתן לזייף קובצי שמע בכל הקולות שהוקלטו והועלו לרשת, לעיתים אף בלי ידיעת הדוברים. אפילו שיחת טלפון קצרה יכולה לספק את הדגימה הדרושה.

מה עושים?

הסכנות האפשריות כוללות הונאות כלכליות, פגיעה במערכות זיהוי קולי וערעור האמון במדיה. חברת OpenAI אף השתהתה בהפצת כלי ליצירת קול עקב חששות אלה.

הפתרון? רגולציה והגבלה של מערכות שיבוט קול, פיתוח כלים לבדיקת אותנטיות של קטעי שמע, ומעל הכל - מודעות וזהירות.

בעידן שבו קול כבר אינו הוכחה, עלינו לפתח מנגנוני הגנה חדשים ולהטיל ספק בשיחות ממספרים לא מזוהים. הכוח, יותר מתמיד, נמצא בידינו.


למאמר המלא באתר מכון דוידסון לחינוך מדעי, הזרוע החינוכית של מכון ויצמן למדע