הביג דאטה ומשוואת הסיכוי-סיכון

"גישת ה-BI שונה בתכלית מגישת ה-Big Data", אומרת ד"ר פטרישיה פלוריסי, סגנית נשיא וה-CTO של המכירות ב-EMC בראיון לישראל דיפנס. "הביג דאטה מאפשרת לארגון להתמודד טוב יותר עם העתיד, גם אם מדובר בגישה שיש בה יותר אי ודאות בהיבט החיזוי. אמזון זו דוגמא מצויינת לשימוש מוצלח בגישה זו".

ד"ר פטרישיה פלוריסי, סגנית נשיא וה-CTO של המכירות ב-EMC

יש היום פער בין הטכנולוגיה לבין היישום שלה בפועל. זו אולי המסקנה הכי חשובה שיצאה מהראיון שערכתי עם ד"ר פטרישיה פלוריסי, סגנית נשיא וה-CTO של המכירות ב-EMC. "אנחנו מדברים על מעגל החיים של המידע שמורכב משלושה חלקים - פיתוח תוכנה, ייצור מידע וניתוח מידע. החלקים מפרים ומשנים אחד השני בצורה דינאמית ומהירות השינוי היא המפתח לצמצום הפער הקיים", מסבירה פלוריסי.

כדי להבין טוב יותר את המשמעות של הדברים יש להתייחס למגמת השינוי שעובר עולם ה-IT מפילוסופיה של Business Intelligence לפילוסופיה של Big Data. השינוי מתבטא בעיקר בדרך שבה הלקוח, בין שהוא אזרחי או ביטחוני, תופס את העתיד.

תפיסת ה-BI מסתכלת על ההיסטוריה של הארגון, מנתחת את הנתונים ומנסה לחזות כיצד יתנהג הארגון בעתיד על בסיס העבר. במילים אחרות, זו פילוסופיה דטרמיניסטית שהופכת את הארגון לשבוי של עתיד ידוע מראש (גם אם הוא לא יתקיים במציאות). היתרון בגישה זו טמון בודאות שהארגון מקבל בהווה על העתיד. בהסתכלות אחרת, אפשר לתאר מצב זה כהיוון סיכונים עתידיים על בסיס העבר. בצורה כזו עובדים מרבית הארגונים כיום, הן המסחריים והן הביטחוניים.

"לעומת גישת ה-BI, גישת ה-BD מציגה פילוסופיה שונה. דוגמא טובה להמחשת הרעיון היא חברת אמזון" , מסבירה פלוריסי. "אמזון בחרה בדרך ניתוח נתונים שאפשר לקרוא לה Peer [חבר/רע]. כלומר, היא מנסה לחבר בין יישויות על בסיס העדפות. אם גולש A רכש ספר X וגם גולש B רכש ספר X, כלומר מתקיים ביניהם קשר מבוסס על העדפה משותפת. בצורה כזו אפשר להציג לגולש A המלצות רכישה לספרים על בסיס ספרים ש-B רכש , ולהיפך. בצורה כזו אמזון הצליחה להגדיל את מכירות הספרים בסדרי גודל.

"הרעיון מבוסס על הטענה הכללית שבן אדם מחפש כאלו שדומים לו. מכאן שצריך לחפש הקשרים משותפים בין יישויות המידע כדי לנסות לחזות התנהגות. זו חשיבה שונה מ-BI שמחפשת דפוסי התנהגות של היישות על בסיס התנהגות עבר".

ההבדל בין הגישות מכתיב גם התייחסות שונה לעתיד - בעוד ה-BI מציעה ודאות, ה-BD מציעה עתיד פחות ודאי, אך עם הזדמנויות גדולות יותר. אבל לא מדובר רק בהזדמנויות. התבססות על כלי BI משאירה את הארגון באותה צורת חשיבה ואינה מאפשרת לו למשל להיכנס לתחומים חדשים או לבצע שינויים ארגוניים בצורה כזו שתכין אותו לעתיד אחר (והוא בדרך כלל אחר). מדובר בגישה שאמנם משפרת את הידע של הארגון על המציאות העכשווית, אך משאירה אותו שבוי בפרדיגמות קיימות.

כדי לשנות זאת, יש צורך בגישה שאינה מתבססת על העבר, אלא בוחנת כל הזמן את ההווה באמצעות ניתוח של ההקשרים הקיימים בין היישויות מתוך המידע הקיים (שמתהווה בצורה דינאמית) ואת התובנות שעולות דוחפים לתוך יישומים חדשים כדי שייצרו עוד מידע חדש וכך הלאה בצורה מעגלית. זה בדיוק המעגל שדיברנו עליו קודם לכן - פיתוח תוכנה, ייצור מידע וניתוח מידע. וכפי שציינו, מהירות הסיבוב של המעגל, היא זו המאפשרת לארגון להתמודד עם העתיד בצורה טובה יותר.

נשמע מופרך? ובכן, אם בוחנים ארגונים מובילים בעולם כמו פייסבוק, גוגל, לינקדאין וטוויטר, מגלים שכולם מיישמים את הפילוסופיה הזו. גם בחינה של פעילות ארגוני ביון תגלה שהם משתמשים באותה פילוסופיה. מספיק לבחון את המסמכים שהדליף אדוארד סנאודן לגבי ה-NSA וה-GCHQ הבריטי כדי לקבל טעימה מהיכולות הטמונות במעבר של ארגון לפילוסופיית BD.

חלק מהטכנולוגיות שעוזרות למעגל החיים של המידע להסתובב מהר יותר כבר כאן - בין שזו הרשת הסמנטית שעוזרת לקשר בין יישויות, בסיס נתונים גרפי, כלים של ניתוח סנטימנטלי, ארכיטקטורת Haddop, כונני SSD ו-InfiniBand. כולן משמשות כאבני בניין לתשתית חומרה ותוכנה שמאפשרת להריץ את המעגל הזה מהר יותר.

"צריך לזכור שלא מדובר בהחלטה דיכוטומית - BI או BD", אומרת פלוריסי. "אפשר לחשוב על זה כסולם עם הרבה שלבים כאשר הארגון הוא זה שקובע איפה הוא רוצה להיות בבחינת יחס הסיכוי-סיכון. אחד התפקידים הכי משמעותיים בהקשר זה הוא מדען הנתונים. אלו אנשים שמקבלים הכשרה אקדמאית במגון תחומים רלוונטים ובעזרת תמיכה מצד אלגוריתמים של לימוד מכונה, הם יודעים למצות התובנות מהמידע עבור אלו שמפתחים את היישומים. מדעני הנתונים הם הפונקציה הארגונית שיכולה לעזור לארגון לצמצם את הפער הקיים בין הטכנולוגיה שנמצאת 'על המדף' לבין היישום שלה בפועל".

You might be interested also