הבעיה עם "נתונים גדולים"

נתונים גדולים

אחד המונחים הפופולריים ביותר שנראה כי צץ בכל אתר טכנולוגי בימינו הוא נתונים גדולים. אני חושב שהתעשייה עושה שירות רע עם השימוש החורג שלה והתמונה הלא מדויקת שהיא מתארת ​​את מה שקורה באמת.

נתונים גדולים הם מילת מפתח, או ביטוי לתפוס, המשמש לתיאור נפח עצום של נתונים מובנים ובלתי מובנים, גדולים כל כך עד שקשה לעבד אותם באמצעות טכניקות מסד נתונים ותוכנה מסורתיות. לפי וובופדיה

הבעיה היא שביג דאטה הוא לא רק א מסד נתונים גדול. ביג דאטה הוא בעצם תיאור דו מימדי. הבעיה היא שחברות לא נאבקות רק במאגרי מידע גדולים, אלא נאבקות במהירות הנתונים. זרמי נתונים ענקיים מגיעים בזמן אמת שיש לנרמל אותם ולהציג אותם בצורה המספקת ניתוח של המתרחש לאורך זמן.

אני מאמין שתיאור מדויק יותר עשוי להיות הזרמת נתונים. לסטרימינג של נתונים יש גם את ההבטחה למצוא נאגטס מידע שמשווקים יכולים לנצל, וגם זמן אמת, מגמה ו מנבא ניתוח שיכול לספק למשווקים הזדמנויות להתאים את האסטרטגיה שלהם כדי למקסם את התוצאות. מערכות צריכות לנרמל, לארכז, להציג ולחזות כדי שנוכל לנצל באמת את זרמי הנתונים המסיביים הזמינים.

אל תלך שולל על ידי שיחות השיווק סביב נתונים גדולים. הפתרונות כבר קיימים לעיבוד כמויות עצומות של נתונים. הַקָשָׁה הזרמת נתונים זה מה שאנחנו באמת זקוקים לו.

תגובות 3

  1. 1

    אני מסכים לחלוטין עם ההגדרה שלך ואיך "ביג דאטה" הפכה למילת הבאזז החמה. ניהלתי הבוקר שיחה עם עמית על "מילות זמזום".

    הבעיה היא שעם שימוש יתר, אתה משקה את המטרה והמשמעות האמיתית שמאחוריה עד שהרוב ששמע ומשתמש בה לא ממש מבין זאת. דברים דומים קרו עם "מחשוב ענן" והרשימה עוד ארוכה.

  2. 2
  3. 3

    מאמר נהדר דאג. הקשה על נתוני סטרימינג היא המפתח! איסוף נתונים ממערכת פנימית וממקורות חיצוניים, הצטרפות אליהם בזמן אמת, ניקוי הנתונים, אולי לעשות התאמה מטושטשת ואז להעביר תובנות, התראות והודעות כדי להפוך אותם לפעילים זה דבר יפה. לחברות שיכולות להעביר את השיווק שלהן בזמן אמת יהיה להן יתרון משמעותי. חברה עשויה להתחיל להשתמש בנתוני סטרימינג כדי להשיג זכיות מהירות על ידי יצירת התקשרות של 10-15% במעורבות, אך בקרוב הם יגלו שיש לה יתרונות נלווים לייצור, מכירה, משלוח, מימוש וכו '. זה היה הניסיון שלנו .

מה אתה חושב?

אתר זה משתמש Akismet כדי להפחית דואר זבל. למד כיצד הנתונים שלך מעובדים.