עינוי מים - אנלוגיה של אנליטיקס הולכת וגשר רחוק מדי

ניתוח טפטוף

נתונים, כמו מים, מגיעים בצורות רבות. המוח האנושי התפתח כדי לסנן את רוב הנתונים שמגיעים בדרך שלנו מכיוון שיש פשוט כל כך הרבה מהם.

כשאתה פותח עיניים ואוזניים, הנתונים נמצאים בכל מקום. צבע הקיר, צליל המיזוג וריח הקפה של שכנתכם מתייחסים כמו לחות. המים נמצאים באוויר כל הזמן אבל זה לא שימושי לשים לב אליהם הרבה.

כשמים מתעבים לערפל, זה מכריח אותך לראות את זה ומקשה על הבנת העולם סביבך. מערכי נתונים לא שלמים, נתונים פגומים, מדע רע, מסקנות כוזבות והטיות קוגניטיביות גורמים לך לאבד את הדרך בערפל.

הנתונים יורדים כמו גשם. כשיש רק מעט, זה ממש לא מספק - מספיק כדי ללכלך את המכונית ולבלבל את השיחה. אתה מוצא את עצמך מנגב את המקום על המשקפיים שלך כמישהו מזרז נקודת נתונים אקראית, שנלקט ממקור לא ברור כלשהו.

  • מים מעופשים בבריכה רדודה זה מסוכן. נתונים, שנאספו מהיצע לא אמין, לא טוהרו או מנורמלים ונותרו לגדול עומדים, יכולים להוביל בקלות למסקנות פגומות.
  • A טפטוף יציב מים יכולים להספיק בדיוק כדי למלא קנטינה או לקיים מערכת אקולוגית ביערות. שלוש נקודות נתונים בלבד (מספר הודעות הדוא"ל שנשלחו, לעומת פתיחה לעומת לחיצה) יכולות לקיים תוכנית שיווקית.
  • A זרימה בריאה יותר נתונים בצורת נחל קטן יכולים לשמש לרחצה. זרימת נתונים רציפה מאפשרת ביצוע ביצועים והשוואה היסטורית. ניתן לבצע אופטימיזציה לדפי נחיתה באמצעות נתוני המרה קבועים.
    A נהר צנוע יכול להניע טחנה לניסור עץ או טחינת חיטה. מנוע המלצה זקוק לתרומה אמינה רק מקומץ יובלים בכדי לספק עליית ערך עגלות הקניות.
  • A מפל מים יכול להניע גלגל מים ענק וזרם מספיק של מידע יכול להניע מערכת תוכן דינמית בזמן אמת.
  • A נהר זה רחב ועמוק מספיק יכול לתמוך בענף תחבורה שלם. מספיק נתונים יכולים לצוף דוברות וספינות משא בצורה של אוסף של עוגיות מרשתות פרסום, מצטברים של נתוני תכנית כרטיסי נאמנות ומתווכי נתונים.

כאשר הנתונים מגיעים בכמויות צפויות במועדים הצפויים, ניתן ללכוד אותם, לתעלם ולהשתמש בהם. מערכות השקיה, סכרים ומאגרים מספקים תחושת שליטה ומאפשרים בנייה של תשתית הולכת ומתרחבת עם תעלות, מנעולים וסכרים. מחסני נתונים נבנו על זרימה פחות אמינה.

ניקיון הוא לצד האלוהות

מים נקיים הם חיוניים להצלחת חיים, השקיה, תחנות כוח פועלות וכו '. ההגדרה' נקי 'עשויה להשתנות לצורך העניין; זה בסדר אם יש אצות במים שמקררים תחנת כוח וזה לא מקובל אם יש יותר מ 10 חלקים למיליארד ארסן במי שתייה.

הנתונים זהים. ביישום דיוור ישיר, אם יש לך תואר של אדם (מר, גברת, גב ') הוא לא חשוב ... אלא אם כן אתה שולח דואר לרופאים. אבל נתונים מלוכלכים ידרדרו אותך בכל פעם מחדש.

כמדען הנתונים הראשי בארה"ב, די ג'יי פאטיל, הניח זאת בפסגת ה- CTO בסיבוב הראשון, "אם אינך חושב כיצד לשמור על הנתונים שלך נקיים מההתחלה, אתה מועמד. אני מבטיח את זה. לנסות לנקות את זה אחרי העובדה ייקח לפחות חודשים. "

אם תחמם מים עד לסף רתיחה, היא יכולה לחולל מהפכה תעשייתית שלמה. נראה כי נתונים עושים את אותו הדבר. מהרגע שהמחשבים יכלו לאחסן ולחשב, נאספו נתונים באותה מהירות שאפשר היה ליצור את ציוד האחסון לשם כך.

אגם הנתונים

כשהנתונים מיובלים אלה מטפטפים במנועי הטחנות, הכל מסתיים באגם, מאחורי הסכר. מכיוון שנתונים מושחררים באופן מבוקר, הם מריצים את הטורבינות של תעשיית הנתונים; אותם מנועי ענק לעיבוד נתונים עם שמות כמו גוגל ופייסבוק. לא תהיה כאן בצורת.

ולבסוף, ישנה בריכת מים עמוקה, שמחכה שהאנליסט יצלול פנימה. ציוד צלילה ואקדח חנית ביד, האנליטיקאי חוקר את העמק, ממפה קרקע חדשה ומגלה מינים חדשים. זו תקופה מאוד מרגשת להיות חוקר נתונים.

זו הסיבה שכל כך הרבה מהם התייצבו ל פסגת eMetrics מאז 2002. ההזדמנות הבאה היא בבוסטון, 27 בספטמבר עד 1 באוקטובר 2015.

הרשמת פסגת eMetrics

גשר אחד רחוק מדי

ומה בכוח הנתונים לגלף את הגרנד קניון הבא? מה עם ההיתוך הקרחוני של נתונים מובנים? איך מטפלים בשפכים בעולם שהופך להיות יותר ויותר מודע לפרטיות?

אלה שאלות לפעם אחרת ומים מתחת לגשר.

מה אתה חושב?

אתר זה משתמש Akismet כדי להפחית דואר זבל. למד כיצד הנתונים שלך מעובדים.