ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: לא מנצלים אפילו 1% מהנתונים

לא מנצלים אפילו 1% מהנתונים 11 years 1 day ago #5523

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
אנחנו רואים את זה בכל מקום
זרם גדול של נתונים
אפילו אצל משתמשים ביתיים
אותם שלפני שנים ספורות עדיין שאלו "מי צריך מחשב" ו"מה לעשות עם זה"
ואולי דווקא הם הפגיעים ביותר.
לא ערכתי סקר בענין, אך להרגשתי,
משתמשים חדשים ברשת עושים את הקפיצה הגדולה ביותר בכמויות מידע,
בגלל הרגלי צריכת המדיה שלהם, שכוללים סרטים וסדרות טלויזיה,
אשר אותם הם רגילים (עדיין) לשמור.
בקיצור, אף אחד לא פטור מענשו של שטפון המידע.

עליית נפחי המידע היא בתאוצת גידול.
אפשר לחשוב על מספר סיבות לכך:
  • נתונים אוטומטיים
  • העובדה שצרכני מידע הפכו גם ליצרני מידע
  • הפצה אלקטרונית זמינה לכל אחד
  • חיבור בין מחשבים לתקשורת

קצב השתכללות כלי כריית נתונים לא מדביק את ההתפתחות הזאת.
התוצאה היא שאחוז הנתונים המוסברים הולכת וקטנה,
ושמישות מאגרי המידע יורדת.

לפני 7 שנים שמעתי הערכת מומחים,
כי רק 1% מהמידע בנתונים מנוצל.
בלי להכנס לשאלה המענינת בפני עצמה "איך מודדים את הניצול?"
יש להניח שהיום שיעור הניצול נמוך בהרבה יותר.

זה מוביל אותי למסקנה: צריך כללים חדשים להתיחסות לנתונים,
אחרת הטכנולוגיה הטובה תביא אותנו בסופו של ענין לאבסורד.

בין הכללים החדשים, החשוב ביותר לדעתי הוא הכלל של שימוש בנתונים לא-דגומים unsupervised data.
הכלל השני, להבנתי, וראוי לדבר עליו בנפרד ובהרחבה,
הוא "זיהוי דפוסי התנהגות בצורה ממוחשבת".


בברכה,
אדית

בברכה
אדית
עריכה אחרונה: 11 years 1 day ago  ע''י Edith Ohri.
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.147 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning