ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 1 של מדע הנתונים (החדש)

חוק מס' 1 של מדע הנתונים (החדש) 4 years 2 weeks ago #8405

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
חוק מס' 1
בנתונים לא-מפוקחים, מספר המשתנים גדול ממספר הרשומות,
במצב זה אי אפשר להגיע לפתרון מתמטי/סטטיסטי.
מדע הנתונים החדש מאפשר פתרון ע"י צמצום מספר המשתנים ע"י הקבצת הרשומות (האירועים) לדפוסי דמיון שבתוכם המתארים הם זהים.

הסבר: בנתונים לא מפוקחים לכל אחד מ-k האירועים יש צירוף תנאים סביבתיים פרטיים משלו שיכול להשפיע על המטרה. אם מוסיפים לרשימת n המשתנים את תנאי הסביבה של האירועים, מקבלים סה"כ n+k משתנים שהוא גדול מ-k הרשומות. כדי להגיע לפתרון הכרחי במצב כזה להקטין את מספר המשתנים. מדע הנתונים החדש מבצע את ההקטנה ע"י הגדרה של ישויות חדשות - "קבוצות דמיון", שמאפשרות לנתח את הרשומות שבתוכן כאילו הן נוצרו בסביבה אחידה, כלומר – כאילו הן מפוקחות.

דוגמא:
ברשת מזון שממוקמת באזור מסוים בארץ ההנהלה מבקשת לדעת יותר על גורמי ההצלחה של מבצעי מכירות. ההנהלה יודעת מראש על שלושה גורמים: גודל ההנחה, עונתיות או התאריך בשנה, וקיומם של מבצעים מתחרים.
בניתוח דפוסי ההתנהגות נמצאו נניח 5 קבוצות ראשיות: לקוחות שאינם חברי מועדון הקונים מוצרי יוקרה, לקוחות הקונים יחסית הרבה מוצרים מסובסדים, חברי מועדון ותיקים בעלי הרגלים קבועים, חברי מועדון המשתמשים בשירותי משלוחים, ולקוחות המוציאים סכום בינוני בקנייה. נניח שרק קבוצות "המוצרים המסובסדים" ו"הלקוחות שמוציאים סכום בינוני" מגיבות בעירנות למבצעים, ויתר שלוש הקבוצות כמעט אדישות.
התמקדות בלקוחות של שתי הקבוצות המגיבות, עשוי לגלות גורמים שיגבירו את הצלחת המבצעים, כפי שהתבקש, ובנוסף לגלות תובנות שלא הוגדרו במטרה, כמו (נניח) התובנה שלקוחות המגיבים למבצעים נוטים להצטרף למועדון, ולקוחות שהם חברי מועדון משדרגים את היקף הקניות החודשי ואת ההזמנות באינטרנט.

www.researchgate.net/project/Philosophy-...r-big-data-analytics


אשמח לקבל הערות ושאלות.

בברכה
אדית
עריכה אחרונה: 11 months 2 weeks ago  ע''י Edith Ohri. סיבה: תיקון ניסוח והוספת דוגמא
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.183 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning