התחברות

התחברות
x
x
הרשמה
x

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

חדש בפורומים

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 7 של מדע הנתונים החדש- קשרי סיבה ואסוציציה

חוק מס' 7 של מדע הנתונים החדש- קשרי סיבה ואסוציציה 1 year 3 months ago #8423

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 314
  • קרמה: 0
חוק מס' 7 מגדיר קשרים סיבתיים ואסוציאטיביים בבניית השערות (זו הרחבה של חוק מס' 4 הדן בהשערות).
כדי שקשר עקבי בין משתנה למטרה* יחשב לסיבה, נחוץ שיהיה מאחוריו הסבר חד משמעי, לוגי או מהותי, לגבי שורש התופעה הנבדקת; אם אין הסבר כזה, הקשר מוגדר כאסוציאטיבי בלבד.
למה חשוב למצוא סיבות? הסיבות מאפשרות חיזוי מדויק ולטווח רחוק יותר, ובעיקר – הן מצביעות על צירופי הגורמים שדרכם ניתן להתערב בתהליך ולהשפיע עליו באופן "פרואקטיבי".

דוגמא:
נניח שבניתוח תוצאות משחקי כדורגל נמצא קשר בין מס' הנצחונות לארבעה משתנים: ס"ך השערים שקבוצה הבקיעה בעונה קודמת, דירוג ממוצע של השחקנים, דירוג המאמן, ומספר השחקנים הזרים שהצטרפו לקבוצה בשנה האחרונה. המשתנים קלים להסבר. הגיוני שקבוצת כדורגל תצליח יותר ככל שיהיה לה יותר כושר מוכח, הדירוג של השחקנים והמאמן יהיה גבוה ושחקני חיזוק יצטרפו אליה. הבעיה, שגם ההסבר ההפוך די הגיוני. ייתכן שהצלחה של קבוצה מביאה לה הכנסות, מוניטין ומוטיבציה, ויכולת להשיג שחקנים טובים. מנהלי הקבוצה רוצים לדעת בדיוק מהם הגורמים המשפיעים על ההצלחה. מסתובבות תיאוריות שונות לנושא. יש הסבורים שגיל השחקנים קובע, יש שסומכים על המאמן בלבד, ישנם אנליסטים שיכולים להראות שהמנבא הטוב ביותר להצלחה הוא ...ההצלחה בעונה קודמת. השאלה היא, איך אפשר לדעת מהם הגורמים שמשפיעים בפועל?
לפי חוק מס' 7, מוצאים את הגורמים שהם סיבות שורש. כאן נמצאו נניח שניים: "מספר שערים בשנה קודמת" ו"דירוג מאמן". גורמי השורש מתניעים את תהליך ההצלחה כולל תהליכים הקשים לכימות, כגון: הגדלת מוטיבציה, אהדת הקהל, ותמיכת הרשויות המקומיות. שני גורמי השורש מיצרים נוסחא פשוטה ונוחה להרצה במחשב.
המודל השלם מציע בנוסף לנוסחת ההצלחה גם איתור דפוסים חריגים ואינדיקטורים מוקדמים.

* מטרה יכוללה להיות מבוטאת בעזרת מספר משתנים המתארים צדדים שונים שלה. בדוגמא הנ"ל של ניתוח הצלחת קבוצות כדורגל, אפשר להגדיר "רווחיות קבוצה" כמשתנה-מטרה עקיף שמתאר הצלחה במונחים של כסף (במקום של שערים).

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.166 שניות

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning