חוק מס' 4 - להשערות צריך להיות הסבר סיבה-תוצאה רציונלי, שניתן להתחקות אחריו עד לרמת האירועים.
בנית השערות משמעותיות הוא המטרה העיקרית ב- data mining analytics. פירוט: להשערה יש מבנה בן ארבעה חלקים (כמו לכל חוק):
- תנאים מוקדמים או טווח קיום,
- גורמים,
- תוצאות,
- ופונקציה המקשרת בין גורמים לתוצאות.
הגדרה: "השערה" היא מונח שנטבע בסטטיסטיקה לגבי תיאוריה לפני שעברה מבחן. data mining analytics מהווה אם כן, שלב מוקדם של הכנת השערות למבחנים סטטיסטיים.
בדיקת השערות או
על הקשר סיבה-תוצאה במדע הנתונים והחידוש שלו ביחס לסטטיסטיקה
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
הקשר בין סיבה לתוצאה בכריית נתונים יכול להיות מהותי או אסוציאטיבי בלבד (קשר באמצעות גורם נוסף), אך לא קשר הפוך, שבו התוצאה היא בעצמה גורם מפתח, או טאוטולוגיה שבה ביטוי אחד של התוצאה בא להסביר ביטוי אחר שלה.
לפי עקרונות המדע החדשים, קשר הפוך או טאוטולוגי לא יעמוד בבדיקות הנדרשות להלן.
בדיקת השערות: (א) ניתן להפריך ולהצדיק השערה באופן לוגי על פי דפוסי התנהגות הנתונים (הקבוצות);
(ב) השערה ניתנת לשרשור מהקבוצה שבה נמצאה עד לרמת האירועים הפרטניים שלה;
(ג) אם תחום קיום ההשערה חופף להגדרת מקורות הנתונים, יש לוודא שהתופעה אינה נובעת ממשתנים טיפוסיים למקורות אלה.
...צפיתי בסרט שבו המשטרה הציגה 3 סוגי הוכחה הנחוצים בעקרון לביסוס תביעות.
הסוגים נראים דומים ל-3 סוגי הבדיקות דלעיל.
להלן השוואה מהירה:
1. בחקירה משטרתית נדרשות עובדות משמעותיות או forensics.
- במקרה הכללי צריך להצביע על דפוסי התנהגות טיפוסיים שמתאימים להשערות.
2. בחקירה משטרתית צריך למצוא מוטיבציה.
- במקרה הכללי צריך למצוע קשרי סיבה-תוצאה שמסבירים את ההזשערה.
3. בסוף חקירה משטרתית נדרש לקבל הודאה באשמה.
- במקרה הכללי נדרש לקבל אישור על היתכנות ההשערה.
ביסוס ההשערות במתכונת מדע הנתונים החדש, מיצר מגדיל מאד את האפקטיביות ויכולת הלמידה הנמשכת, בזכות האוביקטיביות, ההתמקדות, גילוי סיבות שורש, והשגת תבנות בשיתוף פעולה פורה בין אנליסטים למשתמשים.
/right]