ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: מסקנות וחריגים

מסקנות וחריגים 12 years 9 months ago #2103

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 352
  • קרמה: 0
מידע זה דבר וירטואלי, כלומר דיווח על דבר אחר, ולא הדבר עצמו. השוטטות בעולם הוירטואלי היא בעלת כללים שונים, ולהם ברצוני להקדיש פה כמה מילים.

ראשית, כלל הזהירות. התיחס לממצאים בערבון מוגבל, ואל תאמין סתם למראה עיניך. seeing is believing שיך לעולם הפיזי, לא לעולם הנתונים.

למה כן להאמין? - להשערות שמוגדרות בצורה שניתן להעמיד למבחן. את זה כבר אמרו לפני מאות שנים, אך בימינו, נוכח ההתעסקות המואצת בפרשנות נתונים,  יש לו תוספת משקל. מה שאי אפשר לבדוק שיך למסטיקה לא לניתוח נתונים.

במה ניתן לאשש או להוכיח השערות? - בכל דרך אוביקטיבית, שמכסה את כל המקרים. נשמע פשוט, אבל יש פה עוקץ:  הוכחה באמצעות אינדוקציה, לדוגמא, אינה נחשבת. זאת אומרת, אם במקרה אחד, שני שלישי וכן הלאה, ההשערה נכונה, עוד לא אומר שהיא תקפה.

איך לכסות את כל המקרים בעולם, הרי זה בלתי אפשרי?
ת':  השערה תמיד מוגדרת בתחום מסוים, לא לכל העולם. ההוכחה אמורה למצות את התחום הזה.

מה עם הוכחה סטטיסטית? הרי היא מרשה שתהיה סטייה? -  אנשים מתחלקים לכאלה שמאמינים שהתופעות בטבע הן הסתברותיות, ואנשים כמו אינשטיין שסבורים שלכל תופעה יש סיבה מוגדרת. בכל אופן, שני המחנות מסכימים, שבפועל ההשערות שלנו תמיד יחטיאו קצת ויכילו סטייה, ולו רק משום שהמידע שלנו לא שלם. סטטיסטיקה מאפשרת לנו לאשר, באופן טכני, השערות למרות החריגים.

האם החריגים אינם עדות לקיום השערה אחרת ואפילו סותרת? -  רוב האנשים רואים בחריגים יוצאים מהכלל שלא מפריעים לכלל. מדענים סבורים, שמספיק הפרכה אחת כדי לסתור תיאוריה שלמה. אנשי BI יגידו, שאם מספיק הפרכה אחת, לעולם לא נגיע לשום מסקנה! לדעתי, ואולי גם לפי תורת האינפורמציה, החריגים הם נושאי המידע העקריים, והתיאוריה לא גמורה עד שהסבירה אותם.


שבוע טוב,
אדית

פתרון [url=http://users/actcom.co.il/~edit#GT]GT data mining[/url]


בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.169 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning