ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 9 במדע הנתונים החדש -כשהתוצאה היא גם הסיבה

חוק מס' 9 במדע הנתונים החדש -כשהתוצאה היא גם הסיבה 2 years 9 months ago #8438

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 346
  • קרמה: 0
חוק מס' 9 - כשהתוצאה היא גם הסיבה
או המקור לכל תופעה מחזורית בעולם הוא תוצאה שהיא גם סיבה (זה מתמטי).

כאשר התוצאה היא גם הסיבה, יש בעיה בניתוח, קשה להגדיר מישתנים כאלה. ועוד יותר קשה להצביע על סיבת-השורש (וייתכן מאד שהיא מישתנה אחר, לא הסיבה ולא התוצאה).
מדע הנתונים החדש פותר את הבעיה ע"י תיחום התופעות, וחלוקת לתת-קבוצות שבהן מתקים קשר לא מחזורי.

דוגמא: ניתוח השפעת מחיר על מכירות.
אנחנו מצפים למצוא קשר הפוך בין המחיר והמכירות. אבל, שימו לב להשתנות המחזורית: הוזלת מחירים מגדילה את המכירות. המכירות המוגברות מקטינות את על המכירות בתקופה הבאה. כשהמכירות יורדות, עורכים שוב מבצע הוזלות. השאלה, מה באמת מגביר את המכירות – המבצעים או תיקון חזרה לביקוש הנורמלי אחרי ירידה במכירות שקורית לעיתים בעקבות מבצעים ותקופה של צריכה מוגברת?
בפרויקט ניתוח GT (ניתוח שמזהה את דפוסי ההתנהגות, הקבוצות ההיררכיות שבנתונים), נמצאה אסטרטגיה מענינת מורכבת של מכירות שמנצלת גומחות ביקוש באופן יצירתי.
הקבוצות גילו את קיומה של פונצית ביקוש שלא נראית כמו שום דבר שכתוב בספרים! פונקציה היפרבולית שיורדת בתחילה ואחר כך עולה! רק במיעוט הקבוצות נמצאת התופעה המוכרת של מכירות כפונקציה של מחיר*. ברוב הקבוצות נמצאו גורמים שונים לגמרי.
*הערה: המחיר שצוין בנתונים, לא שיקף עלויות הנהלה כגון פרסום וחוזי מכירה.
כך נמצא, שהמוצר נמכר במחיר נמוך בהרבה במקומות שבהם התחרות נמוכה (הסבר: ייתכן שסילוק המתחרים הוא תנאי להנחה הגדולה); בקבוצות המאופינות ע"י עונות שנה הקשורות לחופשות ובילויים, לא נמצא קשר בין מכירות למחיר (הסבר: אולי המכירות נבעו מהשקעה בפרסום עונתי); ובקבוצות שבאיזורי יוקרה מבודדים או על דרכים ראשיות, המכירות היו עירניות למרות המחירים הגבוהים.
עקומת הביקוש המצרפית של כל הקבוצות היא אם כך קעורה - המכירות יורדות תחילה כצפוי אך מייד עולות ככל שהמחיר גבוה יותר? -מה זה?!! ללא ספק, אנשי השיווק יכולים ללמד את הכלכלנים :) פרק בבידול שווקים, מיתוג מוצרים חווית קנייה ועשיית השוק..

בברכה
אדית
עריכה אחרונה: 6 months 1 week ago  ע''י Edith Ohri. סיבה: תיקון ניסוח
הנהלת האתר ביטלה גישת כתיבה ציבורית.

חוק מס' 9 במדע הנתונים החדש -כשהתוצאה היא גם הסיבה 2 years 9 months ago #8439

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 346
  • קרמה: 0
תת סעיף לחוק 9:
בכל המערכות הסגורות ישנה לפחות תוצאה אחת שהיא גם סיבה.
במערכות סגורות שנמצאות בשיווי משקל, ההיזון החוזר של תוצאה-סיבה נובע מעצם הגדרת שיווי משקל.

במערכות שאינן בשיווי משקל זה מורכב יותר. אם יש מזל, אפשר למצוא במערכות כאלה את קשרי התוצאה-סיבה בעזרת ההגיון.
אחרת אני מציעה, להפריד את הרשומות לקבוצות (דפוסי ההתנהגות) לפי המיקום שלהן במחזור, למצוא את מאפיני הקבוצות ומדוע הם מחוללים מחזוריות, ולהמשיך בניתוח הקבוצות בהתאם למסקנות (הן עשויות לשנות את כיוון הניתוח).
במקרה שהעיצה לא עוזרת – יש למצוא את הקבוצות ולא להניח אותן מראש, ולנתח כנ"ל את מאפיניהם.

בברכה
אדית
עריכה אחרונה: 6 months 1 week ago  ע''י Edith Ohri.
הנהלת האתר ביטלה גישת כתיבה ציבורית.

חוק מס' 9 במדע הנתונים החדש -כשהתוצאה היא גם הסיבה 6 months 4 weeks ago #8499

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 346
  • קרמה: 0
בכתבה של סופי שולמן בכלכליסט מתאריך 23-04-2020 צייד הברבורים השחורים מתאר פרופ' יניר בר־ים את הטעות הרווחת של מדענים לנתח בנפרד את הגורמים, במקום את דפוסי ההתנהגות של מערכת שהיא מורכבת, כמו מגיפת הקורונה.
נכון גם לפי מדע הנתונים החדש, אך יש עוד בעיה שלא הוזכרה בכתבה - האפקט המבלבל של קשר הפוך - בין תוצאה וגורמיה, שמיצר מחזוריות ו"מקלקל" בזה את הנחת הקורלציה הלינארית במודל הסטטיסטי.

במגיפת הקורונה יש פיגור של כשבועיים בין פעולה מונעת לתגובה נמדדת. התוצאה היא גלים של מאמצי מניעה והתפרצות מחודשת. המדענים יודעים ומתריאים על הסכנה. לעומת הציבור מגיב על מה שקורה באותו יום. זה הולך להיגמר לא טוב.

* Rule #9 of data science

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.261 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning