ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 17 במדע הנתונים החדש - Tagging & Labeling

חוק מס' 17 במדע הנתונים החדש - Tagging & Labeling 6 months 3 weeks ago #8492

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 343
  • קרמה: 0
חוק מס' 17 במדע הנתונים החדש: הוספת תיוג בשלב הכנת הנתונים, מותרת רק אם המתיג אינו מכניס מידע סוביקטיבי שיפגע באותנטיות הקלט.
הערה: החוק מתיחס לפרקטיקה של Tagging & Labeling (תיוג) הקלט.

דוגמא:
רשת חנויות אפנה נניח מעונינת לחשב כדאיות של צורות פרסום שונות, ולשם כך מרכזת נתונים מקיפים ממחלקות רכש, מכירות, הנהלת חשבונות וסוכנות הפרסום.
אפשרות א': הנתונים מתוגברים ע"י תיוג מוצרים, מבחינת צבעי הפרסום, סגנון המוצרים, אפיון הדוגמנים. תוצאות ניתוח הנתונים מובילות למסקנות כגון: בחורף כדאי יותר צבעי אדמה וסגנון "פורמלי", באביב עדיף דוגמנים צעירים בשלטי חוצות, בקיץ כדאי סגנון פנאי, וכו'. המסקנות תואמות במידה רבה לפרמטרים ידועים של מתכנני הקולקציות העונתיות, לכן אינן מחדשות ולא מצדיקות את ההשקעה בניתוח הנתונים.
אפשרות ב': ניתוח הנתונים מתבצע על הקלט כמושהו, ללא תוספת תיוג. התוצאות משוחררות מהסיווגים הרגילים ויכולות לגלות תופעות סמויות ומגמות חדשות שיש להן ערך לעתיד, כגון: שינוי בהרגלי קניות האביב, גידול בהצלחת פריטי רכש מסין המשווקים בכל העולם, הסבר לפיו המגמות מושפעות מקידום מכירות מוצרים בחו"ל, והשערה על קשר בין כדאיות שנה זו להצלחת מכירות שנה קודמת בזכות הגדלת המינוף המסחרי, ערך שיורי של הפרסום ומחזור עודפי מלאי.
לסיכום: משתלם להשקיע בניתוח הנתונים כמו שהם, המסקנות והתובנות מצדיקות את המאמץ.

בברכה
אדית
עריכה אחרונה: 2 months 3 weeks ago  ע''י Edith Ohri.
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.149 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning