חוק מס' 17 במדע הנתונים החדש: הוספת תיוג בשלב הכנת הנתונים, מותרת רק אם המתיג אינו מכניס מידע סוביקטיבי שיפגע באותנטיות הקלט. הערה: החוק מתיחס לפרקטיקה של Tagging & Labeling (תיוג) הקלט.
דוגמא:
רשת חנויות אפנה נניח מעונינת לחשב כדאיות של צורות פרסום שונות, ולשם כך מרכזת נתונים מקיפים ממחלקות רכש, מכירות, הנהלת חשבונות וסוכנות הפרסום.
אפשרות א': הנתונים מתוגברים ע"י תיוג מוצרים, מבחינת צבעי הפרסום, סגנון המוצרים, אפיון הדוגמנים. תוצאות ניתוח הנתונים מובילות למסקנות כגון: בחורף כדאי יותר צבעי אדמה וסגנון "פורמלי", באביב עדיף דוגמנים צעירים בשלטי חוצות, בקיץ כדאי סגנון פנאי, וכו'. המסקנות תואמות במידה רבה לפרמטרים ידועים של מתכנני הקולקציות העונתיות, לכן אינן מחדשות ולא מצדיקות את ההשקעה בניתוח הנתונים.
אפשרות ב': ניתוח הנתונים מתבצע על הקלט כמושהו, ללא תוספת תיוג. התוצאות משוחררות מהסיווגים הרגילים ויכולות לגלות תופעות סמויות ומגמות חדשות שיש להן ערך לעתיד, כגון: שינוי בהרגלי קניות האביב, גידול בהצלחת פריטי רכש מסין המשווקים בכל העולם, הסבר לפיו המגמות מושפעות מקידום מכירות מוצרים בחו"ל, והשערה על קשר בין כדאיות שנה זו להצלחת מכירות שנה קודמת בזכות הגדלת המינוף המסחרי, ערך שיורי של הפרסום ומחזור עודפי מלאי.
לסיכום: משתלם להשקיע בניתוח הנתונים כמו שהם, המסקנות והתובנות מצדיקות את המאמץ.