חוק מס' 5 כל נתון אותנטי הוא רלוונטי ללימוד ומבחן. מדגם יכסה כמה שיותר סוגי תופעות וערכי משתנים, כולל נקודות קצה וחריגים.
מבנה הנתונים הסופי הוא טבלאי: רשומות אירועים, ובכל רשומה משתנים שמתארים את האירוע.
למשתני הרשומות יש להוסיף את תיאור הסביבה, תיאור מקור הנתונים, והדלתא - השינוי של הרשומה ביחס לרשומות סמוכות (זאת כדי לשמר מידע שטמון במבנה וברצף האירועים).
אלגוריתם של חיפוש השערות חיב להכיל התראות על חוסר עקביות בנתונים המסכן את המסקנות, בכך שמאפשר מסקנות סותרות על בסיס אותו מדגם.
הערה: מודל מדע הנתונים החדש משחרר מחובת המדגם המיצג והאיכות האחידה של הרשומות (ניתן להוכיח מדוע זה אפשרי לפי חוקים 1-4). האפשרות מצמצמת בהרבה את דרישות האינטגרציה בנתונים (אחידות שלמות ואמינות) ותומכת בכך בלימוד מהיר של נתונים אותנטיים (כמו שהם).