כריית נתונים כידוע, מיועדת לגילוי חוקיות סמוייה. היכולת למצוא דברים חדשים שלא היו ידועים בהתחלה, היא הדבר המושך בכריית נתונים, שעבורו כדאי לטרוח ובלעדיו ניצר עוד דוחות על שולחן מזמיני המידע העמוסים לעיפה.
השאלה היא, איך לתמחר ידע שלא יודעים להגדירו מראש ?
מצד אחד, כל עוד לא הסתים ניתוח הנתונים, לא יודעים מה נמצא.
מצד שני, בכריית נתונים סבוכים, גם אם לא יודעים בדיוק מה נמצא, אפשר להיות בטוחים שנמצא דברים מענינים חדשים. במרחב רב מישתנים מסובך, בטוח שכריית הנתונים תמצא צירופי תנאים ותופעות חדשים ומענינים ביותר.
מה, אם כן, להבטיח בעת הגשת ההצעה:
(1) את התוצאות הצפויות מראש בלבד, או -
(2) להעיז ולהבטיח "תועלת" לפני שיש בידינו הוכחות לקיומה.
אישית, עד כה הסתמכתי בהערכות ראשונות ללקוח, רק על תוצאות שיודעים להגדיר מראש.