התחברות

התחברות
x
או
x
הרשמה
x

או

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

חדש בפורומים

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 5 של מדע הנתונים החדש - מדגם לניתוח אמפירי

חוק מס' 5 של מדע הנתונים החדש - מדגם לניתוח אמפירי 2 years 2 months ago #8412

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 318
  • קרמה: 0
חוק מס' 5 כל נתון אותנטי הוא רלוונטי ללימוד ומבחן. מדגם יכסה כמה שיותר סוגי תופעות וערכי משתנים, כולל נקודות קצה וחריגים.

מבנה הנתונים הסופי הוא טבלאי: רשומות אירועים, ובכל רשומה משתנים שמתארים את האירוע.

למשתני הרשומות יש להוסיף את תיאור הסביבה, תיאור מקור הנתונים, והדלתא - השינוי של הרשומה ביחס לרשומות סמוכות (זאת כדי לשמר מידע שטמון במבנה וברצף האירועים).

אלגוריתם של חיפוש השערות חיב להכיל התראות על חוסר עקביות בנתונים המסכן את המסקנות, בכך שמאפשר מסקנות סותרות על בסיס אותו מדגם.

הערה: מודל מדע הנתונים החדש משחרר מחובת המדגם המיצג והאיכות האחידה של הרשומות (ניתן להוכיח מדוע זה אפשרי לפי חוקים 1-4). האפשרות מצמצמת בהרבה את דרישות האינטגרציה בנתונים (אחידות שלמות ואמינות) ותומכת בכך בלימוד מהיר של נתונים אותנטיים (כמו שהם).

13-05-2017
Home of GT data mining

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.304 שניות

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning