התחברות

התחברות
x
x
הרשמה
x

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

חדש בפורומים

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 1 של מדע הנתונים (החדש)

חוק מס' 1 של מדע הנתונים (החדש) 1 year 9 months ago #8405

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 314
  • קרמה: 0
חוק מס' 1
בביג דטה, מספר המשתנים תמיד גדול ממספר הרשומות.
משמעות החוק, שמספר הנעלמים גדו ממספר המשוואות, הפתרון הוא לא-מסויים, ואין פתרון מתמטי (או סטיסטי).

החוק נראה לכאורה אבסורדי, הרי ביג דטה דן בזרמי נתונים אדירים, איך ייתכן שיחסרו רשומות? ובכן, ההסבר למספר המשתנים הגדול יותר נובע מכך, שכל דיווח של אירוע (רשומה) מתקבל בעקרון ממקום אחר, שצריך לציין את תנאיו הפרטיים - זה מה ש"מנפח" את כמות המשתנים.
הפתרון שמציע GT, מצמצם את מימדי מרחב הפתרון ע"י חלוקת הנתונים קבוצות בעלות תנאים משותפים. אפשר לראות בצמצום המרחב/המשתנים חזרה למצב המאפשר בעקרון פתרון מתמטי.
זה החוק הראשון במדע הנתונים החדש, שמתאר את היציאה מהמוסכמות הקימות.
אשמח לקבל הערות ושאלות.

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.178 שניות

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning