Forum
  • Register
תנו לנו לייק וקבלו עדכונים ישירות לפיד
ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: Dark data המושג של נתונים עקיפים

Dark data המושג של נתונים עקיפים 6 months 3 weeks ago #8386

  • Edith Ohri
  • Edith Ohri's Avatar
  • מחובר
  • Moderator
  • הודעות: 286
  • תודות שהתקבלו 1
  • קרמה: 0
תחילתו של Dark Data:
טבעתי את המושג DARK DATA במצגת(*) שכותרתה The world of Data dark matter. זה היה לפני כ-4 שנים, כש Big Data היה בקושי מוכר אך התופעה של שטפון נתונים מעורבים ממקורות לא מפוקחים כבר הורגשה היטב.
האקדמיה למדעים, בקבוצה הנקראת Codata, הקדישה לכך תשומת לב רבה, בכינוס שערכה בארץ בפברואר 2013. בכינוס נדונו אפשרויות ניצול נתונים חיישנים פיזיולוגיים לצורכי מעקב בריאות, מניעה והשגחה רפואית על קשישים (וחולים בכלל), בעיקר כאלה הנמצאים בביתם.
במסגרת זו הצגתי את פירותיו של מחקר משותף עם פרופ' יצהל ברנר, על גורמי נפילות קשישים. המחקר התמקד בתפיסה חלופית לאנליטיקס המקובל, בשם GT data mining, שעיקרה הוא איתור תופעות סמויות וגורמי מפתח בתוכן.

הגדרה של Dark Data:
נתונים חשוכים הם נתונים לא מפוקחים (unsupervised), שמכילים תופעות סמויות, עליהן ניתן להסיק בעקיפין בלבד ואי אפשר להבחין בהן אחרת.
את המונח Dark Data שאלתי לשם המחשה מ "Dark Matter" של פיזיקה. נתונים כאלה מצויים בחושך בגלל מגבלות הכלים האקטיביים והפאסיביים כולל החושים שלנו - המגבלות של הפנסים, הראדאר, המצלמות, המיקרסקופים והטלסקופים - כל מה שהיה אמור לגלות את התופעות הסמויות ("חומר"), אך לא מחזיר שום אות ולכן סבורים שאין שם כלום.
הערה: בפתרון של GT כל הנתונים מוגדרים כ"חשוכים" כתור נקודת מוצא לאנליטיקס.

התיאוריה של נתונים חשוכים ותופעות סמויות עוסקת לפי GT בשני אתגרים מרכזיים: (א) הסקה עקיפה לגבי קיומם של תופעות וקשרים סמויים, ו(ב) אישוש היפותזות דלעיל.


בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.188 שניות

Sap

Oracle

Informatica

SAS

Microstrategy

IBM

Microsoft

Qlikview

Teradata

Webfocus

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

מעניין? שתפו דף זה באמצעות הטלפון הנייד

DWH :: דיון: Dark data המושג של נתונים עקיפים (1/1) - QR Code Friendly
Powered by QR Code Friendly

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

התחברות

כניסות למאמרים
6442715