ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חיבור בין המחסן למידע חיצוני

חיבור בין המחסן למידע חיצוני 13 years 4 months ago #128

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 340
  • קרמה: 0
בכל ארגון קים חומר מענין רב שלא נכנס למחסן הנתונים רק משום שאינו סדיר. סקרים, בדיקות שוק, פרטים על ספקים ולקוחות מועמדים, ומידע פרויקטים – כל אלה נשארים בד"כ בחוץ.
המידע החיצוני חשוב כי הוא מתאר אפשרויות שמחוץ לנתיב העיקרי. שילוב מידע כזה הוא חיוני כאשר בודקים חלופות, כשמתכננים פעילות חדשה, או אם רוצים ללמוד נושא באינטרנט. המידע החיצוני נותן במקרים אלה בסיס רחב ונקודת השוואה חיונית למקבלי ההחלטות. השאלה היא אם כן, כיצד לשלב מידע חיצוני אמורפי במחסן שהוא מובנה?
התשובה שלי היא, פתרון כריית נתונים שיהיה גם הוא חיצוני למערכת. אפשר ויעיל יותר לשלב את הנתונים מחוץ למערכת אחת לתקופה, מאשר לדאוג לשילובם המתמיד בתוך מערכת המחסן.

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: חיבור בין המחסן למידע חיצוני 13 years 2 days ago #396

The main problems with external data in DW (logical DW) are:
1.-  The performance of reading data (might not be an issue if the data set is not big enough)
2.- No ability to save history (for example - type 2 dimension)
3.- minimizing the ability to control the data and to keep one version of the truth

Sorry for writing in English. I'm not living in Israel and don't have current access to Hebrew keyboard
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: חיבור בין המחסן למידע חיצוני 12 years 11 months ago #420

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 340
  • קרמה: 0
ערן, שלום
מסכימה עם דבריך, שיש קושי בשילוב נתונים חיצוניים עם DW בגלל כמויות המידע, חוסר עקביות, קשיי אינטגראציה. אבל, מה עושים כאשר חיבים לשלב נתונים חיצוניים עם פנימיים. כמו נניח, כאשר צריך לנתח נתוני שיווק שמקורם בחלקו ברשת. זאת השאלה.
הבשורה היא, שיש לכך פתרון:  לשלב את הנתונים החיצוניים עם אלה שבמחסן, ביישום חיצוני של כריית נתונים.
הדרישות היחידות מכלי כריית הנתונים הן: שיהיה אוניברסאלי, וידע לטפל בנתונים חופשיים - unsupervised, כאלה שאינם בהכרח שלמים, מיצגים, ולקוחים מסביבה קבועה.
GT data mining שברשותי, הוא פתרון כזה. הוא מאפשר שימוש בנתונים מכל מקור שהוא, שילוב נתונים ממקורות שונים, ומה שנקרא meta-analysis.
היתרון בכלי חיצוני כנ"ל הוא, שלא צריך לשנות דבר במערכת, ומכאן מהירות תגובה, גמישות, מגוון יישומים גדול יותר, חסכון עלויות פרויקט אינטגראציה עם מערכת הארגון, ובשורה תחתונה - תועלת/עלות גבוהה.

הפתרון החיצוני משאיר תמיד מקום לפתרון ממוסד, שיבטיח שמירה מסודרת, אחידות ותאימות הגדרות בריצות שונות הנדרשות ב DW. הדרך לפיתוח הגדרות מחסן הנתונים סלולה אחרי יישום מוצלח בחוץ. כך שהארגון מרוויח מכל הבחינות, גם במתן תשובה מהירה לצורך בניתוח נתונים מעשי וגם דוגמא שניתן לשכפל ולמסד לטובת יישומים נוספים בארגון.

----
בקשר לבעית האינטגרציה שציינת, ראה מאמר מענין באתר של ריק שרמן datadoghouse.typepad.com/data_doghouse/2...business_intell.html

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.195 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning