בכל ארגון קים חומר מענין רב שלא נכנס למחסן הנתונים רק משום שאינו סדיר. סקרים, בדיקות שוק, פרטים על ספקים ולקוחות מועמדים, ומידע פרויקטים – כל אלה נשארים בד"כ בחוץ.
המידע החיצוני חשוב כי הוא מתאר אפשרויות שמחוץ לנתיב העיקרי. שילוב מידע כזה הוא חיוני כאשר בודקים חלופות, כשמתכננים פעילות חדשה, או אם רוצים ללמוד נושא באינטרנט. המידע החיצוני נותן במקרים אלה בסיס רחב ונקודת השוואה חיונית למקבלי ההחלטות. השאלה היא אם כן, כיצד לשלב מידע חיצוני אמורפי במחסן שהוא מובנה?
התשובה שלי היא, פתרון כריית נתונים שיהיה גם הוא חיצוני למערכת. אפשר ויעיל יותר לשלב את הנתונים מחוץ למערכת אחת לתקופה, מאשר לדאוג לשילובם המתמיד בתוך מערכת המחסן.
בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
בעניין: חיבור בין המחסן למידע חיצוני
13 years 6 months ago #396
The main problems with external data in DW (logical DW) are:
1.- The performance of reading data (might not be an issue if the data set is not big enough)
2.- No ability to save history (for example - type 2 dimension)
3.- minimizing the ability to control the data and to keep one version of the truth
Sorry for writing in English. I'm not living in Israel and don't have current access to Hebrew keyboard
הנהלת האתר ביטלה גישת כתיבה ציבורית.
בעניין: חיבור בין המחסן למידע חיצוני
13 years 6 months ago #420
ערן, שלום
מסכימה עם דבריך, שיש קושי בשילוב נתונים חיצוניים עם DW בגלל כמויות המידע, חוסר עקביות, קשיי אינטגראציה. אבל, מה עושים כאשר חיבים לשלב נתונים חיצוניים עם פנימיים. כמו נניח, כאשר צריך לנתח נתוני שיווק שמקורם בחלקו ברשת. זאת השאלה.
הבשורה היא, שיש לכך פתרון: לשלב את הנתונים החיצוניים עם אלה שבמחסן, ביישום חיצוני של כריית נתונים.
הדרישות היחידות מכלי כריית הנתונים הן: שיהיה אוניברסאלי, וידע לטפל בנתונים חופשיים - unsupervised, כאלה שאינם בהכרח שלמים, מיצגים, ולקוחים מסביבה קבועה.
GT data mining שברשותי, הוא פתרון כזה. הוא מאפשר שימוש בנתונים מכל מקור שהוא, שילוב נתונים ממקורות שונים, ומה שנקרא meta-analysis.
היתרון בכלי חיצוני כנ"ל הוא, שלא צריך לשנות דבר במערכת, ומכאן מהירות תגובה, גמישות, מגוון יישומים גדול יותר, חסכון עלויות פרויקט אינטגראציה עם מערכת הארגון, ובשורה תחתונה - תועלת/עלות גבוהה.
הפתרון החיצוני משאיר תמיד מקום לפתרון ממוסד, שיבטיח שמירה מסודרת, אחידות ותאימות הגדרות בריצות שונות הנדרשות ב DW. הדרך לפיתוח הגדרות מחסן הנתונים סלולה אחרי יישום מוצלח בחוץ. כך שהארגון מרוויח מכל הבחינות, גם במתן תשובה מהירה לצורך בניתוח נתונים מעשי וגם דוגמא שניתן לשכפל ולמסד לטובת יישומים נוספים בארגון.