התחברות

התחברות
x
או
x
הרשמה
x

או

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: שאלות פתוחות בכריית נתונים

שאלות פתוחות בכריית נתונים 7 years 1 month ago #7892

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 322
  • קרמה: 0
שאלות בענין אדפטציה של כריית נתונים בארגון


איך לתמחר מוצרי ידע?
הקושי בתמחור מוצרי ידע נעוץ בעובדה שהם בלתי-מוחשיים, ז"א קשה לספור אותם ולוודא כמה יוצרו, כמה נצרכו וכו' פעולות של ספירה וניהול מצאי כנדרש בהנהלת חשבונות. הספירה היא חיונית לניהול ולאימות הרישום בספרים. לדוגמא: במוצרים מוחשיים אפשר ללכת למחסן או לרישומי הייצור ולראות כמה יחידות בדיוק נוצרו/מאוחסנות. בידע אין אפילו יחידות לספירת המלאי. במוצרים מוחשיים, פעולות הייצור חוזרות על עצמן – Repetitive ואפשר ליצור להם זמני תקן, במוצרי ידע הן יצירתיות וכמו שכל מנהל פרויקט פיתוח תכנה יודע, הזמנים שלהם עשויים להשתנות בפקטורים כבדים.

מספר מילים על קשיי העיכול של IT בהנה"ח -
www.engineers.org.il/Index.asp?ArticleID...ategoryID=700&Page=1


כמה שווים הנתונים שלנו?
במצב הנוכחי, נקבע ערכו של פריט מידע על פי ערך השוק שלו כפי שהוא במכירות, או על פי הערכת שוויו העסקי כמוניטין. פריטי מידע שלא נמכרו ואינם "מוניטין", לא נרשמים בספרים. במילים אחרות, רב פריטי הידע, כולל מאגרי הנתונים, אינם רשומים ב'ספרים' ולפיכך ערכם נחשב לאפס. כתוצאה מהמצב, קשה לעקוב על נצילות משאבי הנתונים. לשם המחשה, אם היה למפעל היה 90% עודף קיבולת ייצור, כולם היו נדרשים לתקן מייד את הבזבוז המשווע, בחברת IT לעומת זאת, גם הערכה ש-99% מהנתונים אינם מנוצלים תעבור בשקט.


מדוע מדדים הם תחליף די גרוע לכסף?
יש ארגונים שבהם גורם אחר מכסף יכול לשמש לא רע לבדיקת תועלת והשוואת חלופות. אך באופן כללי, המדדים הם אינדיקטורים יחסיים ולא אבסולוטיים, זו החולשה שלהם.


האם המבחן האולטימטיבי של כריית נתונים הוא חיזוי?
להבנתי, התשובה מתחלקת לשניים: כריית נתונים פרטנית ואבחון דפוסי התנהגות.
כריית נתונים פרטנית ניתנת לבדיקה והשוואה של חיזוי מול תוצאות בפועל.
הבעיה היא בתוצר השני של כריית נתונים - הגדרת דפוסי ההתנהגות, אשר בו אין תועלת בחיזוי מבחינת מבחן האימות, פשוט אין למה להשוות. לדעתי, המבחן היחיד להצלחת אבחון של דפוסי ההתנהגות, הוא בעצם הגילוי של דפוסים סמויים משמעותיים בנוסף לדפוסים הידועים.


איך להעריך איכות של פתרון כריית נתונים?
גם בשאלה זו הדרך עוד לא סלולה. נהוג לקבוע את איכות הפתרון בעיקר לפי הביצועים שלו, אך מה לגבי האפקטיביות שלו? אפקטיביות גבוהה יכולה לשנות אסטרטגיה של ארגון, וכדאי בשבילה לוותר על כל הביצועים. לדוגמא, גילוי של קבוצת לקוחות סמוייה הנוטה לנטישה בשיאו של מאבק על השוק, הוא בעל חשיבות עצומה, ולא משנה כמה זמן לקח לחפור בנתונים ולהגיע למסקנה.
כדי לתפוס את הפוטנציאל של פתרון להגיע לידע חדש משמעותי, אני מציעה למדוד את היחס שבין כמות המסקנות להיקף הנתונים הנדרש לצורך קבלתן כפול תדירות העדכון הנדרשת של התוצאות. ככל שהיחס גבוה יותר, כך הפתרון יהיה חזק יותר. אגב, כך הוא יהיה גם זול יותר בתפעול.


אדית
הבית של GT data mining

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.140 שניות

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning