ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: Intelligence By Objectives - I.B.O

Intelligence By Objectives - I.B.O 13 years 1 month ago #319

  • Jacob Bar
  • Jacob Bar's Avatar
  • Offline
  • Fresh Boarder
  • הודעות: 2
  • קרמה: 0
כריית נתונים יכולה לספק למשתמש בה תובנות עסקיות משמעותיות ובעלות תועלת עסקית בתנאים הבאים:
1. יש קורלציה ישרה וגבוהה בין יעדי הארגון לבין המשתנים והנתונים הנבדקים
2. המשתנים והנתונים הנבדקים הינם בבחינת Need To Know ולא Nice To Have
3. כריית הנתונים נעשית במקומות הנכונים (בבסיסי הנתונים הנכונים)
דוגמאות (קיצוניות למדי): אין טעם לבדוק את תבניות המידע ולחפש את הקשר בין צבע תחתוני הלקוחות והיקף קניותיהם
אין טעם להפעיל את כלי כריית הנתונים לקבלת תובנות על רווחיות החברה, על בסיס הנתונים של עובדי הארגון....
במילים אחרות עוד בטרם מפעילים כלי כרייה יש להגדיר עבורם:
1. מה שואלים
2. איך שואלים (תרגום השאלות הוורבאליות לשפת המקורות SQL וכד'). 
3. היכן מחפשים
כל זאת כנגזרת של יעדים ומטרות להשגה.
למיטב ידיעתי אף לא אחד מכלי כריית הנתונים ואו מחסני הנתונים מטפלים בבעיות אלו.

הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: Intelligence By Objectives - I.B.O 13 years 1 month ago #322

  • Administrator
  • Administrator's Avatar
  • Offline
  • Administrator
  • הודעות: 52
  • קרמה: 0
יעקב,

גישה מאד מעניינת. יש לך עוד חומר בנושא?


תמיר
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: Intelligence By Objectives - I.B.O 13 years 1 month ago #326

  • Jacob Bar
  • Jacob Bar's Avatar
  • Offline
  • Fresh Boarder
  • הודעות: 2
  • קרמה: 0
תמיר שלום,
נא שלח אלי את המייל שלך ואשלח לך חומר על I.B.O.
יעקב בר
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: Intelligence By Objectives - I.B.O 13 years 1 month ago #327

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 340
  • קרמה: 0
יעקוב יקירי,
מזה הפרסום המסחרי שהקפצת הנה? סלח לי, אך הוצאתי אותו. זאת כדי שהדיון יישאר בתחום העובדות המוסברות...

בקשר להערה על חוסר כלים ראויים, ישנו הפתרון GT data mining. הוא  מספק את הדרישות שהצבת ועוד כמה שחסרו לי בתיאור שלך. הנה שתי דוגמאות:

(1) הדרישה ליציבות המסקנות, שיהיה אפשר לבסס עליהן החלטות ניהול. אם הגורמים אינם יציבים, או שהם לא עלינו תלויי-מדגם, עדיף לסגור את המחשב, כי זה בדיוק המקרה שבו המחשב מסוגל לעשות יותר מהר והרבה יותר הרבה טעויות מכולנו.

(2) הדרישה לגילוי מוקדם. אפקט הזמן הוא קריטי, זה לא חדש. מי שמגלה מוקדם, מרוויח כפול - מונע בעיות ומנצל הזדמנויות. הצרה בפתרונות כריית נתונים הגדולים כולל זה שלך היא, שלא ניתן להבחין בהם בתופעות חריגות, אלה שמענינות את early detection. החריגים נבלעים בתוך השונות הכללית. לעיתים יש מזל ולחריגים יש שורש משותף שמצמיח הסבר. יתר החריגים נשארים קבורים באדמה, ומהווים זבל אורגני פורה לצרות שיבואו.

יכולות כנ"ל הן תוצאה של תפיסת פתרון אחרת, לא אותו זמיר מכביר שיר, שממחזרים לנו הפתרונות הגדולים.

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: Intelligence By Objectives - I.B.O 12 years 11 months ago #419

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 340
  • קרמה: 0
לגבי ההקדמה, נו באמת, ברור שאף אחד לא יטרח לבזבז זמן על מטרות לא-לענין או על נתונים שלא קשורים. 

מי שהתרגל לסטטיסטיקה, ממשיך גם בכריית נתונים להגדיר שאלות והשערות לפני ניתוח הנתונים, וכאן הוא טועה בגדול! זה ההבדל בין שתי השיטות. בסטטיסטיקה צריך להגדיר מה מחפשים, בכריית נתונים - לא. בגלל זה בדיוק הסטטיסטיקה הפסיקה להביא תועלת: איך אפשר לדעת מה לשאול כשאין מושג איזה תופעות מתחבאות בנתונים???

שימו לב והיזהרו מהטעות: SQL היא סתם טכניקה לחיתוך נתונים, ואין לה שום קשר לכריית נתונים. יותר מזה, אי אפשר להשיג כריית נתונים בעזרת SQL, מהסיבה הפשוטה שזו טכניקה דטרמיניסטית והעולם המורכב המיוצג בנתונים הוא ממש לא כזה.

הקטע שנכתב בענין I.B.O כאילו ניתן להוציא פתרון בצורה דידקטית מהמטרה, כאילו העולם מסודר בצורה לינארית -- הלוואי עלינו, המצב היה פשוט בהרבה יותר אם זה היה נכון! בפועל, בעיות הנגזרות ממטרותיהן הן מעט מזעיר,הן כבר נטחנו עד דק בעזרת סטטיסטיקה, וכל ניתוח נוסף שלהן משול להתעללות בגוויה.

ומה שנאמר "למיטב  ידיעתי אף לא אחד מכלי כריית הנתונים וכו' מטפלים בבעיות אלו", הפתרון GT data mining מטפל בבעיות אלו ובעוד כמה שלא הועלו פה לדיון, כמו לדוגמא, הבעיה של שימוש בנתונים לא דגומים שמקורם ביותר מאוסף נתונים אחד.

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.253 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning