מנכ"ל Procedureware
מפתחת GT data mining
ייצור ידע
תעשיית ההי-טק בנוייה על יתרון הידע, אך בארגונים רבים עדיין מיצרים ידע בחוסר יעילות, והתוצאות בהתאם. שיעור הפקת ידע מנתונים, על פי הערכות מומחים, עומד על פחות מאחוז אחד, זאת אומרת, 99% מהידע לא מגיעים לשימוש. מה השתבש למנגנוני הפקת הידע? העולם השתבש. העולם הישן התאים למודל הסטטיסטי המקובל. היה אפשר בו לבחור מדגמים, לבודד נעלמים, ולהביא השערות-מומחה מקוריות לצורך מבחנים סטטיסטיים. העולם הנוכחי, לעומת זאת, מוצף בנתונים ממקורות שונים ומגוונים, ובאפשרויות הסבר אינסופיות. בתנאים כאלה אי אפשר לדעת מראש מה הגורם המסביר, מה הדבר שראוי להציב כמטרה. כלי החיפוש וניתוח הנתונים המקובלים דורשים שאילתא או מטרה מוגדרת*. הרי זה כמעט מובן מאליו, שאי אפשר לענות על שאילתא לא מוגדרת, או לנתח נתונים מסובכים בלי להבין מה הקשר ביניהם. בכל זאת, קים כלי אחד שמסוגל לכך - GT. המיוחד בו הוא היכולת לזהות את כל התופעות שבנתונים (לכן הוא לא-תלוי בהגדרת מטרה). הוא מזהה גם תופעות חריגות שקורות במינון קטן, ואלה מתברר עשויות לענין אף יותר מהתופעות הנפוצות ביישומים רבים (כגון, לדוגמא, אבטחת איכות, מודיעין וסקרים).
* (כשל עיקרי במודיעין העסקי הוא) "תשובות ללא שאלות" ... אבסורדית הנטיה היא לחפש את הפתרון בהוספת מידע נוסף - אולי בו ימצא המענה לשאלה. פתרון כזה כמובן רק מחריף את הבעיה. -- המאמר "מדוע מודיעין עסקי אינו מביא מודיעין?", נחום דוניצה.
הייחוד של GT
- 1. חשיפת תופעות מורכבות ודפוסים חריגים ונסתרים
- 2. הגדרת סיבתיות
- 3. פתרון בעיות מעוטות נתונים, בתנאי רקע לא-קבועים ואחרות שלא נגישות בסטטיסטיקה
- 4. גילוי מוקדם של תופעות
- 5. ניצול כל הנתונים, כולל בלתי-דגומים ואלפא-נומריים
- 6. meta-analysis, שילוב מקורות שונים
- 7. אוניברסאליות, אדפטיביות ו-scalability
- 8. ייעול, ערך מוסף גבוה מאד.
תרשים - מפת נתונים בעלת מספר קבוצות GT
שימושים
ייצור ידע מנתונים הוא השלב הבא אחרי הקמת מחסן נתונים. הקושי בייצור ידע כזה נובע מהכמויות הגדולות ומגוון הנתונים, אשר זורמים ממקורות שונים, חלקם מחוץ לארגון. GT אינו מחיב אינטגרציה וניקוי נתונים, ובכך יש לו יתרון רב על מודלים אחרים. הקלט למודל מרוכז בטבלא אחת, ומעובד אחת-לתקופה לצורך מסקנות אשר משמשות לעבודה שוטפת.
BI - Business intelligence - נועד להחזיר לארגון את השליטה בפעילות שמפוזרת בין ספקים, קבלני משנה, משווקים, לקוחות, רשויות מפקחות (בורסה, איכות, סביבה) וכו'. לאור הביזור הרב בעבודת הארגון, חשובה התכונה של GT לאבחן בשביל מקבלי החלטות תופעות רב-מימדיות.
מודיעין עסקי: התחרות בין חברות IT היא תחרות על מידע ייחודי ועל זריזות הפעלתו. GT מביא פתרון שמגלה מעצמו מידע ייחודי המסתתר בנתונים. הוא מצליב נתונים שונים ממקורות זמינים ועפ"ר גלויים, כגון אינטרנט, בורסה, רשתות הפצה, וכו'. שיטת הפעלתו היא כמו ביישומים אחרים של GT: תחילה אבחון דפוסי התנהגות, ואח"כ הגדרת גורמים משפיעים על דפוסים אלה.
ניהול האיכות בתהליכים, נעזר ב-GT לאבחון ואפיון גורמי תקלות. מלבד התועלת הישירה מהקטנת שיעור התקלות, יש לכך השפעה חיובית כלכלית. חסכון פחת, ירידה בהיקף תהליכי תיקון, ושיפור תחרותיות.
ניהול גמיש בעזרת תאי-ייצור הוא חיוני בארגונים בעלי מגוון מוצרים גדול וכמויות קטנות. GT מסיע להגדרת תאי-ייצור ע"י ריכוז פריטים דומים לקבוצות-על שניתן לנהל יחד. הוא שונה משיטות אחרות בכך שמתחשב במספר גדול מאד של גורמים לצורך הרכבת קבוצות יעילות. יתרונות השיטה: (א) שיפור איכות ע"י הקטנת שונות תהליכים; (ב) קיצור זמן סבב הייצור, זירוז תגובת הארגון; (ג) הקטנת התלות בספק או לקוח יחידים; (ד) הקטנת מלאים, והקטנת הון תפעול בהתאם; (ה) הגדלת ניצול תשתיות תפעול יקרות.
הנדסת ייצור שואפת באופן מסורתי לסטנדרטיזציה ולקיצור עקומות למידה. GT תומך בשניהם, ע"י צירוף פריטים שונים בקבוצות ייצור אחידות. האחידות מגדילה את ההתמחות, ניידות עובדים, יעילות הדרכה, ורצף זרימת עבודות בייצור.
מחקרים מציגים אתגר של ניתוח נתונים בתנאים של מחסור. לדוגמא, בביומטריקה, מספר הניסויים שבוצעו במחקר עשוי להיות אף קטן יותר ממספר המשתנים - מצב שניתן לפתרון רק ב-GT. (הפתרון מסתמך על היכולת לרכז גורמים-משפיעים-תלויים לקבוצות משותפות, ולצמצם בכך את מספר הנעלמים החופשיים.)
גילוי תרמיות - fraud detection - בעזרת data mining, הוא תחרות מוחות מול עברינים משוכללים המצוידים בכלים מתקדמים. לארגון יש לעומתם יתרון בראיית התמונה השלמה. הבעיה היא, שדפוסי פעולה עבריניים הינם מיעוט מקרים, לכן בלתי-אפשרי למצוא אותם ולאפין את התנהגותם באמצעות המודל הסטטיסטי (הם הולכים לאיבוד בתוך השונות הכללית). GT הוא היחיד מבין המודלים שמסוגל להגדיר תופעות נדירות וחריגות כגון אלה.
הגנת מידע אינה נעצרת בהתגוננות ע"י פיירוול. דרוש להיות צעד אחד לפני הפורצים. גם כאן היתרון של GT הוא ביכולתו לאתר דפוסים חריגים במינון זעיר. GT מאותת על חשודים בשלב מוקדם, ובנוסף מסמן את דרכי הפעולה האופיניות לפורצים ומאפשר סיכול.