מאת: יוסי וקסלר
אלו מבינינו שעוד זכו לקרוא ספרים, זוכרים את דמות הפקיד הויקטוריאני מהרומנים של דיקנס. זה הפקיד הספון במשרד הראשי ורכון תמיד על יומן העסק בו הוא רשם באדיקות כל תנועה כספית וכל רכישה ומכירה של סחורה.
מאז אותו עידן, ובמיוחד במחצית המאה האחרונה, העולם עבר תמורות טכנולוגיות עצומות, לא רק בהרחבת המיכון והאוטומציה של היצור וההובלה, אלא גם מיכון המידע ותעבורתו, עד כדי הפיכת השוק העולמי לשוק מקומי - הכפר הגלובלי, ומגמות חברתיות ועיסקיות הפכו את החברה המודרנית לחברה צרכנית אינטנסיבית בעלת מודעות וידע וכתוצאה מכך התחרות העיסקית על כל האספקטים שלה העמיקה והתרחבה לבלי הכר.
המחשוב, שהחליף את אותו פקיד ויקטוריאני, הפך לעמוד השידרה התומך בכל מגוון הפעילות המבצעית-עיסקית של הארגון ותוך כדי כך אוגר כמויות דמיוניות של נתונים, המשרתים בראש וראשונה את הדרג הביצועי. במקביל, כתוצאה מההתפתחויות הטכנולוגיות והתפתחות השווקים, השתנה גם המבנה הארגוני. יש מגוון רחב יותר של פעילויות המצריך מספר גדל והולך של מנהלים, אך יחד עם זאת המבנה הארגוני "השתטח" דהיינו קטן מספר הדרגים שבין המנכל לדרג המבצע.
התפתחויות אלו, מחייבות את המנהלים ברמות השונות להיות מעודכנים הן ברמה הארגונית הכוללת, והן ברמה המבצעית המפורטת. לכן הדרישה הגוברת לדיווחי מידע ברמות פירוט שונות, בתדירויות גבוהות ובעלי תוכן משתנה בהתאם לנסיבות העיסקיות המשתנות בתדירות גבוהה.
משימת הספקת המידע הנחוץ למנהלים, מוטלת כמובן על מערכות המידע של הארגון, מהיות גוף זה האחראי על המחשוב ועל מאגר הנתונים העצום של הארגון. הסטורית, משימה זאת הינה הבעייתית ביותר מבחינת מערכות המידע, אך עם התפתחות הטכנולוגיה גם תחום מחשוב זה מקבל פתרונות ההולכים ומשתכללים.
במאמר זה נתאר את היכולות של מערכות המידע לספק את צורכי הדרג הניהולי במידע עיסקי - תחום הבינה והמודיעין העיסקיים (Business Intelligence), ובו נתמקד בעיקר בתחום ניתוח והצגת המידע, תחום ה-OLAP
On-Line Analyze Processing .
מונחים
ERP - Enterprize Resource Planning: כלל מערכות המידע האופרטיביות בארגון. למעשה התכנון (planning) המוזכר בשם אינו רלוונטי. בעבר, והיום עדיין בארגונים רבים, מערכות המידע התומכות בתחומי פעילות שונים - פיננסים, ניהול מלאי, רכש, שיווק, יצור וכו', היו נפרדות, לעיתים מיצרנים שונים (כולל פיתוח עצמי) כאשר (לא תמיד) התקיימה קישוריות בין המערכות השונות באמצעות ממשקים.
הנטיה כיום היא ליישם בארגון מערכת אחת המכסה את כל או רוב תחומי הפעילות כאשר המוערכת מורכבת ממודולים שונים מקושרים ומתואמים, מפותחים ע"י יצרן תוכנה אחד.
OLTP - On-Line Transaction Processing: במשמעותו הרחבה מונח זה מיוחס למערכות האופרטיביות המבצעות ומעבדות טרנזאקציות (תנועות) כגון תנועות הנה"ח, תנועות מלאי וכדו'. מושג זה עומד כנגד מושג ה-OLAP שיוגדר להלן.
מערכות המידע האופרטיביות המודרניות (ERP, OLTP) מטפלות בצורה מקוונת בכמויות גדולות של טרנזאקציות. כדי לתמוך בכמויות אלו תוך זמן תגובה סביר, מערכות אלו מבוססות (ומשולבות) מסדי נתונים הבנויים בצורה אופטימלית לסוג עבודה זה. ארגון מסדי נתונים זה הוא יחסי (Relational) ומנורמל (Normalized) כפי שיוסבר להלן.
OLAP - On-Line Analyze Processing: מערכות לניתוח מידע (למנהלים). בעבר, מערכות מסוג זה (בטכנולוגיות ישנות יותר) נקראו EIS - Executive Information Systems ומערכות תומכות החלטות DSS - Decision Support Systems.
מערכות ה-OLAP מיועדות לאפשר למנתחי המידע ומקבלי ההחלטות לעיין ולנתח מידע ברמות שונות של פירוט, תוך יכולת חיתוך ופריסה של המידע (Dice & Slice) לפי מפתחות שונים, וכן ביצוע פעולות ניתוח שונות כגון חישובי What If וצורות הצגת מידע ידידותיות - טבלאות, גרפים, מפות.
תחום ה-OLAP כולל מחסני נתונים וכלי ניתוח ואחזור מידע, כפי שיתואר בהמשך. מערכות ה-OLAP השונות, מבוססות על מסדי נתונים שלעיתים אינם יחסיים (Relational) ותמיד אינם מנורמלים (Denormalized).
הצורך במסדי נתונים נפרדים ממסדי הנתונים של ה-OLTP נובע גם מהצורך להפריד את שני סוגי הפעילות כדי שפעילות ה-OLAP הכוללת מהלכי סריקת נתונים ארוכים לא תפריע לפעילות המקוונת של עיבוד הטראנזקציות, וגם בגלל ההיקף הגדול של מסדי הנתונים.
מחסן נתונים - Data Warehouse: מחסן הנתונים הוא מערכת תוכנה/מסד נתונים, המיועד לשמש כתשתית ליישומי המידע למנהלים, והוא כלול בקטגוריית ה-OLAP.
מחסן הנתונים כולל מסד נתונים לא מנורמל (יעודי למחסן הנתונים או רלציוני), תוכנה להעברת נתונים ממערכת ה-ERP (ETL), כלי/תוכנות לניתוח ואחזור מידע. מחסן הנתונים נבנה במיוחד כאשר מרחב הנתונים של הארגון הוא גדול מאד והפעלת כלים לאחזור מידע עלולים לגרום לחוסר יעילות של כל מערכות המידע. לרוב, מחסן הנתונים נבנה ע"ג שרת נפרד משרת ה-ERP (שרת = מחשב).
מחסן נתונים מחלקתי - Data Mart: מחסן הנתונים המחלקתי הוא מסד נתונים חלקי או נושאי. בעוד מחסן הנתונים כולל את כל נושאי המידע בארגון כמו פיננסים, שיווק ומכירות, רכש, מלאי וכדו' ה-DataMart מיישם רק אחד או אף חלק מאחד הנושאים הנ"ל, למשל מכירות.
כלי OLAP: כלי ה-OLAP הינם כלים לאחזור וניתוח מידע. ניתן להבחין בשני סוגים ראשיים של כלי OLAP:
1. כלי שאילתא, דהיינו כלים כלים המציגים ומאפשרים אחזור מידע לאחר ביצוע שאילתא (קריאת הנתונים מתוך מסד הנתונים). כמו כל כלי ה-OLAP, כלי השאילתא מאפשרים בד"כ תצוגות מידע מגוונות כגון דוחות מעוצבים וגרפים.
2. כלים רב-ממדיים - כלים היוצרים מסד נתונים עצמאי מתוך הנתונים במסד הנתונים המקורי, מחסן הנתונים או מסד הנתונים של ה-ERP. מסד הנתונים הנוצר הינו רב-ממדי, דהיינו מסודר על פי מפתחות-ממדים לאחזור וחיתוך מידע וכולל סיכומי נתונים לכל צרוף של מפתחות (אגרגציות).
ממד - Dimension: הממד הוא למעשה מפתח למידע בתוך המודל הרב ממדי (מסד הנתונים הרב-ממדי) או הרכב של מפתח ראשי ותת-מפתחות.
בחלק מכלי ה-OLAP הרב-ממדיים, הממדים מורכבים מהיררכיות של תת-ממדים. היררכיות אלו נקבעות מראש, לפני בניית מסד הנתונים הרב-ממדי. מסדים אלו נקראים קוביות רב-ממדיות.
בכלי OLAP אחרים, מסד הנתונים הרב-ממדי איננו היררכי, דהיינו ההיררכיות אינן נקבעות מראש אלא בעת חיקור המידע לפי הצורך העכשווי של המשתמש. מסדים אלו נקראים כדורים רב-ממדיים.
נתונים - Data: הנתונים הם ערכים מספריים או טקסטואליים. הנתון (Datum) חסר משמעות כשלעצמו, למשל תאריך - 20/5/2005, סכום - 1,235.55 או טקסט - "משה ישראלי". הנתונים הם פריטים הנאספים עקב הפעילות העסקית של הארגון ומשמשים ליצירת מידע.
מידע - Information: מידע הוא אוסף של נתונים עם הקשרים שביניהם וההקשרים לנתונים הללו. למידע יש משמעות והוא הגורם לעשייה שלנו, או במילים אחרות - לקבלת החלטות וביצוען.
דוגמאות למידע - "הרווח השנה הוא 20,337,280 $ - עליה של 12.7% לעומת התקופה המקבילה אשתקד".
ברור שכתוצאה ממידע זה נוכל להחליט החלטות שונות, למשל, על חלוקת בונוסים לעובדים.
המידע - מצרך חיוני למנהל
עיקר עבודתו של המנהל הוא קבלת החלטות, קביעת מדיניות ובקרת ביצוע החלטות אלו. את ההחלטות אפשר לסווג כהחלטות אוטומטיות והחלטות אווריקיות (מלשון "אווריקה", קריאתו המפורסמת של ארכימדס - "מצאתי!"), דהיינו החלטות הנובעות מאינטואיציה והשראה גם בלא שיהיה למחליט מידע לבסס עליו את ההחלטות.
ברור שרוב ההחלטות של המנהל נמצאות בתווך שבין החלטות אוטומטיות, כאלו שנובעות ישירות מהמידע הקיים וניתן היה להחליט עליהם ע"י מכונה/רובוט, לבין החלטות אווריקיות טהורות, ואשר ביניהן לבין הימור טהור המרחק קצר ביותר. המנהל, בתהליך קבלת ההחלטה מפעיל את כישרונו, הניסיון שלו והסקת מסקנות מן המידע העומד לרשותו. כמו כן, בבואו לבקר את הדרגים הכפופים לו על ביצוע ההחלטות ומדיניות הארגון, עליו לנתח את המידע הרלוונטי לגבי הביצועים הנ"ל.
מצב עניינים זה, התקיים כל הזמן, ומנהלים, מפקדים ושליטים הזדקקו משחר ההיסטוריה למידע, אף כי לפעמים מקורות המידע ודרך עיבודו היו מפוקפקים או למזער לא אמינים. היום, יותר מתמיד, עם התרחבות הזירה והפעילות העסקית, תודות להתפתחות הטכנולוגית המודרנית, המנהל זקוק למידע זמין בזמן אמת, וזאת בגלל המורכבות חסרת התקדים של העולם העסקי, התחרותיות החריפה מאי פעם, ושוק צרכנים מעודכן ורב דרישות.
מקורות המידע
לרשות המנהל המודרני עומדים כמה מקורות למידע הנחוץ לו. קיימים מקורות מחוץ לארגון, כגון מידע על מתחרים, מידע מקצועי-טכנולוגי, מידע המגיע ממקורות ממשלתיים ועוד, ומידע המצוי במסדי הנתונים המופעלים במחשבי (שרתי) הארגון.
כאן נעסוק בסוג השני - המידע שמקורו במסדי הנתונים הממוחשבים של הארגון.
מקור זה הינו החלק הארי של המידע הנחוץ לרוב המנהלים.
בעיות בהפקת מידע ממוחשב למנהלים
למרות העובדה שהנתונים המרכיבים את המידע הנחוץ למנהלים מצוי במסדי הנתונים הממוחשבים, לעיתים קרובות קיים פער בין איכות, כמות ואמינות הנתונים הזמינים לבין המידע המופק מהם.
לכך מספר סיבות:
1. טרנזאקציות מול שאילתות:
הנתונים נוצרים ומתעדכנים במהלך ביצוע תנועות/טרנזאקציות, ברובן מקוונות. טראנזקציה מקוונת מאופיינת בכך שהיא מטפלת בכמויות קטנות של נתונים. היא מטפלת בכמה סוגי נתונים אשר חלקם, משותפים גם לסוגי טרנזאקציות אחרים.
לדוגמה, חשבונית מורכבת מפריט אחד עד כמה עשרות פריטים, נתוני לקוח, תעריף וכו'. טרנזאקציה אחרת, כגון הזמנת רכש, גם מטפלת בפריטים (מעטים יחסית) אך אינה מטפלת בלקוח ולעומת זה עוסקת בנתוני ספק.
אופי זה של הטרנזאקציות, בצרוף הצורך החיוני שביצוען המקוון יהיה קצר ככל האפשר, גרר ארגון מיוחד של מסד הנתונים - הארגון הרלציוני-יחסי המנורמל, המספק ביצועים אופטימליים לסוג זה של עבודה.
לעומת טראנזאקציות אלו, שאילתות הנחוצות למנהלים, למשל מצב המכירות בחודש השוטף, השוואת מכירות השנה לעומת תקופה מקבילה אשתקד וכו', מצריכות סקירה של מספר רב של נתונים, כגון כל החשבוניות של השנה וכל החשבוניות בתקופה המקבילה.
ביצוע שאילתה כזאת, מצריך משאבי מחשב גדולים בהרבה מביצוע טרנזאקציות, וארגון מסד הנתונים המכוונן לטיפול בכמויות קטנות של נתונים אינו יעיל במיוחד לשאילתות, ובכך מגדיל עוד יותר את צריכת המשאבים. התוצאה היא הפרעה ניכרת מצד השאילתות לביצוע הטרנזאקציות המקוונות ופגיעה בעיקר בזמני התגובה. פגיעה כזאת גורמת להפרדה בזמנים בין שני סוגי העיבודים, למשל טרנזאקציות ביום ושאילתות בלילה ואפילו שאילתות מסויימות בסופי שבוע וכדו'.
2. פעילות רוטינית מול דרישות אקראיות:
עבודת הדרג המבצע מאופיינת ברובה פרוצדורות מוגדרות היטב והפעלה שגרתית. יצירת הזמנה, תהיה תמיד זהה במתכונתה ליצירת הזמנה אחרת. כנ"ל, ניפוק ציוד מהמחסן. מצבים חריגים מטופלים, בהתאם לנוהל החריגים, שהוא גם כן רוטיני. כתוצאה מכך, במערכות ה-ERP מטלות אלו מוגדרות היטב מראש. אף כי נעשים שינויים בנהלים וכתוצאה מכך משתנות גם רוטינות מסויימות, הרי ששינויים אלו קורים לעיתים רחוקות.
לעומת עבודה מסוג זה, המנהלים מתמודדים עם דרישות מידע משתנות בנוסף למידע הנחוץ כדרך שגרה. למשל, מנהל מסוים יכול להשתמש באופן יומיומי בדוח המכירות היומי המופק מדי לילה, אך במקרים מסוימים הוא עלול להזדקק לדוח מכירות בחתך שונה או לדוח הבודק (What If) את המכירות בתנאים שונים כמו עליות מחירים של חלק מהפריטים וירידה בעלויות אחרות.
במצב זה, הדוח המופק כדרך שגרה, לא יספק את הצרכים, ומאידך, בגלל קשיי ההפקה המנהל יידרש לחכות לשינוי בתוכנית הפקת הדוח או כתיבת תוכנית חדשה והרצה בלילה אחר, כך שעם סיום תהליך הפיתוח וההרצה, הדוח יהיה מונח לפני המנהל אבל כבר לא יהיה רלוונטי.
3. סיכום בעיות ההפקה של המידע:
ראינו כי מערכות ה-ERP מכווננות היטב לביצוע העבודה של הדרג המבצע.
עבודה זאת רוטינית וניתנת להגדרה מראש ודורשת תחזוקה מעטה יחסית.
כמו כן, מערכות אלו הן המקור לנתונים הנחוצים להפקת המידע למנהלים.
מצד שני, הפקת המידע מתנגשת, מבחינת צריכת המשאבים עם העבודה השוטפת, ובנוסף, דרישות המידע משתנות בתדירות גבוהה ולעיתים לא צפויה, כך שדרושה עבודה רבה ליצירת ותחזוקת התוכנה ובסופו של דבר קשה לספק את המידע בזמן אמת.
הפתרונות
1. הפרדה:
מאחר והפקת המידע מתנגשת עם ביצוע הטרנזקציות, בעיקר כאשר מסדי הנתונים גדולים, יש להפריד בין מסד הנתונים המשרת את הטרנזקציות אשר בתורן מטפלות בנתונים במסד הנתונים, לבין מסד הנתונים ממנו יישלף המידע. ייתכן כי מסד הנתונים למידע יימצא על אותו שרת אך לרוב הוא יוקם על שרת נפרד, במיוחד אם מדובר בהיקפי נתונים גדולים.
2. ארגון נתונים שונה:
מסד הנתונים הנפרד לצורך הפקת מידע, אינו משמש יותר לביצוע טרנזאקציות. הוא חייב להיות מאורגן אחרת כך שיהיה מכוונן להפקה אופטימאלית של המידע.
3. גיוון המידע לפי הצרכים:
בנוסף למהירות הפקת מידע, חייב מערך המידע להיות ערוך לביצוע דוחות ותצוגות מידע משתנים בצורה ובהרכב הנתונים, תוך פרקי זמן קצרים - במקום שעות וימים, שניות.
4. טיוב נתונים:
ברור כי מקור הנתונים הוא מסד הנתונים של מערכות ה-ERP (ראה לעיל OLTP). ברם, הנתונים במערכות ה-OLTP, אינם תמיד תואמים את צורכי המנהל. דוגמה מובהקת לכך הם נתונים חסרים משום שתהליכים מסוימים טרם הושלמו, כמו נתוני תעודות משלוח שהם לעיתים לא סופיים (כמויות, מחירים) ורק בעת הוצאת החשבונית, בהפרש של ימים, שבועות, הם סופיים.מצב זה שהוא נכון מבחינת תהליך המכירה, אינו מספק את צורכי המידע של המנהל, כי עליו לקבל תמונה קרובה ככל האפשר לאמת, גם אם בעתיד יתברר כי היו שינויים קלים. לכן, במקרים מסוג זה הנתונים עשויים להיות שונים ו"מטוייבים" לעומת המקור, עד שיתקבלו הנתונים הסופיים.
דוגמה נוספת לטיוב נתונים היא שימוש בטבלאות שונות לאותו סוג נתונים במערכות שונות כגון טבלת ספקים אחת במערכת הפיננסית וטבלת ספקים נפרדת במערכת הרכש. במקרים מסוג זה שתי המערכות הפועלות בנפרד בסביבת OLTP ומבלי שתפרענה זו לזו (אם כי זה מצב לא רצוי אך מצוי בארגונים רבים), חייב להיות אחיד במסד הנתונים המוקם לצורך הפקת המידע.
5. סיכום:
הנושאים הרשומים לעיל כפתרון לבעיות הקשורות בהפקת המידע למנהלים מסתכמים לשני פתרונות המשלימים זה את זה:
א. מחסן הנתונים - Data Warehouse:
מחסן הנתונים - אתו מסד נתונים נפרד המאורגן בצורה לא מנורמלת, המפעיל כלים של שליפת נתונים ממסד הנתונים המקורי, תוך טיוב הנתונים לפי הצורך, ובדרך כלל על שרת (מחשב) נפרד.
ב. כלי אחזור מידע - OLAP:
כלים המאפשרים ביצוע שאילתות במהירות וביעילות ו/או כלים המארגנים את
הנתונים במודלים רב-ממדיים.
כל סוגי הכלים הלל, מאפשרים גיוון באחזור המידע וגיוון בהצגת המידע, תוך חיתוך ופריסה (Dice & Slice) של המידע לפי חתכים ומפתחות שונים, תצוגות טבלאיות וגרפיות והפקת דוחות שונים.
המקור: אתר erp.org.il