Star inactiveStar inactiveStar inactiveStar inactiveStar inactive
 
גוזרים נתונים מהאקסל? לפניכם מאמר מקורי המראה מספר פטנטים שיגרמו לנתונים להיות נקיים יותר.

גזירת נתונים מאקסל שונה באופן מהותי מגזירת נתונים מבסיסי נתונים. בעוד שהנתונים השמורים בתוך בסיסי נתונים הם מסודרים ומאורגנים הן על ידי בדיקות תקינות של האפליקציה והן על ידי constraints של בסיס הנתונים עצמו, הנתונים באקסל אינם כאלה בכלל. למעשה, רוב גיליונות האקסל אינן מאורגנים וסדר הנתונים נתון לחסדו של האדם המכניס את הנתונים לתוך הגיליון.dwh2.gif

מסיבה זאת, גזירת הנתונים מגיליון אקסל בהרבה מקרים יכולה להיות מאד בעייתית ולכן אנשי מקצוע רבים בתחום, אינם אוהבים לעסוק בה. לדוגמא: אם בעמודה מסויימת בגיליון הנתונים, ישנה עמודה המכילה את מספר הסוכן בצורה נומרית הרי גם השדה המקביל במחסן הנתונים יהיה נומרי, אך מה קורה כאשר מוכנס בשוגג בעמודה שם סוכן במקום מספר סוכן? קרוב לוודאי שהתהליך יכשל.

אף כי אתר זה אינו עוסק בתמיכה באקסל, אנו רוצים להציג מספר טריקים שבאקסל שיקלו את גזירת הנתונים מהאקסל.

נתחיל בהגדרה גורפת: באקסל קיימות בדיקות תקינות של נתונים ומין הראוי שבדיקות אלו ייושמו בכל גיליון שממנו גוזרים נתונים.  

דבר ראשון יש לסמן את העמודה או העמודות שאליהם רוצים לחייב בדיקת תקינות.

שנית יש לגשת לתפריט Data ולבחור Validation.

קיבלתם את המסך הבא:

 excel_validation1.gif

 

 

 

 

 

 

 

 

 

 

 

בלשונית Setting תחת Allow, ישנה רשימת גלילה הקובעת את סוג בדיקת האימות. אנחנו מטבע הדברים נתמקד בבדיקות שרלוונטיות לגזירת נתונים.

ברירת המחדל של הרשימה היא Any Value-אין בדיקת תקינות על התא\עמודה. 

כדי לוודא שתא מסויים יכיל מספר בלבד ועוד בתחום מסויים יש לבחור Whole Number. תפתח התיבה הבאה:

 excel_validation2.gif

 

 

 

 

 

 

 

 

 

 

 

בחלק הData מכניסים את סוג האופרטור, במקרה זה less than.

בחלק הMaximum מכניסים את הערך , במקרה זה 1000. הערה: התיבות של הנתונים משתנות בהתאם לסוג האופרטור.

אחרי לחיצה על OK לא יהיה ניתן להכניס לעמודה נתונים חוץ מנתונים מספרים שערכם קטן מ1000. דבר חשוב כאשר שדה זה נטען לתוך שדה number עם 3 פוזיציות.

בדיקת תקינות חשובה נוספת היא Text Length, דבר המאפשר להתריאה בפני המשתמש כי הכניס מחרוזת ארוכה מדי.

 excel_validation3.gif

 

 

 

 

 

 

 

 

 

 

 

שוב בData יוכנס האופרטור, ובMaximum הערך המקסימלי-במקרה זה 50.

 בדיקת תקינות נוספת ושימושית מאד היא בחירת ערכים מרשימה.

 excel_validation4.gif

 

 

 

 

 

 

 

 

 

 

 

לאחר שבחרנו תחת Allow את הערך List נפתחה תיבת  נוספת עם הכותרת Source. בתיבה זאת יש להכניס טווח בגיליון הנתונים וכאשר כל ערך בתא חייב להיות אחד מהערכים המטווח שהמופיע בSource. בדוגמא שלנו בחרנו טווח A20-A24:

excel_validation5.gif

 

 

 

 

 

 

אם לצורך העניין רצינו לבצע בדיקת נתונים על עמודה J עם הטווח הזה שקבענו בsource, אזי כל ערך שיוכנס לעמודה J יהיה חייב להיות אחד מהערכים מהרשימה לעיל. הערה: מגרעה רצינית היא שלא ניתן לקבוע את הsource בלשונית אחרת אלא רק באותה לשונית שבה אנחנו רוצים לבצע את בדיקת התקינות.

רעין זה שימושי במיוחד כאשר רוצים לוודא שהמשתמש יכניס נתונים מסויימים עם משמעות, לדוגמא כמו שם סניף. בכל תא עם בדיקת תקינות כזאת, תפתח לידו תיבת גלילה עם הערכים האפשרים:

 excel_validation6.gif

 

 

 

 

לאחר שסקרנו את הבדיקות התקינות הרלוונטיות, בואו נעיף מבט במסך אחד נוסף וחשוב- הכנסו ללשונית Error Alert. לשונית זאת קובעת את סוגי ההודעות שהמשתמש יקבל כאשר יכניס נתונים שגויים.

 

 excel_validation7.gif

 

 

 

 

 

 

 

 

 

 

 

Title: כותרת הודעת השגיאה.

Error Message: תוכן הודעת השגיאה.

Style: סגנון הודעת השגיאה. ישנם שלושה סוגים של סגנונות: stop-לא ניתן להמשיך עד שהערך לא יתוקן. Warning-הזהרה למשמש. Information-לתשומת לב המשתמש.


לסיכום נאמר כי בדיקות התקינות הם מאד שימושיות כשמדובר בגזירת נתונים וזאת כדי למנוע חוסר התאמה בין סכמת הנתונים בבסיס הנתונים לבין הנתונים באקסל.

 

 

 

 

 

 

 

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning