הרבה פעמים ב data flow אנחנו נשארים עם עמודות שכבר השתמשנו בהם ושאנחנו לא צריכים בהמשך,
לדוגמה: שימוש ב derived column לאיחוד [שם העובד] עם [שם משפחה] שלו . התוצאה היא שקבלנו שלושה עמודות שאת השתיים הראשונות אנחנו כבר צריכים.
העניין הוא שכדי להסיר את העמודות הללו שכבר נמצאות בזיכרון אנו צריכים לבצע עבודה שגוזלת זמן ולכן אל לנו לדאוג לעמודות המיותרות שממשיכות "לשחות" במורד זרם ה dataflow.
מה שכתבתי הוא נכון כל עוד אנחנו לא משתמשים ברכיבים אשר זקוקים לעבור על כל הרשומות ע"מ להמשיך ,
דוגמה לרכיבים כאלו שצריכים להמתין לכל הרשומות: sort , aggregate
דוגמה לרכיבים שהרשומות עוברות אותם ברצף: derived column, convert
בקיצור, אם אתה כבר משתמש ברכיבים כמו sort ו aggregateאז תוריד את העמודות המיותרות.