דירוג משתמשים: 5 / 5

Star activeStar activeStar activeStar activeStar active
 
מאת: צ'ארלס באבוק, אינפרמיישנוייק
הכנסותיה של החברה ממכירות Sybase IQ – בסיס נתונים מוכוון טורים (Column Oriented Database) עלו בשנה שעברה ב-70%.

מיכאל סטונבייקר, הגורו של בסיסי הנתונים, חקר לאחרונה את הערך המוסף של בסיסי הנתונים מוכווני הטורים שמציעה חברת הסטארט אפ ורטיקה שבבעלותו, אולם מסתבר שמרבית יצרני המחשבים מתעלמים מהרעיון ם. יחד עם זאת, Sybase, הפעילה אף היא בתחום בסיסי הנתונים מוכיחה שלא צריך להיות חברת סטארט אפ על מנת להתמקד בגישות חדשות.

הכנסותיה של חברת Sybase צמחו בשנת 2007 ל-1.026 מיליארד דולר, ולא רק בזכות חוזקן של המערכות המסורתיות שלה – Sybase Adaptive Server Enterprise והגברת המכירות של בסיסי הנתונים הניידים – תחום בו היא מובילה. הסוד הוא בהתחזקות תחום ה-Sybase IQ שהוא בסיס נתונים מוכוון טורים המיועד למערכות של מחסני נתונים, הקיים כבר 10 שנים, אולם צבר תאוצה "כמו אש בשדה קוצים"בשנה האחרונה. ריצ'רד פלדרדר, סגן נשיא Sybase להנדסה אומר כי לדעתו "המכירות עלו ב-70% בזכות העובדה שבסיס הנתונים הטורי השיג ביצועי מחקר טובים יותר, דבר אותו אנו עושים מאז אמצע שנות ה-90.

 אם נבחן היטב את המאמרים של מיכאל סטונבייקר נראה כי הם מתייחסים ל-Sybase IQ." "המכירות של IQ עלו בשנה האחרונה ב70%". אמר ריצ'רד פלדרדר, סגן נשיא Sybase להנדסה. לדעתו הסיבה נעוצה בעובדה שהשיטה הטורית משיגה ביצועי שאילתות טובים באופן משמעותי ו"אנחנו עושים זאת זמן רב – מאז אמצע שנות התשעים. אם נבחן היטב את המאמרים של מיכאל סטונבייקר נראה כי הם למעשה מתייחסים ל-Sybase IQ." לחברת Sybase יש כ-1200 לקוחות IQ , המריצים מחסני נתונים גדולים המופעלים על ידי שרתים מרובי מעבדים, בעלות של כ-45,000 דולר ל-CPU.

ההכנסות מלקוחות אלו מהוות חלק נכבד מהכנסותיה של החברה. סקוט סמית, מנהל מחסני נתונים ב-ComScore המנתחת פעילות של מבקרים באתרי אינטרנט אמר בראיון כי Sybase "עשתה עבודה טובה עם ב ל ממשק המשתמש של ה ה- IQ על מנת שלמשתמשים תהיה תחושה שהם עובדים מול בסיס נתונים רלציוני מסורתי לכל דבר. המטרה היתה לא להפחיד את המשתמשים. בסיס נתונים טורי מריץ שאילתות SQL ללא התאמות או שינויים , אולם מנהל בסיסי נתונים צריך לחשוב אחרת אודות הנתונים. עליו להיות מוכוון טורים בעצמו ולחשוב במונחים של איסוף רשומות דומות מקבוצות של טרנזקציות, במקום לחשוב רק על טרנזקציות בודדות. "עליך להכיר טוב יותר את המידע שלך. עליך לחשוב אחרת מאשר מפרספקטיבה של אינדוקס", אומר סקוט.

האינדקס יהיה יותר מאשר רשימת נושאים על פי חתך, לדוגמא "כמות מכירות", ןלא רשימה שמכילה פרטים כמו שם הלקוח, פרטי כתובת וכדומה. סקוט מכנה זאת "תשומת לב לקרדינליות הנתונים". סקוט משתמש ב-IQ בעבור ComScore הן למחסן נתונים של 10 טרה בייט והן למחסן של 29-35 טרה בייט, במשך 7.5 שנים אולם עבור בסיס הנתונים ה OLTP - הוא לא משתמש בבסיס הנתונים של Sybase, אלא ב-SQL Server של מיקרוסופט. למיקרוסופט אין היצע של בסיס נתונים טורי, ולא ידוע על בסיסי נתונים מוכווני טורים העשויים להוביל למוצר. מיקרוסופט סירבה להתייחס ל"בעד ונגד" מערכות מוכוונות טורים, כפי שעשתה אורקל. אנאנט ג'ינגרן, סגן נשיא ו-CTO של יחידת ניהול המידע ב-IBM שכוללת גם את DB2 התנגד פומבית לעמדתו של סטונבייקר האומרת שלבסיס נתונים מוכוון טורים ביצועים טובים יותר בניהול מחסני נתונים.

העניין אירוני במקצת שכן סטונבייקר שימש כיועץ האקדמי בעבודת הדוקטורט של גינגרן בברקלי. "הייתי שמח להסכים איתו", אומר ג'ינגרן, "כי אני מאוד אוהב את Streambase שהיא חברת סטארט אפ אחרת בבעלותו של סטונבייקר, המייצרת מוצרי תוכנה לניהול אירועים מורכבים. יחד עם זאת ג'ינגרן אינו מסכים עם סטונבייקר, בנושא מערכות מוכוונות טורים שכן לדעתו ביצוע שאילתות, ככל שהוא מעניין, מהווה רק 20% מהעניין. "לקוחותינו שואלים אם בעבור 20% של ביצועים כדאי לסכן את כל שאר הרווח ממערכות בסיסי הנתונים המסורתיות. הם כוללים בכך את הקישוריות של back-end לאפליקציות ולמקורות נתונים אחרים, את ההשקעה של הארגון בהדרכת מנהלי בסיסי נתונים ואת היכולת להעביר נתונים יחסיים בדרכים הניתנות לניבוי. הוא מציין כי בזמן שכל המרכיבים נלקחים בחשבון, הרווח מביצועי המערכות מוכוונות הטורים מסתכם בסך הכל ב-10% וכמה מוצדק להשקיע על מנת להשיג בסך הכל 10% של שיפור?

סטונבייקר מצהיר, לעומת זאת, כי ניתן להגיע לשיפור של פי 50 בביצועי שאילתות ובשביל שיפור כזה שווה להשקיע במערכות של מחסני נתונים מסובכות יותר. "כשיש לך טבלאות עם מיליארד שורות בגלל כמויות הנתונים, יש בעיית זרימה", אומר סמית. "כמות המידע שצריך להזרים דומה לצינור לכיבוי אש ו-IQ הוא המוצר היחיד שיכול להתמיד בכך". סטונבייקר מאשר ש-Sybase היתה אחת המערכות המסחריות הראשונות מסוג זה. אולם, לדבריו Vertica יצאה עם המערכת מוכוונת הטורים שלה והיא מנסה לבצע אופטימיזציה של היתרונות שניתן להפיק באמצעות דחיסה וגישה של סיוע לתכנון. Vertica מבוססת על מערכת מוכוונת טורים בעלת קוד פתוח, C-store. גם Monet DB הוא פרויקט מוכוון טורים בקוד פתוח, הטוען לשיפור של פי 10 בשאילתות SQL ו-XQuery עבור מהירויות של נתוני XML.

Netezza , יצרן של DataWarehouse Appliance ו-ParAccel, ספק של מחסן נתונים משתמשים גם הם בבסיס נתונים מוכוון טורים במערכות שלהם.

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning