קהילת Apache Cassandra הכריזה על זמינות כללית של Apache Cassandra 5.0, המציעה יעילות נתונים טובה יותר, אינטגרציה של פונקציונליות GenAI וביצועים משופרים.
Apache Cassandra הוא מסד נתונים NoSQL מבוזר בקוד פתוח שנבנה לניהול כמויות גדולות של נתונים על פני מספר שרתים ללא נקודת כשל אחת. בסיס הנתונים, הידוע בזמינות הגבוהה שלו וסובלנות התקלות, מאפשר לארגונים להחזיק מספר צמתים במיקומים שונים תוך שמירה עליהם מסונכרנים.
עם Cassandra 5.0 החדש, מסד הנתונים מקבל דחיפה משמעותית עם גישת אינדקס חדשה באמצעות תכונת Storage Attached Indexes (SAI). בעבר, חברות נאלצו לציין כיצד נבנה מודל הנתונים. עם המהדורה החדשה, מפתחים אינם כבולים עוד למודלים קפדניים של נתונים. העדכון מאפשר שאילתות יעילות יותר בעמודות מפתח לא ראשוניות ומפשט את השימוש באינדקסים משניים עם תקורה מופחתת.
קהילת Apache Cassandra מרחיבה גם את יכולות מסד הנתונים לכלול חיפוש וקטור וסוג נתונים וקטורים חדש, שהם חיוניים עבור פרויקטים של AI ולמידת מכונה (ML). תכונות אלו מאפשרות השוואות דמיון אפקטיביות על ידי אחסון ואחזור וקטורי הטבעה ושיפור הפונקציונליות של יישומים כגון מנועי המלצות, זיהוי הונאה, זיהוי תמונות וצ'אטבוטים של AI.
העדכון כולל גם אסטרטגיית דחיסה מאוחדת המגבירה את צפיפות הנתונים לכל צומת. במקום המגבלה הקודמת של ארבעה טרה-בייט לצומת, Cassandra 5.0 מציע 10 טרה-בייט או יותר לצומת. עלייה זו מאפשרת למשתמשים ארגוניים להפחית את מספר הצמתים הדרושים לפריסות בקנה מידה גדול וכן מסייעת בהורדת עלויות תפעול.
בנוסף, Cassandra 5.0 מציגה זוג מבני נתונים חדשים הידועים כ- trie memtables ו- trie SSTables, אשר מיישרים מבני נתונים מקלט המשתמש לאחסון הדיסק. שיפור זה מפחית את זמן העיבוד וההמרה המיותר, מה שהופך את אחזור הנתונים מהזיכרון או מהדיסק למהיר ויעיל יותר.
המקור ארגון אפצ'י בכתובת הזאת.