AWS הכריזה על חמש יכולות חדשות על פני  מסדי הנתונים והאנליטיקה שלה, שמאפשרות ללקוחות לנהל ולנתח נתונים בקנה מידה פטה-בייט מהיר וקל יותר.

היכולות החדשות הללו עבור Amazon DocumentDB (עם תאימות MongoDB), Amazon OpenSearch Service ו- Amazon Athena מקלות על הלקוחות להפעיל עומסי עבודה של מסד נתונים וניתוח ביצועים גבוהים בקנה מידה.

בנוסף, AWS הכריזה על יכולת חדשה עבור AWS Glue לניהול אוטומטי של איכות נתונים על פני אגמי נתונים וצינורות נתונים. לבסוף, Amazon Redshift מציעה כעת תמיכה בתצורת זמינות גבוהה על פני מספר אזורי זמינות של AWS (AZ). ההכרזה  עוזרת ללקוחות להפיק את המרב מהנתונים שלהם ב-AWS על ידי העצמתם לגשת לכלים הנכונים לעומסי העבודה שלהם, לפעול בקנה מידה ולהגדיל את הזמינות.

בין השיפורים:

Amazon DocumentDB Elastic Clusters מפעילים יישומים בקנה מידה פטה-בייט עם מיליוני כתיבה בשנייה: עשרות אלפי לקוחות משתמשים באמזון DocumentDB כדי להפעיל את עומסי העבודה של המסמכים שלהם מכיוון שהוא מהיר, ניתן להרחבה, זמין מאוד ומנוהל באופן מלא. בעוד שכל צומת אמזון DocumentDB יכול להגדיל עד 64 טבי-בייט של נתונים ולתמוך במיליוני בקשות קריאה בשנייה, תת-קבוצה של לקוחות עם עומסי עבודה תובעניים ביותר זקוקה ליכולת להרחיב מעבר למגבלות אלו כדי לתמוך במיליוני כתיבה בשנייה ולאחסן פטה-בייט של נתונים .


Amazon OpenSearch Serverless מרחיבה אוטומטית את עומסי החיפוש והניתוח: כדי להפעיל מקרי שימוש כמו חיפוש באתר וניטור יישומים בזמן אמת, עשרות אלפי לקוחות משתמשים בשירות Amazon OpenSearch. רבים מעומסי העבודה הללו נוטים לעליות פתאומיות לסירוגין בשימוש, מה שמקשה על תכנון הקיבולת. Amazon OpenSearch Serverless מספק, מגדיר ומרחיב את תשתית OpenSearch באופן אוטומטי כדי לספק קליטת נתונים מהירה ותגובות שאילתות של אלפיות שנייה, אפילו עבור עומסי עבודה בלתי צפויים ולסירוגין. עם Amazon OpenSearch Serverless, קליטת נתונים ומשאבי חיפוש מתרחבים באופן עצמאי, ומאפשרים לפעולות אלו לפעול במקביל ללא כל השפעה על הביצועים. לקוחות המשתמשים ב-Amazon OpenSearch Serverless מקבלים גישה להטבות ללא שרת (למשל, הקצאה אוטומטית, קנה מידה לפי דרישה ותמחור בתשלום עבור שימוש), יחד עם תכונות Amazon OpenSearch Service, כגון הדמיות נתונים מובנות, שעוזרות להם להבין את היומן נתונים, זיהוי חריגות וראה דירוגי רלוונטיות לחיפוש.


Amazon Athena עבור Apache Spark מאיצה את ההפעלה של ניתוח אינטראקטיבי לפחות משנייה אחת: לקוחות משתמשים באמזון אתנה, שירות שאילתות אינטראקטיבי serverless, מכיוון שזו אחת הדרכים הקלות והמהירות ביותר לבצע שאילתות פטה-בייט של נתונים ב- Amazon Simple Storage Service (Amazon S3 ) באמצעות ממשק SQL סטנדרטי. לקוחות רבים מחפשים את אותה קלות שימוש בכל הנוגע לשימוש ב- Apache Spark, מסגרת עיבוד בקוד פתוח לעומסי עבודה ביג דאטה התומכת במסגרות שפות פופולריות (כלומר, Java, Scala, Python ו-R). בעוד שמפתחים נהנים ממהירות השאילתה המהירה ומקלות השימוש של Apache Spark, הם לא רוצים להשקיע זמן בהגדרה, ניהול והרחבה של תשתית Apache Spark משלהם בכל פעם שהם רוצים להריץ שאילתה. כעת, עם Amazon Athena עבור Apache Spark, הלקוחות לא צריכים להקצות, להגדיר ולהתאים את המשאבים בעצמם. יישומי Apache Spark אינטראקטיביים מתחילים תוך פחות משנייה אחת ופועלים מהר יותר מקוד פתוח באמצעות זמן הריצה האופטימלי של Spark של AWS.


AWS Glue Data Quality מנטרת ומנהלת אוטומטית את טריות הנתונים, הדיוק והשלמות: מאות אלפי לקוחות משתמשים ב-AWS Glue כדי לבנות ולנהל צינורות נתונים מודרניים במהירות, בקלות ובעלות יעילה. ארגונים צריכים לפקח על איכות הנתונים של המידע באגמי הנתונים ובצנרת הנתונים שלהם כדי להבטיח שהוא איכותי לפני השימוש בו כדי להפעיל את יישומי הניתוח או למידת המכונה שלהם.


אמזון Redshift תומכת כעת בפריסות ריבוי AZ: עשרות אלפי לקוחות AWS מעבדים ביחד אקס-בייט של נתונים עם Amazon Redshift מדי יום. כדי לתמוך בעומסי עבודה קריטיים של לקוחות אלה, אמזון Redshift מציעה יכולות המגבירות את הזמינות והאמינות, כגון גיבויים אוטומטיים והיכולת להעביר אשכול ל-AZ אחר בתוך דקות. מסדי נתונים רבים משתמשים כיום במצב שכפול ראשוני בהמתנה כדי לתמוך בזמינות גבוהה כאשר מסד נתונים בודד משרת תעבורה חיה, והמתנה מעתיקה נתונים משוכפלים מהגרסה החיה למקרה שיצטרכו להחליף אותו. בהתבסס על יכולות אלו, אמזון Redshift מציעה כעת תצורה בעלת זמינות גבוהה כדי לאפשר התאוששות מהירה תוך מזעור הסיכון לאובדן נתונים.

המקור: אמזון בכתובת הזאת.