ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: יש או אין קשר בין כריית מידע וטכנולוגיות ענן

יש או אין קשר בין כריית מידע וטכנולוגיות ענן 6 years 6 months ago #8186

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 352
  • קרמה: 0
הענן הוא מאגר מידע אינסופי, לכן מענין את מי שעוסקים בכריית נתונים. השאלה היא האם הוא שימושי מעבר להיותו מקור מידע, האם הוא חלק ממודל הפתרון של חיפוש תבנות בנתונים?
התשובה המיידית היא "כן", בגלל מימדי הנתונים הגדולים. אבל זה לא מסתים בשיקול היחיד הזה. בחיפוש תבנות נדרשת אינטרקציה גבוהה עם הנתונים, והענן לא בדיוק בנוי לאינטראקציה כך שבעית הכמויות הגדולות נותרת במקומה, וצריך לחשוב על פתרון אחר..
זו רק שאלה של זמן מתי יתיאשו סוף סוף מפתרונות מבוססי כח מחשוב – brute force, ויחזרו לשורשי הגישה המדעית של בניית השערות. גישה שבה לא כמות הנתונים קובעת, אלא תורת המידע שבבסיס. גם בסיס ממש קטן במונחי אחסון יכול להציג בעית פיצוח קשה, ומי שמשלה את עצמו שחוק המספרים הגדולים יתגבר על הקושי באבחון, מוטב שייקח בחשבון שמספרים גדולים מביאים איתם גיוון תופעות שמסבך את האבחון ומבדר את התמונה במקום לכנס אותה.
פתרון כח-מחשב הוא טוב ליצרני הכלים ורע לאנליסטים. הוא מיקר את הפתרון, מחיב התמחות, והכי גרוע – עד שמגיעים אליו הוא כבר השתנה. המסקנה שאני טוענת לה מזה שנים (ומימשתי בפתרון של GT data mining) היא, שיכולת כריית נתונים נקבעת על ידי הבסיס הפילוסופי-מדעי של השיטה. לדוגמא, שיטה שמתבססת על מידע מומחה חיצוני לעולם תהיה מוגבלת ע"י הידע הקים, שיטה שלא יודעת להפריד את דפוסי המידע (clusters) השונים לא תועיל בהרבה באבחון ביג דטה, וכך גם שיטה שדורשת ניקוי נתונים כתנאי לאבחון שלהם.


בהקשר זה, מה כותבים בצ'יף מגזין על ערפל הענן :)
ערפל קרב שיווקי
כתבה מה- 28-08-2014

לפני מספר חודשים הכריזה כתבה ב-Wall Street Journal כי מחשוב הענן מת, ויחי מחשוב הערפל!. מחשוב הערפל הוא לא יותר מהמצאה שיווקית של Cisco שמנסה (כמו גם IBM) לחדור לשוק הענן. בסיסקו אומרים כי "מחשוב הערפל הוא פרדיגמה המרחיבה את מחשוב ושירותי הענן עד לקצוות הרשת. בדומה לענן, הערפל מספק שירותי מידע, מחשוב, אחסון ואפליקציות למשתמשי הקצה". אז מה בעצם ההבדל?
סיסקו מנסה להסביר שאינטרנט הדברים, המורכב מאינסוף חיישנים מסביבנו המחוברים לאינטרנט ולענן, שווה למחשוב ערפל... כמו שערפל בשדות ובהרים שווה לעננים נמוכים המקיפים אותנו. כלומר, מעין ענן על הקרקע שהוא ערבוביה קונצפטואלית של IoT עם מחשוב ענן. לדעתנו, הגדרה מיותרת, הפרדה מיותרת, וגחמה שיווקית שעוד תתפוס, מפני שהטיפשים לא מתים, הם רק מתחלפים.
הקונספט הוא מיסודו אוקסימורון, מפני שמחשוב ערפילי קשור למיקום פיזי (עננים סביבנו), בעוד מחשוב הענן מבוסס על מחשוב ללא מיקום ידוע.
היתרון העיקרי של המחשוב הענני הוא דווקא שלא ידוע היכן השרתים שלו נמצאים! עובדה זו שמה את המחשוב העננים באותה שורה עם משאבים ציבוריים אחרים (כמו חשמל) ומאפשר הרחבה והצרה על פי צורך - מפני שהשירות אינו קשור למיקום פיזי, וקיבולת האחסון יכולה להיות מורכבת מהרבה מאוד שרתים פיזיים במקומות שונים.
הענן הוא כלי הכרחי ליישום אינטרנט הדברים. ואינטרנט הדברים היא רק יישום של מחשוב ענן. כאשר מוסיפים לענן עוד ועוד התקנים או חיישנים, זה לא משנה את מבנה הענן.
בשורה התחתונה, הכנסת מושג הערפל רק תורמת להגברת הערפול שכבר קיים לגבי הענן.

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.190 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning