התחברות

התחברות
x
או
x
הרשמה
x

או

קליק אחד ואתם מחוברים. מהיר .קל .מאובטח.

מעניין? שתפו דף זה באמצעות הטלפון הנייד

אירועים קרובים

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

הדף שלנו בפייסבוק

ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: חוק מס' 16 במדע הנתונים - החוקים של החוקים ו-ML

חוק מס' 16 במדע הנתונים - החוקים של החוקים ו-ML 6 months 3 weeks ago #8475

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 338
  • קרמה: 0
חוק מס' 16 במדע הנתונים - אתגר גילוי החוקים של החוקים

AI, לימוד מכונה וניתוח big-data, מחיבים גילוי שיטתי של החוקים שמאחורי הנתונים. לפי מדע הנתונים החדש, השיטה לגילוי חוקי-על המכונים חוקים של החוקים מתבססת על לוגיקה מסוג "הרחבה ואסוציאציה"*.
ב
ביג דטה חוקי-על אלה מנוסחים באלגוריתמים נתמכי מחשב.

דוגמא:
נניח שמדובר בפרויקט סקר תושבים, שמטרתו לחזות את מגמות האוכלוסיה והרכבה לצורך תכנון תשתיות אזורי.
נניח גם שלמנתחי המידע ידועים מאפיני האוכלוסייה ביישובי האזור ונוסחאות החישוב הקימות של היקף התשתיות הנחוצות עבורם בהתאם. השאלה היחידה שעומדת בפניהם היא כיצד לחזות את הצרכים העתידיים.
חיזוי מבוצע בד"כ על ידי אקסטרפולציה של מגמות העבר. אפשר לשפר את החיזוי ע"י "הרחבה ואסוציאציה":
ניתן להרחיב את רשימת היישובים שבמדגם הסקר, ולהוסיף לה יישובים דומים מבחיעת סוג היישוב, או גודלו, מיקומו וקרבתו ליישובים המקוריים, אף אם חסרים בהם פרטים מסוימים. כ"כ ניתן להוסיף למשתנים המסורתיים אינדיקטורים לגידול/קיטון בצורכי תשתיות שנוצרים עקב שינויים טכנולוגיים וחברתיים, לפי נתונים היסטוריים של הלמ"ס או באנלוגיה לפי מחקרים מארצות אחרות.
אחרי ההרחבה, עשוי מספר המשתנים לגדול פי כמה מזה המקורי.
המידע המורחב יאפשר לתת משקל להשפעה של מגמות בהתחלתן, כגון אנרגיה טבעית, על צורכי תשתיות אזוריים.

הערה: לפני יישום חוקים נדרש לאמן ולאמת אותם על סטים של נתוני לימוד ומבחן.


הגדרות:
* "הרחבה ואסוציאציה" היא פעולה לוגית של יצירת חוקים ע"י החלת חוקים קימים על תחומים אחרים, ביצוע אנלוגיה, או הוספת משתנים אשר קשורים באופן מהותי למשתנים שנמצאים כבר בחוקים הקימים.
* "חוק" זה נוסחא, קשר בין משתנים או פונקציה, שהם בעלי תקפות אוניברסאלית בתוך טווח קיום מסוים.

All Rights Reserved

בברכה
אדית
עריכה אחרונה: 6 months 3 days ago  ע''י Edith Ohri. סיבה: תיקון לאור משוב שקיבלתי
הנהלת האתר ביטלה גישת כתיבה ציבורית.

חוק מס' 16 במדע הנתונים - החוקים של החוקים ו-ML 6 months 3 days ago #8477

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 338
  • קרמה: 0
אלגוריתמים לייצור נוסחאות נתמכי מחשב

אלגוריתמים לייצור נוסחאות או "החוקים של החוקים", הם אלגוריתמים אוניברסליים המסתמכים על נתונים היסטוריים, ומטרתם היא ליצר ידע עבור יישום מבוקש – ידע שכולל לפחות אחד מהרכיבים: נוסחאות החלטה, אבחון דפוסי התנהגות, לימוד מכונה, חיזוי, חוקי AI, התאמה לשינויים, בקרה ושליטה.
מתחת לאלגוריתמים של ייצור נוסחאות, נמצא לפיכך רובד של אלגוריתמים ספציפיים של יישום מסוים, שמטרתו היא לשלב את הנוסחאות דלעיל במערכת המחשב לשם ביצוען השוטף בזמן אמיתי.


הערה:
כינוי שני הרבדים בשם "אלגוריתמים", מבלבל, וגורם לא פעם לערבוב דרישות ולמבוי סתום בפרויקטים. לדוגמא, הצגת דרישה בלתי אפשרית ל"אג'יליטי" בשלב פיתוח הנוסחאות שהוא מטיבו איטי, ומנגד – דרישה להתחשבות בגורמים חיצוניים בשלב הממוקד בביצוע שוטף, מהיר ומוגבל לנתונים חיים.
התהליך התקין הוא אם כן, תחילה הכנת אלגוריתמים לייצור נוסחאות, ולאחר מכן - יישום הנוסחאות בזמן אמת.

All Rights Reserved

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

חוק מס' 16 במדע הנתונים - החוקים של החוקים ו-ML 2 months 15 hours ago #8494

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 338
  • קרמה: 0
שאלות ותשובות :

מתי בטוח שצריך לימוד מכונה?
- כאשר כמות האירועים גדולה או יש משתנים רבים, ופעולות החישוב חוזרות על עצמן כך שקל יותר לנסח אותן בצורה אפקטיבית.
זה אומר שלימוד מכונה הוא אפקטיבי כאשר למומחים כבר יש פתרון? קצת אבסורד לא?
- זו בדיוק הטענה שלי, ש-ML רץ אחרי הזנב שלו , שכדי למצוא פתרון אמורים להניח אותו מראש, זה לא הגיוני.
בכל זאת, זה עובד אם נדרש להפעיל פתרון בקנה מידה גדול ובתנאים שלא נלמדו?
- כן, אבל ישנו סיכון. רוב המקרים לא כל כך ברורים. הרי אם היו ברורים, לא היו נזקקים להשתדרג ל Deep ML.
מה לעשות אם המקרה שלי הוא מהלא ברורים?
- זה תורת היחסות... ז"א תלוי איפה הבנאדם נמצא...
נו... ?
- אם נדרשת להביא פתרון לארגון גדול וללכת על פתרון מוכר ומגובה, עדיף לקנות פתרון מספק מוביל. לעומת זאת, אם איתרע מזלך להיות בארגון קטן או להיות אחראי על התוצאות, עדיף להמציא פתרון כלשהו בעצמך.
איזה פתרון בכלל אפשר להמציא במקום שבו הגדולים נכשלים?!
- כל פתרון שניתן לבדיקה בינך לעצמך.
אבל אין לי מושג מאיפה להתחיל, יש המון חומר.
- זה מה שיפה בענין ביג דטה – ככל שהמידע רב ומורכב יותר כך הבלבול גדול יותר ואחוז המידע המנוצל יורד. במילים אחרות, אחוז גדל והולך של הידע "מתגלגל על האדמה".
אז למה לא כולם עושים את זה?!!
- אל תשאלו אותי. מבחינתי כל דבר שמביא תוצאות מוסברות העומדות במבחן, מבורך.
במיוחד מבורך עצם תהליך הלמידה.
לא אגיד משהו חדש בכך שארגון חפץ חיים צריך להחזיק טוב טוב את המושכות של תהליכי הלמידה, מחקר, פיתוח, חדשנות, בעצם בכל דבר יצירתי. יודעים להחליף היום כמעט את כל האיברים, המח לא נמצא אפילו ברשימה המתוכננת.

בברכה
אדית
עריכה אחרונה: 2 months 15 hours ago  ע''י Edith Ohri. סיבה: הוספת קישור
הנהלת האתר ביטלה גישת כתיבה ציבורית.

חוק מס' 16 במדע הנתונים -מה הנתונים ללימוד חוקי-על 1 month 3 weeks ago #8495

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 338
  • קרמה: 0
מה הנתונים הדרושים לצורך לימוד החוקים של החוקים?

קודם, אתעכב לרגע על ההגדרה של המונח חוקים-של-החוקים. מדובר למעשה בהיררכיה של שכבות חוקים שמתוכן נמצאות בשימוש בינתיים רק שתיים:
(א) השכבה הבסיסית, שמתארת את הקשרים בין פרטים או אירועים בתנאי סביבה מסוימים. אלה הקשרים שמחפשים בשלב הלימוד המקובל, האנושי.
(ב) השכבה השנייה הידועה בשם לימוד-מכונה, שמתארת את הקשרים שבין החוקים לבין תנאי הסביבה ובינם לבין עצמם, כדי שיהיה אפשר להתאים את החוקים לשינויים בסביבת הפעולה. אלה הקשרים הדרושים לצורכי בינה מלאכותית AI.
השכבה השלישית תתאר אולי את הקשרים בין סביבות פעולה, כדי לאפשר יצור מכונות לימוד עצמאיות. מעבר לכך קשה לדמין. מדרג החוקים ממשיך תיאורטית עד אינסוף, וככל שעולים בו, ההגדרות נהיות אבסטרקטיות וקשות לתפישה, אך זה לא צריך להפריע בדיון הזה.

דבר שני שדרוש להבהיר לפני הכל, הוא שיטת הגילוי של חוקים. לפי מדע הנתונים החדש, שיטת גילוי החוקים בכל השכבות היא אחת. זו שיטה מבוססת נתונים המתיחסת לכל ידע קים כלנתון, שמציעה דרך לוגית "לקפוץ" מהבנה דדוקטיבית להבנה אינדוקטיבית, כלומר – מסיכום העבר לחוק כללי שתופס גם בעתיד. הערה: האינדוקציה שבה משתמשת הסטטיסטיקה, לא היתה מוסכמת בחוגי הפילוסופיה של המדע מאז ומתמיד; הכשל שלה התברר לאנליסטים חד משמעית עם הופעת הביג דטה, אך הפתרונות שפותחו, משוכללים ככל שיהיו "לא עונים על שורש הבעיה שנעוץ באינדוקציה" (פרופ' יוסף אגסי). אגב, זה מה שהניע אותי לכתוב את מדע הנתונים החדש.
השאלה חוזרת לנושא הנתונים: אם ההבדל בין יצירת חוקים בשכבות השונות אינו נעוץ בשיטה (שהיא אחת כאמור לפי מדע-הנתונים-החדש), נשאר אם כך רק דבר שעושה את ההבדל - הנתונים שמשמשים לשיטה.
במה שונים הנתונים שמשמשים ללימוד אנוש מאלה שדרושים ללימוד מכונה וייצור בינה מלאכותית - AI?

אחרי ההקדמה הארוכה, הגדרת הנתונים לפי מדע הנתונים היא די קצרה –
הנתונים של לימוד מכונה שונים מאלה של לימוד אנוש, בכך שנוספים להם החוקים והסמנטיקה* שהופקו מלימוד האנוש.
*זה כמו להגיד במילים אחרות, שבכל רגע יש להתיחס לידע הקים כלנתון עובדתי ולחפש את החוקים שהביאו לגילויו.

כללית ההגדרה של הנתונים הדרושים ללימוד החוקים של החוקים היא רקורסיבית: הנתונים הדרושים לצורכי חוקים של החוקים, הם נתוני השכבה הקודמת ועוד החוקים והסמנטיקה שהופקו בשכבה הקודמת.

בברכה
אדית
עריכה אחרונה: 1 month 3 weeks ago  ע''י Edith Ohri. סיבה: תיקון הבהרה
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.235 שניות

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning