הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

חוק מס' 16 במדע הנתונים - החוקים של החוקים ו-ML

More
5 years 1 month ago - 5 years 2 weeks ago #8475 by Edith Ohri
חוק מס' 16 במדע הנתונים - אתגר גילוי החוקים של החוקים

AI, לימוד מכונה וניתוח big-data, מחיבים גילוי שיטתי של החוקים שמאחורי הנתונים. לפי מדע הנתונים החדש, השיטה לגילוי חוקי-על המכונים חוקים של החוקים מתבססת על לוגיקה מסוג "הרחבה ואסוציאציה"*.
ב
ביג דטה חוקי-על אלה מנוסחים באלגוריתמים נתמכי מחשב.

דוגמא:
נניח שמדובר בפרויקט סקר תושבים, שמטרתו לחזות את מגמות האוכלוסיה והרכבה לצורך תכנון תשתיות אזורי.
נניח גם שלמנתחי המידע ידועים מאפיני האוכלוסייה ביישובי האזור ונוסחאות החישוב הקימות של היקף התשתיות הנחוצות עבורם בהתאם. השאלה היחידה שעומדת בפניהם היא כיצד לחזות את הצרכים העתידיים.
חיזוי מבוצע בד"כ על ידי אקסטרפולציה של מגמות העבר. אפשר לשפר את החיזוי ע"י "הרחבה ואסוציאציה":
ניתן להרחיב את רשימת היישובים שבמדגם הסקר, ולהוסיף לה יישובים דומים מבחיעת סוג היישוב, או גודלו, מיקומו וקרבתו ליישובים המקוריים, אף אם חסרים בהם פרטים מסוימים. כ"כ ניתן להוסיף למשתנים המסורתיים אינדיקטורים לגידול/קיטון בצורכי תשתיות שנוצרים עקב שינויים טכנולוגיים וחברתיים, לפי נתונים היסטוריים של הלמ"ס או באנלוגיה לפי מחקרים מארצות אחרות.
אחרי ההרחבה, עשוי מספר המשתנים לגדול פי כמה מזה המקורי.
המידע המורחב יאפשר לתת משקל להשפעה של מגמות בהתחלתן, כגון אנרגיה טבעית, על צורכי תשתיות אזוריים.

הערה: לפני יישום חוקים נדרש לאמן ולאמת אותם על סטים של נתוני לימוד ומבחן.


הגדרות:
* "הרחבה ואסוציאציה" היא פעולה לוגית של יצירת חוקים ע"י החלת חוקים קימים על תחומים אחרים, ביצוע אנלוגיה, או הוספת משתנים אשר קשורים באופן מהותי למשתנים שנמצאים כבר בחוקים הקימים.
* "חוק" זה נוסחא, קשר בין משתנים או פונקציה, שהם בעלי תקפות אוניברסאלית בתוך טווח קיום מסוים.

All Rights Reserved


בברכה
אדית
Last edit: 5 years 2 weeks ago by Edith Ohri. Reason: תיקון לאור משוב שקיבלתי

Please התחברות to join the conversation.

More
5 years 2 weeks ago #8477 by Edith Ohri
אלגוריתמים לייצור נוסחאות נתמכי מחשב

אלגוריתמים לייצור נוסחאות או "החוקים של החוקים", הם אלגוריתמים אוניברסליים המסתמכים על נתונים היסטוריים, ומטרתם היא ליצר ידע עבור יישום מבוקש – ידע שכולל לפחות אחד מהרכיבים: נוסחאות החלטה, אבחון דפוסי התנהגות, לימוד מכונה, חיזוי, חוקי AI, התאמה לשינויים, בקרה ושליטה.
מתחת לאלגוריתמים של ייצור נוסחאות, נמצא לפיכך רובד של אלגוריתמים ספציפיים של יישום מסוים, שמטרתו היא לשלב את הנוסחאות דלעיל במערכת המחשב לשם ביצוען השוטף בזמן אמיתי.


הערה:
כינוי שני הרבדים בשם "אלגוריתמים", מבלבל, וגורם לא פעם לערבוב דרישות ולמבוי סתום בפרויקטים. לדוגמא, הצגת דרישה בלתי אפשרית ל"אג'יליטי" בשלב פיתוח הנוסחאות שהוא מטיבו איטי, ומנגד – דרישה להתחשבות בגורמים חיצוניים בשלב הממוקד בביצוע שוטף, מהיר ומוגבל לנתונים חיים.
התהליך התקין הוא אם כן, תחילה הכנת אלגוריתמים לייצור נוסחאות, ולאחר מכן - יישום הנוסחאות בזמן אמת.

All Rights Reserved


בברכה
אדית

Please התחברות to join the conversation.

More
4 years 8 months ago - 4 years 8 months ago #8494 by Edith Ohri
שאלות ותשובות :

מתי בטוח שצריך לימוד מכונה?
- כאשר כמות האירועים גדולה או יש משתנים רבים, ופעולות החישוב חוזרות על עצמן כך שקל יותר לנסח אותן בצורה אפקטיבית.
זה אומר שלימוד מכונה הוא אפקטיבי כאשר למומחים כבר יש פתרון? קצת אבסורד לא?
- זו בדיוק הטענה שלי, ש- ML רץ אחרי הזנב שלו , שכדי למצוא פתרון אמורים להניח אותו מראש, זה לא הגיוני.
בכל זאת, זה עובד אם נדרש להפעיל פתרון בקנה מידה גדול ובתנאים שלא נלמדו?
- כן, אבל ישנו סיכון. רוב המקרים לא כל כך ברורים. הרי אם היו ברורים, לא היו נזקקים להשתדרג ל Deep ML.
מה לעשות אם המקרה שלי הוא מהלא ברורים?
- זה תורת היחסות... ז"א תלוי איפה הבנאדם נמצא...
נו... ?
- אם נדרשת להביא פתרון לארגון גדול וללכת על פתרון מוכר ומגובה, עדיף לקנות פתרון מספק מוביל. לעומת זאת, אם איתרע מזלך להיות בארגון קטן או להיות אחראי על התוצאות, עדיף להמציא פתרון כלשהו בעצמך.
איזה פתרון בכלל אפשר להמציא במקום שבו הגדולים נכשלים?!
- כל פתרון שניתן לבדיקה בינך לעצמך.
אבל אין לי מושג מאיפה להתחיל, יש המון חומר.
- זה מה שיפה בענין ביג דטה – ככל שהמידע רב ומורכב יותר כך הבלבול גדול יותר ואחוז המידע המנוצל יורד. במילים אחרות, אחוז גדל והולך של הידע "מתגלגל על האדמה".
אז למה לא כולם עושים את זה?!!
- אל תשאלו אותי. מבחינתי כל דבר שמביא תוצאות מוסברות העומדות במבחן, מבורך.
במיוחד מבורך עצם תהליך הלמידה.
לא אגיד משהו חדש בכך שארגון חפץ חיים צריך להחזיק טוב טוב את המושכות של תהליכי הלמידה, מחקר, פיתוח, חדשנות, בעצם בכל דבר יצירתי. יודעים להחליף היום כמעט את כל האיברים, המח לא נמצא אפילו ברשימה המתוכננת.


בברכה
אדית
Last edit: 4 years 8 months ago by Edith Ohri. Reason: הוספת קישור

Please התחברות to join the conversation.

More
4 years 8 months ago - 4 years 8 months ago #8495 by Edith Ohri
מה הנתונים הדרושים לצורך לימוד החוקים של החוקים?

קודם, אתעכב לרגע על ההגדרה של המונח חוקים-של-החוקים. מדובר למעשה בהיררכיה של שכבות חוקים שמתוכן נמצאות בשימוש בינתיים רק שתיים:
(א) השכבה הבסיסית, שמתארת את הקשרים בין פרטים או אירועים בתנאי סביבה מסוימים. אלה הקשרים שמחפשים בשלב הלימוד המקובל, האנושי.
(ב) השכבה השנייה הידועה בשם לימוד-מכונה, שמתארת את הקשרים שבין החוקים לבין תנאי הסביבה ובינם לבין עצמם, כדי שיהיה אפשר להתאים את החוקים לשינויים בסביבת הפעולה. אלה הקשרים הדרושים לצורכי בינה מלאכותית AI.
השכבה השלישית תתאר אולי את הקשרים בין סביבות פעולה, כדי לאפשר יצור מכונות לימוד עצמאיות. מעבר לכך קשה לדמין. מדרג החוקים ממשיך תיאורטית עד אינסוף, וככל שעולים בו, ההגדרות נהיות אבסטרקטיות וקשות לתפישה, אך זה לא צריך להפריע בדיון הזה.

דבר שני שדרוש להבהיר לפני הכל, הוא שיטת הגילוי של חוקים. לפי מדע הנתונים החדש, שיטת גילוי החוקים בכל השכבות היא אחת. זו שיטה מבוססת נתונים המתיחסת לכל ידע קים כלנתון, שמציעה דרך לוגית "לקפוץ" מהבנה דדוקטיבית להבנה אינדוקטיבית, כלומר – מסיכום העבר לחוק כללי שתופס גם בעתיד. הערה: האינדוקציה שבה משתמשת הסטטיסטיקה, לא היתה מוסכמת בחוגי הפילוסופיה של המדע מאז ומתמיד; הכשל שלה התברר לאנליסטים חד משמעית עם הופעת הביג דטה, אך הפתרונות שפותחו, משוכללים ככל שיהיו "לא עונים על שורש הבעיה שנעוץ באינדוקציה" (פרופ' יוסף אגסי). אגב, זה מה שהניע אותי לכתוב את מדע הנתונים החדש.
השאלה חוזרת לנושא הנתונים: אם ההבדל בין יצירת חוקים בשכבות השונות אינו נעוץ בשיטה (שהיא אחת כאמור לפי מדע-הנתונים-החדש), נשאר אם כך רק דבר שעושה את ההבדל - הנתונים שמשמשים לשיטה.
במה שונים הנתונים שמשמשים ללימוד אנוש מאלה שדרושים ללימוד מכונה וייצור בינה מלאכותית - AI?

אחרי ההקדמה הארוכה, הגדרת הנתונים לפי מדע הנתונים היא די קצרה –
הנתונים של לימוד מכונה שונים מאלה של לימוד אנוש, בכך שנוספים להם החוקים והסמנטיקה* שהופקו מלימוד האנוש.
*זה כמו להגיד במילים אחרות, שבכל רגע יש להתיחס לידע הקים כלנתון עובדתי ולחפש את החוקים שהביאו לגילויו.

כללית ההגדרה של הנתונים הדרושים ללימוד החוקים של החוקים היא רקורסיבית: הנתונים הדרושים לצורכי חוקים של החוקים, הם נתוני השכבה הקודמת ועוד החוקים והסמנטיקה שהופקו בשכבה הקודמת.


בברכה
אדית
Last edit: 4 years 8 months ago by Edith Ohri. Reason: תיקון הבהרה

Please התחברות to join the conversation.

Moderators: Edith Ohri
Time to create page: 0.281 seconds