ברוך הבא, אורח
שם משתמש: סיסמא: זכור אותי

דיון: יעוץ

יעוץ 12 years 9 months ago #2486

  • ilanm
  • ilanm's Avatar
  • Offline
  • Fresh Boarder
  • הודעות: 2
  • קרמה: 0
אדית שלום

שמי אילן ממציא ומיסד של חברת הזנק שמפתחת מכשיר רפואי מתקדם, אנו בשלב זה מתלבטים בין גיוס איש data mining בכיר לבין מיקור של ה- data mining
למרות שאנו מתמודדים כרגע עם בעיה לא קשה במיוחד מדאיגה אותנו במיקור העובדה שהמידע נמצא מחוץ לחברה, בד בבד אנו מבינים את היתרון
בגוף מנוסה שעובד כמערכת משומנת שחי את הבעיות הללו כל יום ושמסוגל לבצע brainstorming.

מה עמדתך בנושא

האם יכולים להיות פערים תקציביים בין האפשרויות?

בברכה
אילן מנשה
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: יעוץ 12 years 9 months ago #2491

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
אילן, שלום
מדאיגה אותנו במיקור העובדה שהמידע נמצא מחוץ לחברה

צעדים לשמירת חסיות מידע, שפועלים היטב:
א. הסכם שמירת סודיות.
ב. מסירת מידע למספר מוגבל של אנשים, רצוי אחד בלבד.
ג. מיסוך פרטי מידע רגישים.
ד. ביצוע ניתוח טכני בחוץ ופרשנות מקצועית בבית.
הסבר: DM (בשיטת GT) הוא אבחון נתונים טכני. הפקת הידע האמיתית מתרחשת אצל המזמין, ולכן הידע למעשה נשאר אצלו.

לדוגמא. בפרויקט מחקר ביוטק מסוים התגלתה תופעה מחזורית של טפיל מסוים בבית הגידול שלו. מבחינת ה-DM, זו היתה סתם תופעה מסבירה. המשתמש לעומת זאת, ראה בה תגלית חדשה ומענינת, ומקור להשערות מדעיות שימושיות. עד היום, כמבצעת ה-DM,  אין לי מושג אפילו מה נעשה עם הידע שהושג, שנותר לחלוטין ברשות המזמין.


היתרונות הכלכליים של שירות חיצוני בכריית נתונים עולים על החסרונות, בתנאי שזה DM שיודע להתעסק עם נתונים לא-מפוקחים.
לסכם את היתרון: סף כניסה נמוך, שמירת גמישות המחקר, הפקת עובדות חדשות ללימוד נושא המחקר, תשואה בטווח קצר יותר בסדר גודל, יכולת גילוי מוקדם והפקת תועלת במצב של נתונים מועטים (חשוב מאד בחברת הזנק).
נוכח היתרונות שווה להתגבר על החסרון היחיד, מה עוד שיש דרכים לטפל בו כאמור לעיל.

עניתי למה שרצית?

This e-mail address is being protected from spambots. You need JavaScript enabled to view it.



בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: יעוץ 12 years 9 months ago #2493

  • ilanm
  • ilanm's Avatar
  • Offline
  • Fresh Boarder
  • הודעות: 2
  • קרמה: 0

הסברת מצויין

חסרים לי סדרי גודל של עלויות של 2 האפשרויות
ל- DM קטן יחסית

תודה רבה
אילן מנשה
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: יעוץ 12 years 9 months ago #2494

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
אילן, שלום

בפרויקטים שהשוויתי בעבר, היה הבדל של סדר גודל בין עלות DM כשירות, ו-DM כמערכת בארגון.
זאת לפי עלות-בעלות של פתרון קנוי, אשר מלבד מחיר מערכת, כוללת הוצאות כגון: התמחות עובדים, יעוץ ליישום, ניקוי נתונים והבנית הנתונים במתכונת תקנית.

מעבר להערכה הכללית הזאת, יידרשו לי פרטים נוספים, על היקפים, איכות נתונים זמינים וכד'.
אנא התקשר ב 03-5232164.

בברכה, אדית



בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: יעוץ 12 years 8 months ago #2579

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
בענין מחיר ניתוח הנתונים

פיתוח מוצר חדש שמכיל מידע ומצריך כריית נתונים (DM), מחיב תשומת לב מיוחדת. רכיב המידע משפיע הרבה מעבר לעלות הפקתו, עקב התועלת האסטרטגית שלו. להלן שני שיקולים אסטרטגיים שכדאי להכניס לחישוב הכדאיות הכלכלי:
  • שיקול אחד הוא איכות ה-DM והפונקציונליות שלו, שיקבעו עד כמה יהיה אפשר לממש את תכונות המוצר שנרשמו בפטנט;
  • והשיקול השני - החוזק של ה-DM, יכולתו לפצח נתונים מורכבים, להתגבר על ה'רעש' שלהם, להגיע למסקנות יציבות במעט נתונים, לכוון את מקבלי ההחלטות בשלב מוקדם ובכך להקטין סיכונים עסקיים.


לרוב, מסתכלים על העלות הכספית הישירה ולא כל כך מתיחסים לתרומה העקיפה שיש ל-DM להצלחה האסטרטגית עסקית. המלצתי היא כן להשקיע בקטע הזה של העבודה, למרות הקושי להגדיר עלויות ותועלת חשבונאית. זאת משום שבמוצרים רבים, רכיב התכנה קובע את גודלו של היתרון היחסי של המוצר, ואת האפשרויות העסקיות שייפתחו לפניו.


מימוש תכונות המוצר:
    לדוגמא: נניח יש צורך בכריית נתונים למכשיר חדש שקורא את זיהום האוויר ומתריע על רמת זיהום גבוהה. כריית הנתונים תקבע את מהימנות הקריאה, וגם תקבע האם הוא יהיה שימושי לנתחי שוק נוספים. אם ה-DM נעשה כהלכה ייפתחו אפשרויות להשתמש במכשיר למדידת השפעות סביבתיות, להשתתפות במחקרים על מחלות עקב זיהום, למעקב על תנאים אטמוספריים שיוגדרו כגורמי זיהום, ועוד. האפשרויות תלויות באיכויות של כריית הנתונים, באמינות של זיהוי המצבים שהמכשיר יבצע.


הקטנת סיכונים:
השיקול העסקי הוא עוד פחות קל למדידה מהפונקציונלי, אך חשיבותו קריטית. כריית נתונים יכולה לקצר את זמן ההגעה לשוק, ליצר יתרון יחסי, להקדים את המתחרים, לפתוח גומחות חדשות, לתת גמישות ניהול, ובמילים פשוטות - להקטין את סיכוני המשקיעים. סיכונים שווים כסף, כמה? - אין תשובה אחידה, אך כל יזם או משקיע יודעים שעל זה יקום או יפול דבר.


אדית

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.

בעניין: יעוץ 12 years 8 months ago #2644

  • Edith Ohri
  • Edith Ohri's Avatar
  • Offline
  • Moderator
  • הודעות: 353
  • קרמה: 0
להשתחרר מהצורך במדגם סטטיסטי!

ניסוי מוצר חדש אורך זמן רב. תחילה צריך לבדוק האם הוא מבצע את מה שהוא אמור לעשות. אחר כך מתחיל סבב שיפור הביצועים, שבו מנתחים את התוצאות ומעלים השערות לגבי הסיבות לאי-דיוקים. כל בדיקת השערה דורשת ניסוי חדש עם מדגם מתאים שייצג את התופעה, וס"ך זמן הבדיקה יכול להימשך חדשים ושנים
    לדוגמא, נניח נתגלתה סטייה במכשיר שנועד להתראה על זיהום אוויר, אשר קורית בעיקר בשעות הבוקר המוקדמות:
    משערים שהסיבה היא תנאי ה"סביבה" המיוחדים לשעות אלה - טמפרטורה ולחות חיצוניים,  או אולי בודק עיף. המדגם צריך לפיכך להכיל מגוון של תנאי חוץ ובודקים שונים.
    רק אחרי מספר חודשים אפשר לדעת אם עלינו על הסיבה, או שהגורם במקום אחר, אולי הסטייה נגרמת מאופן אחסון המכשיר בשעות הלילה, שגורם לעקומת התיצבות ארוכה יותר בבדיקות הראשונות בבוקר.
    בדיקת ההשערה השנייה, אורכת גם כן זמן (שלא לדבר על כסף), ובסופה אף אחד לא מבטיח לנו שנמצא את הסיבה, וייתכן שהחיפוש ימשיך. בחיים מזומנות לנו הפתעות. נתקלתי פעם בתופעה עקשנית, שההסבר שלה בסוף היה... טעות ברישום בניסוי הראשון, שבגללו התחלנו בחקר הסיבות לתופעה שבעצם לא היתה קימת.



מה לעשות? מה הלקח? -  להימנע מפתרונות שמחיבים מדגם. במקום זה להשתמש בכריית נתונים, כדוגמת GT, או פתרון אחר שיודע להתעסק עם נתונים חופשיים - unsupervised data. מומלץ במיוחד  כאשר הנתונים מסובכים או לא ידועים.


איך אפשר לעבוד בלי מדגם? איך אוסף סתמי של נתונים יכול לשמש לחיזוי?!?
ת': data mining רציני מפריד את האוכלוסיה לקבוצות שקורות בהן תופעות שונות. החיזוי שלו מתיחס לכל קבוצה בהתאם למה שקורה בה. לכן, לא חשוב שהמדגם יהיה מיצג, לא חשוב שיחס מספר אירועי כל קבוצה בקלט יהיה כמו החלק היחסי של הקבוצה באוכלוסיה, ממילא ה-DM יחלק את הקלט לקבוצות של 'מדגמים' נפרדים. ב-DM אין לנו שום כוונה לשקלל תוצאות, חס וחלילה. להיפך! כוונתנו היא לחדד ככל האפשר את האבחנה בין התופעות, כדי שאפשר יהיה לשאול: מה ההבדל ביניהן, למה התנהגות מסוימת נצפית בקבוצה אחת ולא באחרת, האם יש מכנה משותף? את זה אי אפשר לקבל, כשהתוצאה היא אחת לכל האוכלוסיה.


אם לחזור לפתיח, לכריית נתונים יש יתרון גדול בשחרור התלות במדגם. ניסוי יחיד, במיוחד אם הוא מגוון, יכול להניב תוצאות מעמיקות, לקצר את משך הניסויים, ולחסוך בהתאם עלויות פיתוח מסחרי (commercial development).

יתרון חשוב אף יותר מחסכון ויעילות, הוא שיפור ביצועי המוצר אחרי שהמוצר יצא לשוק, באופן נמשך על בסיס המשוב מהשטח. למה זה יתרון כל כך גדול? - כי מדובר בנתונים רבים שזורמים אלינו ממילא בלי צורך לשלם לניסויים, והשיפור מתבצע במקביל לעבודה ותוך כדי ייצור הכנסות.
למעשה, אם יש לנו יכולת לנתח נתונים חופשיים (לא דגומים), יש לנו מקור מידע מצוין להפקת לקחים ולחיזוק המוצר ביחס ליעדיו ההתחלתיים, אחרי שהשוק יאמר את דברו.


אדית

users.actcom.co.il

בברכה
אדית
הנהלת האתר ביטלה גישת כתיבה ציבורית.
מנהלים: Edith Ohri
זמן יצירת העמוד: 0.218 שניות

הדף שלנו בפייסבוק

מעניין? שתפו דף זה באמצעות הטלפון הנייד

מאמרים

מגמות של ביג דאטה בעולם הביטוח
CA Technologies
SSIS - Buffer Size Optimization
קטגוריה ראשית
בדיקות BI ו-DWH לעומת הבדיקות בתחומים אחרים
קטגוריה ראשית
איסוף דרישות לפרויקטי BI
קטגוריה ראשית
כח המידע במיקוד
קטגוריה ראשית
0

Microsoft

Oracle

IBM

Informatica

Sap

SAS

Qlikview

Cloudera

Machine Learning