יש לי סימפטיה מיוחדת לפוסט הראשון בבלוג הזה, פוסט שמדבר על ניווט ועל ייצוגים מנטליים של מציאות. גם הפוסט הזה מתחיל עם מטאפורה דומה. הפעם מתוך שיר של המשורר הצ’כי מירוסלב הולוב. השיר, שכותרתו “הרהורים קצרים על מפות” (את הטקסט המלא באנגלית אפשר למצוא כאן, תרגום שלי לעברית יש בסוף הפוסט) מספר על יחידה צבאית הונגרית שמאבדת את דרכה בסופת שלגים בהרי האלפים, הם כמעט מתייאשים, כשלפתע אחד החיילים מוצא בכיסו מפה, החבורה מתארגנת מחדש, ובעזרת המפה מוצאת את הדרך חזרה למחנה. במחנה הם בודקים את המפה ומגלים שזו מפה של הפירנאים ולא של האלפים. לא ברור לי כלל אם השיר מבוסס על סיפור אמיתי או שמדובר באגדה, אבל חוקר הארגונים קארל ווייק, השתמש בשיר הזה כנקודת מוצא סביבה פיתח את תאוריית הsensemaking שלו בהקשר של ארגונים. את הלקח של השיר הוא סיכם כך: when you are lost, any map will do.

האמנם?
ווייק מנמק את חשיבותה של מפה כלשהי בשני מישורים עיקריים. הראשון הוא המישור הפסיכולוגי – מפה נותנת תחושת ודאות מסויימת, נותנת מוטיבציה, תקווה, מטפחת תחושת מסוגלות להתמודדות, ולפיכך מביאה לפעולה. הפעולה, כך לפי ווייק, היא המקור לכל הטוב בארגונים, בעצם היא המהות של הארגון. לא ההתלבטות, לא קבלת ההחלטות, לא תכנון, ולא בדיקה. פעולה. ולכן מפה (או כל מקור חיצוני אחר של סמכות/ידע/מוטיבציה) מובילה לפעולה, שמובילה להתארגנות וארגון משאבים והפניית משאבים, שבסופו של דבר מביא לתוצאות.

המישור השני בו מפה עוזרת הוא יצירת תאום. בתנאי אי וודאות (בעולמנו זה אומר, תמיד, אם כי במידה משתנה), לכל אדם בארגון עשויה להיות תפיסה אחרת בנוגע למצב הארגון או הקבוצה, מטרותיה והאמצעים העומדים לרשותה. תפיסות שונות עשויות להביא לכך שמסרים יובנו לא נכון, שמאמצים יתבזבזו לריק, ושיתפתחו קונפליקטים ומאבקי כח בנוגע ל”מי צודק” ו”מה צריך לעשות”. כל אלה מפריעים, כמובן, לפעולה יעילה של ארגונים וקבוצות. לעומת זאת, מפה, לא משנה של מה, מאפשרת יצירת תאום. היא מספקת ייצוג חיצוני/אובייקטיבי של המציאות, ונותנת “אוצר מילים” לחברי הארגון לדבר על המצב, מכריעה בשאלות של “מי צודק”. על סמך הטיעון הזה וויק (ותאורטיקנים אחרים) מפארים את חשיבותם של ארטיפקטים בחיי הארגון: חפצים, תמונות, ושאר סמלים, שמגלמים בתוכם תפיסות ומודלים מנטליים משותפים המאפשרים לחברי הארגון לתאם את פעולתם ולהימנע מבזבוז משאבים.

אבל למרות שני הטיעונים האלה, האינטואיציה הראשונית שלנו היא שמפה לא נכונה צפויה להוביל אותנו למסקנות לא טובות ולמקומות רעים. שני הטיעונים שלעיל הם בעיקרם טיעונים עקיפים: ההצלחה באה בגלל המוטיבציה או בגלל תיאום המאמצים, אבל האם בכוחם של שני תהליכים עקיפים אלה להתגבר על ה”קשר הישיר” שבין מפה לא נכונה ותוצאות גרועות? האם באמת עדיפה כל מפה שהיא על פני התנהלות ללא מפה בכלל? מה זה אומר על תפקידה של המפה? לאחרונה קראתי מאמר שמנסה לבחון את האפקט הישיר של שימוש במפה לא נכונה (בהשוואה ל”אין מפה” ובהשוואה, שלא תפתיע אף אחד, למפה הנכונה) ומנסה להסביר באיזה תנאים עדיפה, באמת, מפה לא נכונה על פני התקדמות ללא מפה בכלל. לא אסקור את כל המאמר מפאת מורכבותו, אבל אנסה להביא את הרעיונות העיקריים העומדים בבסיס הטיעון שהוא מעלה.

צריך לזכור מה השימוש העיקרי של מפה – לענות על השאלה “איפה אנחנו”. תהליך מציאת המיקום כרוך בהתאמת סימנים המגיעים מהסביבה (כאן רואים הר, שם יש נהר), לסימנים הכתובים על המפה, ומתוך כך להבין היכן מקומנו במפה. המפה מייצגת את המציאות, גם זו שאיננו רואים או חשים, ולכן מציאת מיקומנו על המפה מאפשרת, למשל, לחזות מה יקרה אם נעשה כך וכך (למשל, אם נלך 3 קילומטר צפונה). מסיבה זו, מציאת המיקום על המפה חשובה לקבלת החלטות, קביעת תוכניות אסטרטגיות ועוד. את תהליך מציאת המיקום על המפה אפשר לתאר כתהליך של למידה, במיוחד בתנאים של אי וודאות. לכל סימן מהסביבה יכולות להיות פרשנויות רבות, כלומר, הוא יכול להצביע על מיקומים רבים אפשריים. אט אט, עם הצטברות הסימנים אפשר לשפר את ההערכות בנוגע למיקום, שבתורן מנחות את החושים שלנו לחפש מידע מאשר או מפריך שיעזור לנו לשפר שוב את ההערכה, וחוזר חלילה.

יש קשר מעניין בין תהליכי למידה לבין ביצועים (נניח בארגון, או בכלל בחיים). במסגרת ארגונית, מקבלים פידבקים חיוביים ותגמולים על הצלחה, ופידבקים שליליים על כשלון. תהליכי למידה משתמשים בפידבקים האלה כדי לנסות לגרום לנו לשפר את אותם ביצועים. פידבק חיובי גורם לנו לעשות עוד מאותו דבר, ופידבק שלילי יגרום לנו בד”כ לנסות ולשנות מה שאנחנו עושים. אבל, בתנאי אי וודאות, ישנם הרבה False Positives ו False Negatives. כלומר תוצאות שנראות חיוביות למרות שמה שנעשה הוא רע, ותוצאות שנראות שליליות למרות שהפעולות שנעשו היו טובות.

מבחינת הביצועים אנחנו לא כל כך מצטערים על False positives. מה אכפת לנו לקבל מחמאות או גמול כלשהו על דבר שלא התאמצנו לעשות? מנקודת מבט של למידה, לעומת זאת, False positives הם איומים ונוראיים. הם נותנים לנו פידבקים חיוביים על דברים גרועים, ובכך עשויים לעודד או לקבע תפיסות ופעילויות מזיקות. בעוד מנקודת מבט של ביצועים כמות ה False positives אינה משנה (ובמובנים רבים, לא אכפת לנו, ואולי אפילו רצוי שתגדל, ובפרט שנקבל תגמול טוב), עבור תהליכי למידה חשוב לשמור את רמת הfalse Positives נמוכה ככל האפשר.

איך זה קשור למפות וניווט? בואו נשווה בין ניווט ללא מפה וניווט עם מפה שגויה. ניווט ללא מפה משמעו נקיטת פעילות אקראית, או כזו שאינה מעוגנת בתפיסה ברורה של המציאות. אסטרטגיה של נסיון וטעיה. היא יכולה להוביל לתוצאות טובות ותוצאות רעות, אבל גם אלה וגם אלה, יגיעו בד”כ במקרה. מה שאומר בפרט שאין שום דרך למנוע או להגביל False Positives. לעומת זאת, שימוש במפה שגויה יביא לעתים לתוצאות גרועות (ואפשר לטעון שהעתים האלו מזומנות מאד מפאת השגיאות שבמפה), אבל הוא יקטין את מספר המקרים בהם מקבלים תוצאה חיובית שאינה מוצדקת. המפה השגויה תתגלה מהר מאד כשגויה, תתרחש למידה, והמפה תתחלף במפה אחרת, שגויה קצת פחות. מה שחשוב הוא שהקטנת מספר התוצאות החיוביות הלא מוצדקות קטנה, ולכן קצב הלמידה יגבר. בניגוד להתנהגות אקראית בה יש יותר סיכוי לקבל תוצאה חיובית שאיננה מוצדקת, ואשר בהמשך תוליך אותנו שולל.

וזהו האפקט הישיר של מפות שגויות (ביחס ל”אין מפה”) – שיפור הליך הלמידה. עדיף ללמוד כשיש לך מודל של המציאות, גם אם הוא שגוי, מאשר לא להשתמש במודל בכלל. כמובן, שעדיף להשתמש במודל טוב ככל האפשר, אבל בהיעדר מודל טוב, ובהינתן אי וודאות גדולה שצריך להתגבר עליה, כל מודל שהוא בהחלט עדיף על בלי מודל בכלל. ובהחלט, אם אפשר, עדיף להשתמש בכמה מודלים במקביל (יקטין עוד יותר את כמות ההצלחות הלא מוצדקות). אפשר, כמובן לקחת את זה לכיוונים רבים. למשל, תחשבו על יזמות. לפי העקרון של כל מפה תעבוד, בתנאי אי וודאות גדולים, כל תוכנית עסקית (גם כזו שהיא בעליל לא מתאימה) עדיפה על פני היעדר תוכנית כזו. תחשבו על ממשל. לפי העקרון הנ”ל, אזי בסביבות דינמיות ולא וודאיות, כל אידאולוגיה עדיפה על פני פעולה שאינה מונחה על ידי אידאולוגיה סדורה, וכן הלאה… אני כמובן לא מסכים תמיד עם המסקנות האלה, אבל הן מעוררות מחשבה.

אז בפעם הבאה כשאתם יוצאים לטייל ברחבי הלא נודע, קחו אתכם מפה. לא משנה של מה.

הרהורים קצרים על מפות/ מירוסלב הולוב

אלברט סנט-ג’ורג’י, שידע הרבה על מפות,
לפיהן החיים לוקחים מסלול כזה או אחר
סיפר לנו סיפור מהמלחמה
אשר לוקחת את ההיסטוריה במסלול כזה או אחר

הסמל הצעיר של פלוגה הונגרית קטנה באלפים
שלח יחידת סיור אל שממת הקרח
שלג החל לרדת
מיד, יומיים השלג ירד, והיחידה
לא חזרה. הסמל סבל, הוא שלח
את אנשיו שלו אל מותם

אבל ביום השלישי היחידה חזרה
היכן הם היו? איך הם מצאו את דרכם?
כן, הם אמרו. חשבנו עצמנו
אבודים וחיכינו לסוף. אבל אז אחד מאיתנו
מצא מפה בכיס. נרגענו
בנינו מאהל. שרדנו את סופת השלגים, ועם המפה
גילינו את דרכנו
והנה אנחנו כאן

הסמל שאל את המפה המופלאה
ובחן אותה מקרוב. זו לא היתה מפה של האלפים
אלא של הפירנאים

להתראות עכשיו.



תגובות

  1. נעמי כותב:

    בגדול נשמע לי ממש טוב להשתמש במפה שגויה כדרך טובה יותר מאשר ללא מפה בכלל. ההסתייגות היחידה שלי היא כשהמפה הזמינה הופכת להיות “אלוהים” (והוא הרי תמיד “צודק”, כמו הרבה אידיאולוגיות אחרות) והתוצאה היא שמפסיקים לבדוק, מפסיקים ללמוד, ולא הרווחנו את מה שמפה שגויה יכולה לתת לנו. לצערי יש יותר מדי אידיאולוגיות “אלוהיות” כאלה. בעצם יותר נכון לומר שיש יותר מדי אנשים שמאמצים “אלוהים” כאלה או אחרים, ומפסיקים לבחון אותם מול המציאות.

  2. amit כותב:

    אני לא חושב שמוצדק להאשים את אלוהים בעניין הזה, למרות שזה אולי נוח. התכונה ה”בעייתית” היא זה שלא רוצים ללמוד, לבדוק ולהשתפר. וזה, לצערי, חוצה גבולות של אמונה ומתפלג במידה כמעט שווה על פני אוכלוסיית העולם (אינטואיציה. אין סטטיסטיקה בעניין, אני מניח). אני מכיר לא מעט דתיים שדווקא מאד אוהבים ללמוד, לבדוק, לחשוב. עבור רבים אמונה באל איננה בגדר “מפה” כלל, אלא שייכת לתחומים אחרים של החיים ושל החשיבה.

  3. דנה כותב:

    פוסט מעולה.. 🙂
    אצלי זה מתקשר לתיאוריות מדעיות. בספרו המופלא “The Sleepwalkers” ארתור קסטלר מתאר איך המחקר המדעי פועל בתוך פרדיגמות שאינן בהכרח תואמות את המציאות אך הן מאפשרות מחקר טוב ואיכותי. יש שם כמה דוגמאות מאלפות איך היוונים הקדומים עשו עבודה מחקרית מדהימה תחת הקונספציה שכדור הארץ הוא במרכז העולם…

  4. אורי כותב:

    יפה. אני כמובן ישר מקשר את זה לנושא התיאוריות הכלכליות, ולוויכוח האינסופי – האם מודל גרוע של המציאות עדיף על פני עבודה ללא מודל בכלל. התשובה כמובן תלויה בעד כמה המודל ההוא גרוע, ועד כמה ניתן לבחון את הניבויים שלו וללמוד.

  5. אורן כותב:

    פוסט נפלא. גם השיר וגם הקישור ללמידה. תודה.

    שלוש הערות קטנות (בקשר ללמידה):
    1. למעשה, המקרה הנורא ביותר הוא המתואר בשיר, כחומר שיש מזל והמפה התאימה למסלול מסויים כי אז נחשוב שהמפה מושלמת ועדיפה על תנועה אקראית. המצב הזה הוא מה שנקרא overfitting.
    2. שימוש במפה לא נכונה אכן ממזער את ה-false positive אבל לא מאפשר למידה של המפה המכונה אלא רק גילוי אקראי של המפה הנכונה ו/או הבנה מהירה שהמפה לא נכונה. זו בעצם למידה רק מדוגמאות שליליות.
    3. למידה מתבצעת רק כתוצאה מחזרה על הפעולה. ניסינו להגיע לנ.צ. במפה וכשלנו. ניסינו שוב (אולי לנ.צ. אחר) ושוב כשלנו – מסקנה – המפה לא מדוייקת וצריכה עדכון-> אנחנו משנים את המפה ומתאימים אותה למציאות הקרובה. כלומר שוב – יש כאן תהליך של גילוי (והוא אקראי ותלוי גם בבחירה הקודמת) ולא תהליך של שימוש במפה. כלומר גודל ה-training set מאוד חשוב.

  6. amit כותב:

    תודה על כל התגובות.
    אני בהחלט מתחבר לקישורים בנוגע לפילוסופיה של המדע (והכלכלה, כמקרה פרטי), אם כי בהקשר של מדע עכשווי, הויכוח הוא בדרך כלל לא על מודל גרוע או “בלי מודל כלל”, אלא בין מודלים שונים. די ברור שמפה טובה (עד כדי תופעת הoverfitting אותה הזכיר אורן) עדיפה על מפה לא טובה. בדרך כלל ה”מפות” בהם משתמשים מדענים הן כולן גרועות באותה מידה (עם הבדלים קטנים פה ושם), וההכרעה ביניהן היא מעשית (לפי תועלת הממצאים מהשימוש במודל), ערכית (איזה הנחות סביר/מקובל/ראוי להניח ואיזה פחות) או פשוט לא נדונה בכלל. בהקשר הזה אני חושב שההמלצה להשתמש בו זמנית בכמה מודלים היא ראויה, למרות שלעתים נדירות ראיתי שמשתמשים בה במחקר (במדעי החברה, זה התחום שלי. לא יודע איך זה במקומות אחרים)

    לגבי הערה 3 של אורן – אתה כמובן צודק לגמרי לגבי הצורך בחזרה. במאמר שממנו דליתי חלק מהתובנות הנ”ל הסיטואציה הנידונה היא באמת של משחק חוזר רב משתתפים. וגם, צריך לזכור, שלפעמים פעולה “אחת” היא בעצם חזרות מרובות על תת פעולות בסיסיות. נניח בניווט אחד, מנסים להתאים את השטח למפה הרבה יותר מפעם אחת, כל פעם במקום אחר.

    לגבי הערה 2 – במובן מסויים זו ההערה שמדאיגה אותי מכולן, כי אני מאמין שלומדים טוב יותר מדוגמאות חיוביות מאשר משליליות (עד כדי הfalse positives), ואני מסכים לחלוטין שלפחות הטיעון שהעליתי מצייר תמונה של למידה בעיקר מאי-הצלחה. באותו הקשר של הטיעון אפשר לציין תועלת נוספת של מפה, שאפשר להתווכח אם היא ישירה או לא. המפה, גם אם היא שגויה גורמת לנו להשיג יותר אינפורמציה על הסביבה מאשר “בלי מפה”. שכן אי ההתאמה בין הסביבה למפה גורמת לנו לבדוק יותר לעומק פרטים, לנסות להצליב אינפורמציה כדי להיות בטוחים, לבדוק עוד נקודות כדי לבסס את טענת אי ההתאה וכו’. במובן הזה מפה גרועה עשויה להיות אפילו יותר טובה ממפה מדוייקת. בעבודה עם מפה מדוייקת, אנו רואים פרט או שניים או שלושה שמתיישבים עם המפה, מזהים במהירות את מיקומנו, וממשיכים הלאה. במפה גרועה התהליך מחייב (אם עושים אותו נכון) לדלות יותר אינפורמציה מהסביבה.
    הדבר שונה במקצה מלמידת מחשב במובן שא-פריורית אין לנו training set. כמות הנתונים שתהיה לנו היא פונקציה של הצורך שלנו ושל תוצאות השימוש בנתונים שנאספו עד עכשיו. מפה גרועה תגרום לכך שקבוצת הנתונים שלנו תהיה גדולה יותר מאשר מפה טובה/”בלי מפה”. בלמידה ממוחשבת (לפחות במה שאני מכיר) מתחילים מנתונים ומהם מנסים להסיק מסקנות. במציאות, מתחילים מבעיה וממודל, שמנחים את עצם איסוף הנתונים, מה שכמובן משפיע על הסקת המסקנות שתגיע בהמשך. בעצם אני מניח שיש מדעני מחשב שטיפלו גם בסוגיה הזו (אורן, אם אתה יודע על כאלה, אשמח להפניה מתאימה).

  7. אורן כותב:

    אני צריך לחשוב על הנקודה/שאלה שלך בפסקה האחרונה. נראה לי לומר שיש לנו טריינינג סט אבל שהלמידה היא online (בניגוד ללמידה offline הקלאסית), כלומר שמעדכנים את המודל אחרי כל תצפית ולא מתוך ראיה כוללת של כל התצפיות וכל הטעויות: http://en.wikipedia.org/wiki/Online_machine_learning
    דוגמא יפה ללמידת אונליין דווקא לקוחה מתחום הגאוגרפיה – gradient descend – כלומר עדכן את המודל לכיוון השיפוע הגדול ביותר (הנחה חמדנית – הליכה במורד/מעלה השיפוע הגדול ביותר ביחס לנקודה בה אתה נמצא כרגע תהיה הדרך המהירה ביותר לשיא גובה/עמק לוקאליים): http://en.wikipedia.org/wiki/Gradient_descent

    ועוד הערה קטנה – יצא לי לעשות לא מעט ניווטים ופרקטית, ניווט עם מפה שגויה (או עם זיהוי שגוי של המקום שלך) הוא גרוע יותר מניווט בלי מפה. בד”כ (תלוי במורכבות השטח) אם אין הר איפה שצריך להיות עמק, לא נשיג את התובנה שהמפה שגויה אלא נאנוס את המפה ונניח שהמדידה שלנו לא מדוייקת ולכן לא בדיוק מתאימה למפה, אבל שאנחנו במקום הנכון. זה כמובן יוביל לטעות הולכת וגדלה (עד שנגיע לעמק רחב ידיים במקום לשרשרת הרים ואז כבר אי אפשר יהיה להתעלם מהסתירה.

  8. דוד כותב:

    נראה לי שכל הסיפור עם המפה נופח קצת. ז”א המפה כן השפיעה אבל לא בזכות הניווט איתה אלא בזכות התקווה שהיא נתנה. בגלל שהיתה להם מפה הם בנו מאהל והצליחו לשרוד את סופת השלגים. אחר כך (כנראה) ניתן היה להגיע לבסיס חזרה גם בלי מפה כלל.

  9. amit כותב:

    אורן – תודה על הלינקים, לא הכרתי את התחום הזה של למידה אונליין כלל, אם כי אני חייב לציין שחלק לא מבוטל של אלגוריתמי הלמידה שאני מכיר, הם ממילא “אונליין” במובן שלא משנה כלל באיזה סדר יבואו הדוגמאות, תוצאת הלמידה בסופו של דבר תהיה זהה בכולן. בהערה שלי כיוונתי למשהו אפילו “מהפכני” יותר, במובן שהשאלה מהי הדוגמא הבאה תלויה בתוצאות הלמידה של דוגמאות קודמות. כלומר, יש לך מציאות מסויימת אותה מנסים ללמוד, וממנה ניתן לדגום ולקבל נתונים. סוג הנתונים שתדגום תלוי בנתונים שדגמת עד כה, וכך גם “תנאי הסיום” (כלומר מתי מפסיקים לדגום, ומחליטים שלמדנו מספיק).

    למעשה, אני כן מכיר אלגוריתמים שכאלה בתחום אחר לגמרי: מבחנים פסיכולוגיים. לכל מי שעשה מבחן GMAT זה אמור להיות מוכר. התאוריה נקראת Item response theory, והרעיון הבסיסי הוא שבכל רגע נתון לתוכנה יש הערכה ליכולת שלך (נניח על סקאלה של 200-800), ואם היא מעריכה את היכולת שלך על סמך שאלות קודמות כ600, השאלה הבאה תהיה קשה יותר (אין טעם לשאול שאלות עליהן יכול מישהו עם יכולת 400. אמנם הסיכוי שתענה עליהן נכון יהיה גדול, אך האינפורמציה שתתקבל מכך לא תהיה גדולה).
    כך מתאפשר למפות יכולת של אנשים על הסקאלה הזו באמצעות מספר מועט יחסית של שאלות, ובדיוק רב יחסית, למרות שכל נבחן מקבל אוסף אחר של שאלות.

הוספת תגובה