Wednesday, July 4, 2012

בלבול ושקר והקשר למערכת התייחסות ולנקודת מוצא



בעיתון דה-מרקר פורסמה ב-3 ביולי כתבה ובה הובאה פרשנות בנוגע למצב הכלכלי-חברתי בארץ וכן נתונים שכביכול תומכים בעמדת הכותבת ומחזקים אותה. הכתבה עצמה לא היתה מעניינת בשבילי עד שראיתי את האינפוגרפיקה ששולבה כדי להמחיש באופן ציורי את הנתונים המספריים. אני מתעלם מהשאלה לגבי נכונות הנתונים ומתייחס רק לשימוש בהם.

הנה תרשים שהובא בכתבה:
מתוך כתבה של דה-מרקר מה-3 ביולי 2012
תרשים ה"פטישים", שאינו אלא גרף עמודות, מציג מגמה מדאיגה ביותר של צניחה אדירה במה שמכונה שיעור ההשתתפות של בני 15-65 בכח העבודה. את המספרים לקחתי לתוך גיליון אלקטרוני והפקתי גרף עמודות משלי (באותו האופן יכולתי להכין אותו ידנית במחברת) ולפניכם התוצאה:
עד עכשיו זה נראה דומה מאוד. הרווחנו גם קנה מידה בצד. מייד מתעוררת השאלה: "מדוע תחתית התרשים היא 59% ולא 0%?". את זה קל לתקן, משנים את נקודת המוצא להיות 0 ומשרטטים. הנה התוצאה:

וואו! איזה שינוי! איזה הבדל! פתאום הירידה המשמעותית נראית כל כך זניחה שאולי אפילו אין מבחינים שיש ירידה. 

אז איך מסבירים את ההבדלים הללו? התשובה: הכל תלוי בנקודת המוצא! לפי מערכת ההתייחסות שלכם, זאת אומרת, ביחס למה משווים. אם נקודת המוצא היא נקודת הנתונים הראשונה שיש, למשל, 62.8% בשנת 2009 אז עכשיו כל שאר הנתונים בתרשים משורטטים ביחס לגודל הזה. לעומת זאת, אם נקודת המוצא היא ערך 0 מקבלים קנה מידה שונה.

האם היתה כוונה "לטפל" בנתונים? האם מדובר רק בכוונה טובה "לעזור" לקוראים להבחין בשינויים? האם מדובר בבחירה מכוונת כדי ליצור רושם של שינוי משמעותי בשעה שהשיעור זניח? לכותבת הכתבה יש את התשובות. אינני יודע. ברור שאפילו אם אין אנחנו מטילים ספק בנתונים, יש מקום לבדיקה קלה של אופן הצגתם כדי לקבל מבט נוסף. 

מה קרה כאן? עכשיו משורטטים חלקים משלם אחר. 

דוגמה מתחום הביטחון

בישראל היום, במהדורה המודפסת של יום שישי, 25 בנובמבר 2011 (תודות ליוסי לוי שכתב על זה) פירסמו כתבה, עם כותרת מרעישה ותרשים מדאיג ביותר:

שימו לב ששטחו של המלבן של ה-כן גדול בערך פי שלושה משטחו של המלבן של ה-לא אף על פי שהערך קטן יותר. האם טעות? האם מגמתיות? כנראה שטעות... אבל איזו טעות!!

דוגמה מתחום האנרגיה

רוצים דוגמה נוספת? הנה, כאן רשימה של דפנה שיזףאיכשהו יצא שגם שם מטפלים בתרשים שפורסם ב-דה-מרקר. שם מדובר על תחום האנרגיה: נפט.
התרשים בכתבה שמנסה לקשור (באופן מגמתי?!) צריכת חביות נפט עולמית ל-אוכלוסיית העולם:
 אותם הנתונים בתרשים שהופק באמצעות גיליון אלקטרוני מספרים סיפור אחר:
 שינוי בנקודת המוצא ושרטוט מחדש מספר סיפור שונה משני קודמיו, ואנחנו עם אותם הנתונים:
 אין מקום באמת להשוות שני דברים שונים אחד ליד השני כשמודדים אותם באמצעות יחידות מידה שונות ולצפות מהקורא להסיק את הדבר "הנכון" -- לכן מה שראוי לעשות הוא לתת תרשים שונה לכל סוג נתונים, כדי שאפשר יהיה להתרשם מהמגמה במקום מהגדלים שלהם אחד ביחס לאחר. הנה התרשים המוצע, ושוב, מתקבל סיפור שונה:
 למעשה, מקריאת הכתבה, יוצא שכנראה כוונת המחבר היא להתייחס לצריכת חביות הנפט העולמית ביחס לאוכלוסיית העולם. אז מדוע שלא לבנות את המבוקש מתוך הנתונים ולשרטט? הנה, שוב, תמונה שונה:
מהי ההצגה המתאימה? תלוי במערכת ההתייחסות של הכותב ושל הקורא. את אותם הנתונים, כך אנו רואים, אפשר להציג באופנים שונים ולהביא את הקורא להסיק מסקנות שונות מאוד.

כדי לקבל טיפול מסודר עוד יותר ודוגמאות מפורטות יותר, כדאי מאוד לקרוא רשימה של טל גלילי שבה הוא מנתח ומסביר היטב אילו הטיות יש בכתבה ובתרשים שעוסק במחירי הדלק -- הוא גם מסביר כיצד הקוראים המתעניינים להביא את הנתונים להצגה מוטה פחות: כך זינק המס שאנחנו משלמים על הדלק?!

דוגמה מתחום הפוליטיקה

ועוד דוגמה, הפעם מהפוליטיקה, רשימה של דובי קננגיסר. הפעם התרשים לקוח מתוך וואינט.
הנה התרשים שהובא בכתבה. מה מבינים ממנו?
והנה תרשים נוסף שהובא בכתבה כשמתייחסים למועמדת נוספת שאולי תרוץ:
מה הבעיה? הנה מה שכותב דובי קננגיסר:
לערוך סקר זה קל. להכין אינפוגרפיקה, לעומת זאת, זה קשה. כנראה. קשה להסביר אחרת את העובדה שהגרפיקה שמציגה את הסקר השני היא פשוט העתק של חמשת העמודות הראשונות מהסקר הראשון, אבל עם מספרים שונים (ותוספת ליבני לעמודה של לפיד). כך לפיד (15 מנדטים) ממוקם במקום החמישי באותו גובה כמו קדימה (11 מנדטים), ונמוך מישראל ביתנו (13 מנדטים). לא ספרתי פיקסלים, אבל אני מוכן להתערב שגם העמודות של הליכוד ושל העבודה לא זעו מילימטר ביחס לעמודות האחרות, חרף אובדן של שלושה-חמישה אחוזים מערכן. 

כי באמת, בשביל מה צריך לשנות את הגרף כשמשתנים המספרים? זה לא כאילו שכל מטרתה של האינפוגרפיקה היא שלא נצטרך לעיין באופן מדוקדק בנתונים כדי לקבל את התמונה הכללית…


קפיצה קלה לבית הספר היסודי

אחד מהמושגים החשובים שהכרחי לדעתי שתלמידים בבית ספר יסודי ילמדו וילמדו להשתמש בו הוא "נקודת מוצא". נקודת מוצא קובעת מהיכן יוצאים לדרך, היא קובעת ביחס למה מחשבים חישובים. קחו למשל את הבעיה הבאה:

נתון שהיחס בין שני מספרים הוא 4:7. בכמה אחוזים גדול המספר השני מהראשון? בכמה אחוזים קטן המספר הראשון מהשני?


והפתרון: 
נענה בכמה אחוזים גדול המספר השני מהראשון. מילית היחס מ- קובעת שמערכת ההתייחסות שלנו היא המספר הראשון. יחידה אחת של המספר הראשון היא רבע מערכו. משום שההפרש ביחידות בין א' לבין ב' הוא 3 אזי המספר השני גדול מהמספר הראשון ב-3/4 מערכו של המספר הראשון. כדי לקבל את התוצאה באחוזים נכפול את השבר ב-100 ונקבל 75%.

באופן דומה המספר הראשון קטן מהמספר השני ב-3/7 מערכו של המספר השני. כדי לקבל תוצאה באחוזים נכפול ב-100 ונקבל בערך 42.86%. ולכן התשובה: המספר השני גדול מהמספר הראשון ב-75% ואילו המספר הראשון קטן מהמספר השני בכ-43%.

נושא מערכת ההתייחסות אינו מקבל תשומת לב ראויה, לפחות לא בקרב התלמידים שיש לי אפשרות לפגוש. זה נכון אצל תלמידים שנחשבים חלשים ונכון גם כן עבור תלמידים שנחשבים חזקים, מתקדמים, מחוננים וכו'. איכשהו, נדמה שזה נושא שהמורים לא יודעים אותו בעצמם, או שלא יודעים ללמד אותו או שלא מכירים בחשיבותו. כך או כך, הנושא אינו מובא לידיעת התלמידים בכיתה ואם כן, לא באופן שמאפשר להם להבין שזהו אמצעי משמעותי ב"טיפול בנתונים" בתקשורת, בפרסום ובכלל...

הנה, נקח דוגמה אחרת, פשוטה, שיכולה להדגים איך קל לעבוד עלינו (אם איננו מבינים מהי נקודת מוצא וכשאיננו מבינים באיזו מערכת התייחסות להשתמש) כשאנחנו מנסים להבין איזו הלוואה לקחת (למשל, במשכנתא), או מה יקרה לחסכונות הפנסיוניים שלנו כשאנחנו בשיחה עם סוכן ביטוח ממולח [הדוגמאות לקוחות מתוך שיעור שהעברתי לתלמידי כתות ו' בבית הספר היסודי עמל בכפר יונה בשנת הלימודים התשע"א]:


בעיה א':
אסתר ורחל הן שתי אחיות. אסתר קיבלה סכום כסף במתנה. הסכום שהיא קיבלה גדול ב-30 ש"ח מהסכום שרחל קיבלה במתנה. בכמה ש"ח קיבלה רחל פחות מאסתר?
התשובה: 30 ש"ח. כאן אין הפתעות. נמשיך:

בעיה ב':
אסתר קיבלה סכום כסף שגדול ב-30% יותר מהסכום שקיבלה רחל. בכמה אחוזים קיבלה רחל פחות מאסתר?
[דיון] -- תלמידים רבים עונים גם במקרה הזה 30, וטוענים שמדובר באותה הבעיה ובאותו הפתרון.

נבחן את התשובה ונצביע על מהות השגיאה: אם אסתר מקבלת ב-30% יותר מרחל, מערכת ההתייחסות היא רחל. ברגע שנאמר 30% יותר מ... נקבעו שני דברים:

א. אסתר קיבלה ב-30% יותר
ב. שרחל קיבלה 100% כי היא הגודל היסודי שביחס אליו נעשה החישוב של האחוזים

אף שזה לא נאמר במפורש הרי 30% הם ביחס לשלם, במקרה שלנו ביחס לרחל. בבעיות כאלה השלם הוא בתפקיד הגודל היסודי כי הוא מהווה את המסגרת של מערכת ההתייחסות. הנתונים הם:
רחל
אסתר
100%
130%

את זה הסקנו מכך שנאמר שאסתר קיבלה 30% יותר מהסכום שקיבלה רחל. הסכום של רחל משמש כמערכת ההתייחסות.
אז איך פותרים? נמצא כמה הם 100% של רחל מתוך 130% של אסתר (מה היחס בין הסכום שקיבלה רחל לבין זה שקיבלה אסתר):


היחס בין היחלק של רחל לבין זה של אסתר הוא 100:130 ולכן, 100/130 מראה איזה חלק מהווה כספה של רחל מזה של אסתר, ואם נכפיל אותו ב-100 נקבל באחוזים שהם בערך 76.9%. אבל מה שנתבקשנו למצוא הוא בכמה אחוזים רחל קיבלה פחות מאסתר. אז הם היא קיבלה כ-77% מתוך ה-100% של אסתר הרי שהיא קיבלה כ-23% פחות מאשר קיבלה אסתר. וזאת התשובה.

רמז השפה שלנו הוא מילית היחס מ-. מי או מה שלפניו באה המילית הזאת הוא מערכת ההתייחסות שלנו, וביחס אליו נחשב את האחוזים. המשפט הראשון בבעיה מערכת ההתייחסות שלנו היא רחל ("... יותר מהסכום שקיבלה רחל") ובמשפט השני מערכת ההתייחסות שלנו היא אסתר ("... פחות מאסתר"). אם כך, הצגת הנתונים באחוזים במשפט הראשון צריכה להיות כשה-100% הוא הסכום שבידי רחל, והצגת הפתרון לפי המשפט השני מתייחסת ל-130% של אסתר כאל שלם אחד שיש להשוות ביחס אליו שלם אחר (100%) ולהבין מה היחס ביניהם.

בחזרה למקרה הראשון שלנו

ההצגה בתרשים שבכתבה היא כאשר השינוי בגובה (בשטח) העמודות נובע מההבדל היחסי לנתון הראשון, כאילו שהוא השלם ואילו ההצגה כאשר משווים אחוזים לאחוזים כאילו הם מאותו השלם מובאת בתרשים שהפקתי באמצעות הגיליון האלקטרוני. האם ההצגה שלי חפה מבעיות? למעשה, לא. משום שמדובר באחוז מתוך כלל האנשים בגילאים 15-65 שבכח העבודה ומשום שהמספר הזה אינו קבוע משנה לשנה (בדרך כלל גדל, אבל לא בהכרח, הוא עשוי אפילו לרדת. כשהאוכלוסייה גדלה, גם המספר הזה גדל בדרך כלל) אנחנו משווים כאן חלקים מתוך שלמים שונים ולא חלקים של אותו השלם. זה גם משהו לחשוב עליו כשמנסים להסיק מסקנות מתוך הנתונים.

אז מה עושים?

מה שאפשר לעשות בתור קוראים זה להתייחס בספקנות לאופן ההצגה, להפעיל שיקול דעת ואולי אפילו לבדוק בעצמנו. להתייחס להצגה מתוך ידיעותינו במתמטיקה. וכמובן, עצם המודעות שאפשר להציג את אותו המידע באופנים שונים ובכך להטות את דעתנו, גם היא יש בה משהו.