News Ticker

[สรุปหนังสือ] How to Make the World Add Up : Ten Rules for Thinking Differently About Numbers

 

 

[สรุปหนังสือ] How to Make the World Add Up : Ten Rules for Thinking Differently About Numbers (2020)

by Tim Harford

 

“Without statistic, it’s impossible to tell the truth.”

 

จุดเริ่มต้นของการรณรงค์เลิกสูบบุหรี่ระดับโลกที่ช่วยชีวิตมนุษย์จำนวนมหาศาลจากผลร้ายทางสุขภาพนั้นเกิดขึ้นจากโครงการเก็บข้อมูลทาง “สถิติ” ในระหว่างปี 1948 ถึงปี 1954 ของ Richard Doll และ Austin Bradford Hill แพทย์ชาวอังกฤษสองนายที่สามารถพิสูจน์ให้เห็นได้ว่าผู้ที่สูบบุหรี่เป็นประจำนั้นมีโอกาสในการป่วยเป็นมะเร็งปอดมากกว่าคนอื่นถึง 16 เท่าอย่างมีนัยสำคัญจากการเก็บข้อมูลพฤติกรรมของผู้ป่วยโรคมะเร็งเทียบกับผู้ป่วยประเภทอื่นๆของโรงพยาบาลและการเก็บข้อมูลพฤติกรรมการสืบบุหรี่และอัตราการเสียชีวิตของแพทย์ร่วมวงการอีกกว่า 40,000 รายที่ใช้เวลารวมกันหลายปี… แต่อย่างไรก็ตาม หนึ่งในสาเหตุสำคัญที่ทำให้การสูบบุหรี่นั้นยังคงมีอยู่เป็นวงกว้างอย่างในปัจจุบันนั้นเกิดขึ้นจากการพยายามสร้างความเคลือบแคลงสงสัยในความถูกต้องของกระบวนการทางสถิติของคุณหมอทั้งสองคนโดยกลุ่มบริษัทผู้ผลิตยาสูบที่มีเป้าประสงค์ในการสร้างความสงสัยและความไม่แน่ใจให้ผู้ที่ยังคงสูบบุหรี่อยู่นั้นงงว่าจะเชื่อข้อมูลชุดไหนดีและไม่ตัดสินใจเลิกสูบบุหรี่ไปเสียที

ข้อมูลทางสถิตินั้นคือองค์ประกอบสำคัญในการค้นหา “ความจริง” ที่เกิดขึ้นบนโลกมนุษย์อันกว้างใหญ่ที่เต็มไปด้วยคำถามที่ท้าทายในการหาคำตอบอย่างไม่รู้จบ แต่ข้อมูลทางสถิตินั้นก็สามารถถูกนำมาบิดเบือนและใช้เป็นเครื่องมือในการโกหกด้วยข้อมูลได้อย่างง่ายดาย ซึ่งหลายครั้งก็สามารถสร้างผลอันตรายหรือความขัดแย้งที่ร้ายแรงที่เกิดขึ้นอยู่ในแทบทุกมุมของโลกในยุคปัจจุบัน

How to Make the World Add Up คือ หนังสือของผู้เขียน Tim Harford นักเศรษฐศาสตร์ชื่อดังเจ้าของผลงานเขียนอย่าง The Undercover Economist และ Fifty Things that Made the Modern Economy ที่ว่าด้วย “กฎ 10 ข้อ” ในการทำความเข้าใจข้อมูลทางสถิติอย่างถูกต้องสำหรับผู้อ่านทั่วไปที่ไม่ใช่นักสถิติที่สามารถใช้เป็นเสมือนแว่นขยายในการเสาะหาความเป็นจริงบนโลกใบนี้ที่เต็มไปด้วยข้อมูลอันมหาศาลที่มีทั้งการตีความอย่างถูกต้องและการตีความอย่างผิดๆ ไม่ว่าจะเกิดจากการตั้งใจบิดเบือน ความลำเอียงหรือการขาดความรู้ที่ถูกต้อง ขอเชิญทุกท่านมาสวมหมวก “นักสืบทางสถิติ” และออกค้นหาความเป็นจริงจริงๆด้วยหลักการทางสถิติที่ถูกต้องไปกับสรุปหนังสือเล่มนี้กันได้เลยครับ

 


 

Rule One : Search Your Feelings

เรื่องราวการต้มตุ๋นก้องโลกของวงการศิลปะเกิดขึ้นโดยฝีมือของ Han van Meegeren ผู้ที่สามารถหลอกขายภาพวาดของตัวเองว่าเป็นภาพวาดที่หายสาบสูญไปของศิลปินเอกชาวดัตช์อย่าง Johannes Vermeer ให้แก่ Abraham Bredius นักวิจารณ์ศิลปะชื่อดังที่ได้รับการยอมรับในฐานะผู้เชี่ยวชาญด้านการวิเคราะห์ภาพเขียนของ Johannes Vermeer โดยเฉพาะได้สำเร็จ โดยปัจจัยที่ทำให้ Han van Meegeren สามารถกระทำการหลอกลวงครั้งนี้ได้สำเร็จก็คือการเล่นกับ “ความรู้สึก” ของ Abraham Bredius ด้วยการวาดภาพที่มีเนื้อหาและสไตล์ที่นักวิจารณ์ศิลปะวัยชราคนนี้เชื่อว่า Johannes Vermeer น่าจะเคยได้วาดไว้ในอดีตพร้อมๆกับการเก็บรายละเอียดของงานที่มีแต่ผู้เชี่ยวชาญระดับ Abraham Bredius เท่านั้นที่จะมองออกว่าน่าจะเป็นของศิลปินเอกที่ล้วนแล้วแต่เป็นกับดักที่ออกแบบมาให้ Abraham Bredius ตกลงไปด้วยความอยากที่จะพิสูจน์ว่าสิ่งที่เขาเชื่อมั่นมาตลอดทั้งชีวิตนั้นเป็นความจริง

กฎข้อที่ 1 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การตรวจทานอารมณ์ความรู้สึกของตัวเอง” ที่มีต่อข้อมูลทางสถิติที่อยู่ตรงหน้าอย่างสม่ำเสมอเพื่อป้องกันไม่ให้ความรู้สึกลำเอียงที่มีอยู่ไปกลบความคิดอย่างเป็นเหตุเป็นผลเพียงเพราะว่าตัวของเราอยากเชื่อว่าข้อมูลเหล่านั้นเป็นความจริงหรือความเท็จ

ซึ่งหลักการทางจิตวิทยาที่ใช้เรียกปรากฏการณ์นี้ก็คือ “Motivated Reasoning” หรือ “การให้เหตุผลจากแรงจูงใจ” ที่มนุษย์มักเลือกที่จะมองหาหลักฐานที่สนับสนุนว่าสิ่งที่ตัวเองคิดนั้นถูกต้องและหาข้อแก้ตัวมาตีตกสิ่งที่ตัวเองคิดว่าผิด เหมือนเช่นกรณีการทดลองหนึ่ง ที่นักวิจัยจะให้เงินรางวัลแก่ผู้ทดลองที่สามารถทำนายราคาของข้าวสาลีได้อย่างแม่นยำที่สุดโดยแบ่งผู้ทดลองออกเป็น 2 กลุ่ม ได้แก่ กลุ่มชาวนาที่มีแรงจูงใจให้ราคาข้าวสาลีสูงเพื่อสร้างผลกำไรและกลุ่มพ่อค้าคนกลางที่ต้องการให้ข้าวสาลีราคาถูกเพื่อกินส่วนต่าง ซึ่งผลการทำนายก็แสดงให้เห็นอย่างชัดเจนว่ากลุ่มชาวนาที่จะได้ประโยชน์จากราคาข้าวสาลีสูงนั้นพยากรณ์ราคาข้าวในระดับที่สูงกว่ากลุ่มพ่อค้าคนกลางอย่างมีนัยสำคัญทั้งๆที่คนทั้งสองกลุ่มได้ข้อมูลที่เท่าๆกัน

ความลำเอียงที่ใช้อารมณ์นำเหตุผลของมนุษย์นั้นได้สร้างปัญหาความขัดแย้งมากมายในสังคมยุคปัจจุบันที่ผู้ที่เห็นต่างมักได้ข้อสรุปจากการวิเคราะห์ข้อมูลชุดเดียวกันที่แตกต่างกันเพื่อสนับสนุนแนวคิดของตัวเองและในหลายกรณีก็ได้ทำให้เกิดความเสียหายต่อสังคมในภาพรวมอย่างเต็มๆ อาทิ การที่ประชาชนส่วนหนึ่งในหลายประเทศเชื่อว่าวัคซีนไม่ได้ช่วยป้องกันไวรัส COVID-19 จนทำให้การแพร่ระบาดรุนแรงกว่าความเป็นจริง หรือ ความเชื่อของกลุ่มคนฝ่ายขวาจำนวนมากที่คิดว่าภาวะโลกร้อนนั้นเป็นเรื่องหลอกลวงโดยไม่สนใจข้อมูลทางสถิติของอุณหภูมิและภัยพิบัติทางธรรมชาติที่เพิ่มสูงขึ้นจนทำให้ความร่วมมือในการแก้ไขโลกร้อนทำได้ยาก

ดังนั้น ก่อนที่จะเริ่มลงรายละเอียดเชิงเทคนิคของหลักการทางสถิติ จงถามตัวเองก่อนเสมอว่า “เรารู้สึกต่อข้อมูลที่อยู่ตรงหน้าอย่างไร” และหยุดคิดเพื่อทำความเข้าใจผ่านหลักการเหตุผลโดยไม่หลงกลไปกับการใช้อารมณ์ความรู้สึกที่เข้าข้างความคิดของตัวเองและทำหน้าที่เป็นกระบอกเสียงของความมีเหตุมีผลให้กับสังคมในวงกว้างเท่าที่กำลังของแต่ละคนจะพอทำได้

 

Rule Two : Ponder Your Personal Experience

Daniel Kahneman ผู้เชี่ยวชาญด้านเศรษฐศาสตร์เชิงพฤติกรรมเจ้าของผลงานเขียนชื่อก้องโลกอย่าง Thinking Fast and Slow ได้อธิบายถึงจุดอ่อนข้อหนึ่งของกระบวนการคิดของมนุษย์ไว้ว่า “เมื่อมนุษย์ต้องเผชิญกับคำถามที่ยาก พวกเรามักเลือกที่จะหาคำตอบที่ง่ายที่เด้งขึ้นมาในหัวแทนที่การหาคำตอบที่ถูกต้องตามหลักการเหตุผล”

กฎข้อที่ 2 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การคำนึงถึงประสบการณ์ที่พบเจอเคียงคู่กับการพิจารณาข้อมูลทางสถิติ” เพื่อนำเอาความเข้าใจในรายละเอียดที่เปรียบเสมือนมุมมองของหนอนที่มักเห็นแต่สิ่งที่อยู่ตรงหน้าซึ่งเป็นเพียงเสี้ยวเดียวของความจริงทั้งหมดมาผสานกับการมองข้อมูลเชิงสถิติที่มักเป็นข้อมูลที่เก็บรวบรวมความจริงที่ครบสมบูรณ์มากกว่า เพื่อป้องกันความลำเอียงทางสถิติที่เรียกว่า “Naïve Realism” หรือ “การเข้าใจความจริงแบบไร้เดียงสา” ที่มนุษย์มักคิดว่าประสบการณ์ที่ตัวเองพบเจอหรือฟังมาจากข่าวและ social media ว่าเป็นความจริง เหมือนกับที่พวกเรามักตกใจว่ามีคนจำนวนมากที่มีความคิดเห็นทางการเมืองแตกต่างจากเราหรือการที่พวกเราคิดว่าผู้เสียชีวิตจากเครื่องบินตกหรือฉลามกัดที่มักออกข่าวมีจำนวนมากกว่าความเป็นจริง

ในขณะเดียวกัน การเชื่อแต่ข้อมูลทางสถิติโดยไม่เข้าใจในสถานการณ์จริงที่อยู่ตรงหน้านั้นก็นำไปสู่การใช้ข้อมูลแบบผิดวัตถุประสงค์ อาทิ กรณีของสงครามเวียดนามที่นายพลกองทหารอเมริกันเลือกตรวจวัดความสำเร็จของกองทหารด้วยการรายงานจำนวนศพของทหารฝ่ายตรงข้ามที่เชื่อว่ามีผลต่อชัยชนะในสงครามซึ่งนำไปสู่การกระทำที่ไม่ส่งผลดีใดๆ เช่น การที่กองทหารใช้เวลาส่วนใหญ่ไปกับการนับศพศัตรูให้ครบถ้วนแทนการเอาเวลาไปสู้รบ

 

Rule Three : Avoid Premature Enumeration

“เกมที่ใช้ความรุนแรงทำให้เด็กที่เล่นเกมใช้ความรุนแรงเพิ่มขึ้น” พาดหัวข่าวในลักษณะนี้นั้นเกิดขึ้นอยู่ตลอดเวลาและผู้ที่อ่านส่วนใหญ่ก็มักจะรับรู้ข่าวสารเหล่านั้นด้วยการตีความแบบเร็วๆของตัวเองโดยไม่หวนมานั่งทำความเข้าใจอย่างแท้จริงว่าข้อสรุปทางสถิติดังกล่าวนั้นมีรายละเอียดแท้จริงเป็นอย่างไร เหมือนพาดหัวข่าวข้างบนที่สามารถตั้งคำถามได้มากมาย อาทิ คำจำกัดความว่าเกมที่ใช้ความรุนแรงนั้นคืออะไร เกมอย่าง Pokemon ที่จับสัตว์น่ารักๆมาสู้กันนั้นคือเกมที่ใช้ความรุนแรงหรือไม่ คำว่าเด็กที่ว่าคือตั้งแต่เด็กวัย 3 ขวบหรือวัยรุ่นแล้ว หรือ ความรุนแรงที่เด็กกระทำนั้นคืออะไร

กฎข้อที่ 3 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การหลีกเลี่ยงการตั้งสมมุติฐานต่อข้อมูลโดยไม่ได้ทำความเข้าใจจริงๆ” ที่พวกเราทุกคนต้องหยุดคิดและตั้งคำถามกับตัวเองก่อนเสมอว่าข้อมูลที่เห็นนั้นแท้จริงแล้วคืออะไรและตัววัดที่ข้อมูลเหล่านั้นอ้างอิงนั้นวัดอะไรและไม่ได้วัดอะไรบ้าง นักสืบทางสถิติที่ดีต้องหัดตั้งคำถามที่ถูกต้องเพื่อให้ได้ข้อมูลเชิงลึก (insight) ที่ถูกต้องจริงๆ ส่วนนักสถิติเองก็ต้องระมัดระวังความลำเอียงที่ชื่อว่า “Curse of Knowledge” หรือ “คำสาปของการมีความรู้” ที่ผู้เชี่ยวชาญที่เข้าใจรายละเอียดของข้อมูลมักสื่อสารโดยไม่ได้คำนึงว่าผู้รับสารนั้นจะเข้าใจข้อมูลได้ตรงกันอย่างสมบูรณ์หรือไม่

 

Rule Four : Step Back and Enjoy the View

นโยบายการลงทุนสร้างกำแพงกั้นระหว่างชายแดนสหรัฐอเมริกากับแม็กซิโกเพื่อป้องกันการลักลอบหลบหนีเข้าเมืองอย่างผิดกฎหมายมูลค่ากว่า 25,000 ล้านดอลลาร์สหรัฐหรือเกือบๆล้านล้านบาทของ Donald Trump สมัยยังเป็นประธานธิบดีสหรัฐอยู่นั้นฟังดูเหมือนเป็นการลงทุนระดับอภิมหาศาล… ว่าแต่ ตัวเลขนั้นใหญ่มากจริงๆหรือเปล่า??… ถ้าเทียบกับงบของกองทัพสหรัฐกว่า 700,000 ล้านดอลลาร์ งบสร้างกำแพงนั้นก็เป็นเพียงแค่ 3.5% หรือ เมื่อเทียบกับงบประมาณทั้งหมดของรัฐบาลสหรัฐก็จะเหลือแค่ 0.2% เท่านั้น หรือ เมื่อเอางบการสร้างกำแพงมาหารด้วยจำนวนประชากรทั้งประเทศของสหรัฐจะเหลือเพียงแค่คนละ 75 ดอลลาร์เท่านั้น… การมีข้อมูลเปรียบเทียบเหล่านี้สามารถช่วยตอบคำถามที่ว่างบประมาณการสร้างกำแพงนั้นเยอะหรือน้อยได้ดีมากยิ่งขึ้น

กฎข้อที่ 4 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การถอยหลังมามองภาพใหญ่” ของข้อมูลที่อยู่ตรงหน้าไมว่าจะเป็น

  • การดู “เทรนด์การเปลี่ยนแปลง” ของข้อมูลเหล่านั้นในอดีตว่าข้อมูลในปัจจุบันนั้นมีการเติบโตหรือถดถอยมากเพียงใดเมื่อเทียบกับในอดีต แทนการสมมุติเอาเองว่าตัวเลขที่เห็นอยู่นั้นดีหรือไม่ดี
  • การ “เปรียบเทียบ” ข้อมูลเหล่านั้นกับข้อมูลอ้างอิงอื่นๆที่สามารถอธิบายถึง “ขนาด” ว่าข้อมูลนั้นใหญ่หรือเล็กหรือดีหรือแย่ขนาดไหน ซึ่งผู้เขียนก็ได้แนะนำให้นักสืบทางสถิติจดจำข้อมูลที่ช่วยให้เราสามารถหยิบมาเปรียบเทียบกับข้อมูลทางสถิติที่อยู่ตรงหน้าได้อย่างรวดเร็ว อาทิ ประชากรโลกมี 9 พันล้านคน ประช่ากรไทยมีประมาณ 72 ล้านคน ระยะทางรอบโลกยาวประมาณ 40,000 กิโลเมตร ระยะทางระหว่างกรุงเทพกับเชียงใหม่ยาวประมาณ 700 กิโลเมตร ตึก King Power Mahanakhon ที่สูงที่สุดในประเทศไทยสูง 320 เมตรและ GDP ของประเทศไทยล่าสุดมูลค่า 17.4 ล้านล้านบาทหรือประมาณ 240,000 บาทต่อคนไทยหนึ่งคน

 

Rule Five : Get the Back Story

เรื่องราวการระดมทุนของหนุ่มอเมริกันนามว่า Zack Brown ในเว็บไซด์ crowdfunding ชื่อดังอย่าง Kickstarter ได้สร้างความฮือฮาไปทั่วโลกเมื่อเขาสามารถระดมทุนได้เงินมากกว่า 55,000 ดอลลาร์สหรัฐในการทำสลัดมันฝรั่งโดยที่เขาตั้งเป้าไว้เพียงแค่ 10 ดอลลาร์เท่านั้น… เรื่องราวความสำเร็จของผู้ระดมทุนใน Kickstarter นั้นมีอยู่อีกมากมาย อาทิ Coolest Cooler ถังเก็บความเย็นอเนกประสงค์ที่ระดมเงินได้กว่า 13 ล้านดอลลาร์ หรือ บอร์ดเกมแมวระเบิด Exploding Kittens ที่ระดมเงินได้กว่า 9 ล้านดอลลาร์… แต่เรื่องราวความสำเร็จที่ชวนฝันและโด่งดังเหล่านั้นก็ไม่ใช่เรื่องราวทั้งหมดของผู้ระดมทุนใน Kickstarter ที่มีจำนวนที่มากกว่ามากๆที่ไม่ได้แม้แต่เงินเพียงดอลลาร์เดียว

กฎข้อที่ 5 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การทำความเข้าใจเรื่องราวทั้งหมด” ของข้อมูลทางสถิติโดยไม่ปักใจเชื่อในทันทีถึงแม้ว่าข้อมูลเหล่านั้นจะมีความน่าเชื่อถือขนาดไหน ทั้งนี้ก็เป็นเพราะว่าข้อมูลทางสถิติส่วนใหญ่ที่เข้ามาถึงสายตาพวกเรานั้นมักเป็นข้อมูลที่มีความน่าสนใจที่ได้รับการคัดเลือกมาแล้ว ในขณะที่ข้อมูลที่ดูน่าเบื่อหรือตรงตามสามัญสำนึกมักไม่ได้รับการเปิดเผยซึ่งก็เป็นไปตามธรรมชาติของมนุษย์ที่มักจะให้ความสนใจกับสิ่งที่น่าตื่นเต้นเป็นหลัก

ความลำเอียงที่มักก่อให้เกิดปัญหานี้มีชื่อว่า “Survivorship Bias” หรือ “ความลำเอียงจากการอยู่รอด” ที่ผู้สังเกตข้อมูลมักจะมองเห็นเฉพาะข้อมูลที่ได้รับการคัดเลือกมาแล้วโดยไม่เห็นข้อมูลที่ถูกคัดออกไปก่อนหน้าจนทำให้ข้อมูลมีความลำเอียงและไม่สามารถเป็นตัวแทนของภาพรวมทั้งหมดได้ กรณีศึกษาที่ดังมากๆของความลำเอียงข้อนี้คือการเก็บสถิติรอยกระสุนปืนของเครื่องบินรบในสงครามโลกครั้งที่ 2 ที่สามารถรอดกลับมาจากการทำภารกิจได้ซึ่งรอยกระสุนที่เก็บได้ก็มี pattern ที่ชัดเจนมากๆตามรูปด้านล่าง ผู้ที่วิเคราะห์รูปแบบของรอยกระสุนปืนจากข้อมูลที่มีอยู่เท่านั้นมักคิดเพียงแต่ว่าจะสร้างความแข็งแรงให้กับจุดที่โดนยิงบ่อยๆอย่างไร… แต่ถ้าคิดให้ดีๆแล้ว การยิงเครื่องบินระหว่างการรบนั้นน่าจะมีรอยกระสุนแบบสุ่มมากกว่าการมีรอยกระสุนเป็นกลุ่มๆแบบที่เก็บข้อมูลได้ ดังนั้น รอยกระสุนที่ไม่ปรากฎในภาพจึงน่าจะเป็นจุดที่หากเครื่องบินโดนยิงไปแล้วคงไม่สามารถบินกลับมายังฐานทัพได้เสียมากกว่า ข้อมูลรอยกระสุนนี้จึงมีความลำเอียงที่วัดเฉพาะเครื่องบินที่รอดมาได้เท่านั้นและวิศวกรควรใช้เวลาไปกับการหาแนวทางป้องกันจุดที่หากโดนยิงแล้วจะทำให้เครื่องบินตกหรือระเบิดจะดีกว่า

 

พล็อตแสดงรอยกระสุนของเครื่องบินในสงครามโลกครั้งที่ 2 โดยนักสถิติ Abraham Wald (source: Wikipedia)

 

นอกจากนั้น หลักการทางสถิติที่สำคัญอีกข้อก็คือการเข้าใจ “ความแปรปรวน” ที่มักเกิดขึ้นอยู่เสมอตามหลักการความน่าจะเป็น ยกตัวอย่างเช่น การโยนเหรียญหัวก้อย 10 ครั้ง โอกาสที่จะออกหัวทั้งหมด 10 ครั้งติดกันนั้นมีเพียง 1 ใน 2 ยกกำลัง 10 หรือ 1/1024 เท่านั้น แต่หากมีนักทดลองทั้งหมด 1024 คน การมีนักทดลองหนึ่งคนที่โยนเหรียญแล้วได้หัว 10 ครั้งนั้นถือเป็นเรื่องปกติ… เหตุการณ์แปลกๆที่เหนือความคาดหมายหรือสามัญสำนึกนั้นถึงแม้จะมีโอกาสเกิดที่น้อยมากแต่ก็สามารถเกิดขึ้นได้ ดังนั้น การดูข้อมูลทางสถิติอย่างถูกต้องจึงต้องพยายามดูเรื่องราวทั้งหมดที่เกิดขึ้นว่าข้อมูลที่ว่านั้นมีหลักฐานอ้างอิงมากน้อยขนาดไหนและกรรมวิธีการเก็บข้อมูลทางสถิตินั้นมีความน่าเชื่อถือมากน้อยแค่ไหน

 

Rule Six : Ask Who is Missing

หนึ่งในความล้มเหลวครั้งใหญ่ของกระบวนการทางสถิติเกิดขึ้นในปี 1936 ระหว่างการเลือกตั้งของประเทศสหรัฐอเมริกาของประธานาธิบดี Frankiln Delano Roosevelt แห่งพรรค Democrat กับผู้ท้าชิง Alfred Landon แห่งพรรค Republican ที่ Literary Digest บริษัทแมกกาซีนชื่อดังในสมัยนั้นได้จัดทำโพลวัดผลการเลือกตั้งผ่านการส่งจดหมายไปยังบ้านของชาวอเมริกันกว่า 10 ล้านคนที่ได้จำนวนผู้ตอบผลโพลมากถึง 2.4 ล้านคนที่ได้ข้อสรุปว่า Alfred Landon จะชนะ Frankiln Delano Roosevelt อย่างขาดลอยด้วยคะแนน 55% ต่อ 41%… แต่ผลการเลือกตั้งที่แท้จริงนั้นกลับตรงกันข้ามเมื่อ Frankiln Delano Roosevelt สามารถเอาชนะไปได้ด้วยคะแนนถึง 61% ต่อ 37% !!

องค์ประกอบที่นำมาสู่ความผิดพลาดในการทำสถิติการเลือกตั้งของ Literary Digest นั้นก็คือ “Sampling Bias” หรือ “ความลำเอียงในการเก็บข้อมูล” ที่ Literary Digest นั้นไม่ได้เก็บข้อมูลที่เป็นตัวแทนของประชากรของชาวอเมริกันอย่างแท้จริงแต่ดันไปเก็บข้อมูลจากการส่งจดหมายไปยังบ้านของผู้ที่มีรายได้ค่อนข้างดีที่มักเลือกพรรค Republican มากกว่า Democrat เพียงเท่านั้น… ซึ่งความลำเอียงในลักษณะนี้ก็สามารถพบเห็นได้ในยุคปัจจุบัน ตั้งแต่การทำโพลเลือกตั้งสหรัฐอเมริกาในปี 2016 ที่ผลโพลชี้ว่า Hillary Clinton จะเอาชนะ Donald Trump ได้แต่แท้จริงแล้วก็มี sampling bias ที่ว่าชาวอเมริกันแบบอนุรักษ์นิยมจำนวนมากเลือกที่จะไม่ตอบคำถามผู้ทำเซอร์เวย์มากกว่าฝ่ายเสรีนิยม ไปจนถึง การทำโพลใน social media ที่เข้าถึงแค่กลุ่มคนบางกลุ่มเท่านั้น

กฎข้อที่ 6 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การตั้งคำถามว่ากลุ่มตัวอย่างของการเก็บข้อมูลทางสถิตินี้มีใครบ้างและไม่มีใครบ้าง” เพื่อพิจารณาว่ากลุ่มตัวอย่างนั้นสามารถเป็นตัวแทนของประชากรทั้งหมดหรือแค่สำหรับกลุ่มประชากรจำเพาะเจาะจงบางส่วนเพียงเท่านั้น ซึ่งในยุคสมัยปัจจุบันนี้ ความลำเอียงในการเก็บข้อมูลนั้นก็มีผลเสียตามมามากมายที่ทำให้การนำเอาข้อมูลที่เก็บมาไปใช้นั้นได้ประโยชน์ไม่เต็มที่ อาทิ การพัฒนาโปรแกรมตรวจจับใบหน้าของ Google ที่ใช้ใบหน้าของคนผิวขาวในการสอน A.I. มากกว่าคนผิวสีอื่นๆจนทำให้ผลลัพธ์ออกมาบิดเบี้ยวจนจับใบหน้าชาวผิวดำเป็นลิงกอริลล่า หรือ การพัฒนาระบบถ่ายภาพตอนขยิบตาโดยอัตโนมัติของ Nikon ที่ทำงานผิดพลาดบ่อยเมื่อมีชาวเอเชียตาตี่อยู่ในเฟรมด้วยเหตุผลคล้ายๆกัน

 

Rule Seven : Demand Transparency When the Computer Says ‘No’

เรื่องราวความก้าวหน้าทางสถิติจากการใช้งาน big data อันน่าตื่นเต้นได้ถูกเปิดเผยในปี 2009 เมื่อ Google ได้เปิดตัว Google Flu Trends ซึ่งเป็นเครื่องมือที่ขับเคลื่อนโดย A.I. ที่ประมวลผลข้อมูลการ search ใน Google ของชาวอเมริกันจำนวนมากในช่วง 5 ปีก่อนหน้าเทียบกับการแพร่ระบาดในพื้นที่ต่างๆที่สามารถใช้ทำนายการแพร่กระจายของไข้หวัดล่วงหน้าได้อย่างแม่นยำจนองค์การควบคุมโรคของสหรัฐนำเอาไปใช้… จนกระทั่ง พวกเขาค้นพบว่า Google Flu Trends นั้นทำนายโรคได้ไม่แม่นยำเลยในช่วงฤดูร้อนที่นำไปสู่การทำการศึกษากระบวนการตัดสินใจอย่างละเอียดจนค้นพบว่าแท้จริงแล้ว Google Flu Trends นั้นทำหน้าที่เพียงแค่พยากรณ์อากาศหนาวที่มักเป็นช่วงเวลาที่ไข้หวัดมักระบาดจากคำ search ที่มักเพิ่มขึ้นในช่วงฤดูหนาว โดยไม่ได้พยากรณ์จากคำ search ที่เกี่ยวข้องกับต้นตอของการระบาดที่แท้จริงทั้งหมดจนทำให้ความน่าเชื่อถือลดลงเรื่อยๆและถูกเลิกใช้ไปในที่สุด

ปัญหาโลกแตกที่ว่าข้อมูลทางสถิติส่วนใหญ่นั้นสามารถทำได้เพียงการมองหาความเกี่ยวพันธ์ (correlation) ของข้อมูลชุดต่างๆโดยไม่สามารถอธิบายถึงสาเหตุการเกิดขึ้น (causation) ว่าข้อมูล A นั้นส่งผลให้เกิดข้อมูล B นั้นถือเป็นปัญหาใหญ่ของโลกที่นับวันจะยิ่งพึ่งพิง A.I. ในการประมวลผลมากยิ่งขึ้นเรื่อยๆ… ตัวอย่างของความแตกต่างระหว่าง correlation กับ causation ก็คืออัตราการถูกฉลามกัดนั้นมี correlation โดยตรงกับยอดขายไอศกรีม แต่การที่คนทานไอศกรีมเยอะๆนั้นไม่ได้ทำให้คนถูกฉลามกัดมากขึ้น ทั้งสองปัจจัยนั้นเป็นเพียงแค่ผลที่มี causation เดียวกันที่เกิดขึ้นจากสภาพอากาศที่ยิ่งร้อนคนก็จะยิ่งซื้อไอศกรีมและลงไปว่ายน้ำจนถูกฉลามกัดมากขึ้น… ดังนั้น การทำความเข้าใจวิธีการตัดสินใจของ A.I. และชุดข้อมูลที่ใช้ในการประมวลผลจึงเป็นเรื่องที่สำคัญมากเพื่อป้องกันไม่ให้ระบบประมวลผลใช้ข้อมูลที่เป็นเพียง correlation มาอ้างว่าเป็น causation เช่น กรณี algorithm ของ Amazon ที่ใช้คัดกรองใบสมัครงานโดยอิงจากผลงานของพนักงานปัจจุบันที่มีผู้ชายมากกว่าผู้หญิงจนทำให้ระบบปัดตกใบสมัครงานของผู้หญิงหลายคนอย่างไม่เป็นธรรม

กฎข้อที่ 7 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การเรียกร้องความโปร่งใสจากระบบประมวลผลทางคอมพิวเตอร์” ที่เจ้าของระบบต้องมีความรับผิดชอบในการเปิดเผยข้อมูลดิบและกลไกการประมวลผมที่ผู้อื่นสามารถเข้ามาทำความเข้าใจและพิสูจน์ความถูกต้องได้ โดยแน่นอนว่าหลักการข้อนี้นั้นเป็นหลักการเชิงนโยบายที่รัฐบาลทุกประเทศควรต้องคำนึงถึง ส่วนเจ้าของระบบประมวลผลเองก็ควรที่จะคิดถึงประโยชน์ของการเปิดเผยข้อมูลอย่างโปร่งใสที่สามารถเสริมความน่าเชื่อถือและยังมีโอกาสในการถูกนำไปพัฒนาต่อให้เกิดประโยชน์ได้อีกทอดหนึ่งได้เช่นกัน… ในขณะเดียวกัน การเกรงกลัวต่อ A.I. มากเกินเหตุและเลือกใช้การตัดสินใจของมนุษย์เพียงอย่างเดียวนั้นก็ช่างเสียโอกาสและเต็มไปด้วยความลำเอียงมากมายของมนุษย์เช่นกัน ดังนั้น แนวทางที่ดีที่สุดก็คงเป็นการทำงานร่วมกันระหว่างมนุษย์กับ A.I. ที่โปร่งใสและสามารถอธิบายกลไกการตัดสินใจของมันได้เพื่อให้มนุษย์นำมาต่อยอดการตัดสินใจอย่างมีข้อมูลมากที่สุด

 

Rule Eight : Don’t Take Statistical Bedrock for Granted

ผู้เขียน Tim Harford เลือกที่จะหยิบเรื่องราวขององค์กรทางสถิติระดับชาติและระดับโลกขึ้นมาเป็นตัวอย่างเพื่อตอกย้ำถึงความสำคัญของความร่วมมือกันระหว่างนักสถิติที่มีอุดมการณ์สูงในการทำการเก็บข้อมูลทางสถิติอันเป็นประโยชน์อย่างถูกต้องและอยู่นอกเหนืออิทธิพลการควบคุมของรัฐและยังกล่าวถึงความอ่อนแอของข้อมูลทางสถิติที่สามารถถูกป้ายสีได้อย่างง่ายดาย อาทิ Donald Trump ที่กล่าวอ้างว่าข้อมูลการว่างงานของอเมริกันในสมัย Barack Obama นั้นต่ำกว่าความเป็นจริงอย่างมากเพื่อใช้ระดมพลกลุ่มประชาชนที่เห็นด้วยกับเขา แต่พอ Donald Trump เข้ารับตำแหน่งไปซักพักกลับบอกว่าการเก็บข้อมูลนั้นถูกต้องแล้วและตัวเลขการวางงานในระดับต่ำนั้นเกิดขึ้นจากฝีมือของเขา ทั้งๆที่รูปแบบการเก็บข้อมูลนั้นเหมือนกันเป้ะ

กฎข้อที่ 8 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การไม่ละเลยข้อมูลทางสถิติที่ได้รับความน่าเชื่อถือ” จากองค์กรที่ได้รับการยอมรับระดับโลกว่าข้อมูลและวิธีการที่พวกเขาใช้ในการเก็บสถิตินั้นถูกต้องและแม่นยำ ในขณะเดียวกัน นักสืบทางสถิติเองก็ต้องพยายามพิเคราะห์ความน่าเชื่อถือขององค์กรทางสถิติในประเทศที่รัฐบาลมีอำนาจในการแทรกแซงสูงโดยไม่หลงเชื่อข้อมูลที่เป็นข่าวปลอมที่รัฐบาลวางเอาไว้เพื่อการหลอกลวงโดยเฉพาะ

 

Rule Nine : Remember that Misinformation Can be Beautiful Too

หนึ่งในการใช้งานเครื่องมือทางสถิติที่ทรงพลังและช่วยชีวิตผู้คนมาได้มากที่สุดครั้งหนึ่งในประวัติศาสตร์เกิดขึ้นหลังจากที่ Florence Nightingale พยาบาลหญิงชาวอังกฤษผู้เป็นดั่งฮีโร่ของวงการสาธารณสุขค้นพบวิธีการลดอัตราการเสียชีวิตของนายทหารในโรงพยาบาลชั่วคราวในสมรภูมิสงคราม Crimea ระหว่างปี 1854 ถึง 1856 ซึ่งก็คือการทำความสะอาดโรงพยาบาลให้มีสุขอนามัยที่ดียิ่งขึ้น อาทิ การทำความสะอาดเครื่องมือและการกำจัดสัตว์ที่นำพาเชื้อโรค ซึ่ง Florence Nightingale ต้องการนำเสนอผลการค้นพบนี้เพื่อปรับปรุงสุขอนามัยของโรงพยาบาลอย่างเป็นวงกว้างแต่ก็ได้รับแรงเสียดทานมากมายจากวงการแพทย์ที่ไม่ต้องการการเปลี่ยนแปลงและเชื่อมั่นว่าวิธีการที่พวกเขาทำอยู่นั้นดีแล้ว จนท้ายที่สุด Florence Nightingale และนักสถิติในสังกัดของเธอจึงตัดสินใจเผยแพร่ข้อมูลเป็นกราฟดอกกุหลาบ (ดูด้านล่าง) ที่ทำให้ทุกคนได้เห็นการเปลี่ยนแปลงไปในทางที่ดีขึ้นอย่างรวดเร็วจนไม่มีใครปฏิเสธได้… Florence Nightingale ยังเคยพูดติดตลกว่าการนำเสนอข้อมูลทางสถิติเป็นรูปภาพที่เข้าใจง่ายนั้นช่วยเพิ่มโอกาสให้ Queen Victoria ผู้เป็นราชินีในสมัยนั้นอ่านข้อมูลของเธอ

 

ชาร์ตแสดงอัตราการเสียชีวิตที่ลดลงโดย Florence Nightingale (source: Wikipedia)

 

การแปลงข้อมูลทางสถิติเป็นรูปภาพ (data visualization) นั้นถือเป็นเครื่องมือที่ทรงพลังมากที่สามารถดึงดูดสายตาและเพิ่มโอกาสให้แก่นของข้อมูลที่ต้องการนำเสนอนั้นได้รับการส่งต่อไปยังผู้อ่านได้มากที่สุด แต่การทำ data visualization นั้นก็อาจตกเป็นเครื่องมือที่ช่วยสร้างอารมณ์ร่วมในการปล่อยข้อมูลที่ผิดๆได้เช่นเดียวกัน

กฎข้อที่ 9 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การระวังว่าข้อมูลในรูปแบบที่สวยงามนั้นไม่จำเป็นต้องเป็นข้อมูลที่ถูกต้องเสมอไป” และจงใช้กฎข้อที่ผ่านมาในการตรวจสอบข้อมูลเหล่านั้นอย่างระมัดระวังโดยไม่ปล่อยให้อารมณ์ความรู้สึกที่ถูกเร่งด้วยรูปภาพที่เข้าใจได้ง่ายกว่าแค่การดูตัวเลขแบบดิบๆเป็นตัวกระตุ้นจนไม่สนใจหลักการทางสถิติที่ถูกต้อง

 

Rule Ten : Keep an Open Mind

การแข่งขันสุดยอดนักพยากรณ์ชื่อ The Good Judgment Project ที่จัดขึ้นโดยศาสตราจารย์ Philip Tetlock และรัฐบาลสหรัฐอเมริกาเพื่อเฟ้นหาสุดยอดนักพยากรณ์เหตุการณ์สำคัญต่างๆของโลกที่มีผู้เข้าร่วมแข่งขันกว่า 20,000 คนทั้งในรูปแบบเดี่ยวและในรูปแบบทีมไม่ว่าจะเป็นมือสมัครเล่นหรือผู้เชี่ยวชาญ นั้นได้ค้นพบปัจจัยสำคัญ 4 ประการที่ทำให้คนกลุ่มหนึ่งที่ Philip Tetlock เรียกว่าเป็น “Superforecaster” มีความสามารถในการพยากรณ์ได้อย่างแม่นยำมากกว่าคนอื่น อันได้แก่

  • ความเข้าใจหลักการพื้นฐานทางสถิติอย่าง “base rate” หรือ “ค่าฐาน” ที่ทำให้นักพยากรณ์เลือกมองมุมมองภาพใหญ่ข้างนอก (outside view) ไม่ใช่แค่เหตุการณ์ใดเหตุการณ์หนึ่ง อาทิ การพยากรณ์ว่าจะเกิดสงครามระหว่างประเทศ A กับ B หรือไม่ ควรต้องดูการว่าอัตราการเกิดสงครามระหว่างประเทศที่มีความขัดแย้งประมาณนี้ในยุคสมัยนี้นั้นเป็นเท่าไหร่ก่อนที่จะวิเคราะห์เหตุการณ์นั้นๆโดยเฉพาะ
  • การจดบันทึกการพยากรณ์ในอดีตทุกครั้งพร้อมๆกับเหตุผลและผลลัพธ์ที่เกิดขึ้นจริง
  • การหมั่นอัพเดทการพยากรณ์อยู่ทุกครั้งเมื่อมีเหตุการณ์หรือข้อมูลใหม่ๆที่สามารถส่งผลต่อการเปลี่ยนแปลงของการเกิดเหตุการณ์ที่กำลังพยากรณ์อยู่เสมอ
  • การมีบุคคลิกแบบเปิดใจที่พร้อมเปลี่ยนแปลงความคิดของตัวเองอยู่เสมอเมื่อได้รับรู้ข้อมูลใหม่ๆโดยไม่เสียเวลาไปกับการปกป้องความคิดเก่าๆหรืออัตตาของตัวเองที่ไม่น่าจะถูกต้องอีกต่อไปแล้ว

กฎข้อที่ 10 ของการเป็นนักสืบทางสถิติที่ถูกต้องก็คือ “การเปิดใจพร้อมยอมเปลี่ยนแปลงความคิดของตัวเอง” เมื่อค้นพบข้อมูลหรือหลักฐานใหม่ๆที่สนับสนุนว่าแนวคิดของตัวเองนั้นอาจไม่ถูกต้องที่สุดอีกต่อไป โดยไม่ยอมตกอยู่ในกับดักของการหลอกตัวเองและคนรอบข้างว่าความคิดอันเดิมนั้นยังถูกต้องอยู่เพื่อปกป้องชื่อเสียงหรืออัตตาของตัวเองที่ก็มักจะเสียไปอยู่ดีในท้ายที่สุด

 

Golden Rule : Be Curious

กฏทองคำที่สามารถสรุปหลักการทั้ง 10 ข้อของการเป็นนักสืบทางสถิติที่ดีไว้ในประโยคเดียวก็คือ “การเป็นคนช่างสงสัย” ที่พร้อมตั้งคำถามและทำความเข้าใจกับข้อมูลทางสถิติตรงหน้าโดยไม่ปล่อยให้อารมณ์หรือความลำเอียงทำหน้าที่แทนหลักการและเหตุผล ซึ่งผมก็เชื่อมั่นว่าผู้ที่อ่านสรุปหนังสือมาถึงจุดนี้ได้นั้นก็น่าจะมีความช่างสงสัยในระดับสูงอยู่แล้วแน่นอน

งานที่ยากกว่าก็คงเป็นการทำให้ผู้อื่นมีความช่างสงสัยและเปิดใจให้หลุดพ้นจากกรอบความคิดเก่าๆของพวกเขาซึ่งผู้เขียนก็แนะนำ 2 วิธีที่ได้ผลมากที่สุด ได้แก่ 1.) การตั้งคำถามให้พวกเขาอธิบายความเข้าใจของพวกเขาต่อหัวข้อนั้นๆอย่างละเอียดซึ่งมักเป็นการทำให้พวกเขาตระหนักว่าแท้จริงแล้วพวกเขาไม่ได้มีความเข้าใจต่อหัวข้อนั้นๆเท่าที่พวกเขาคิด และ 2.) การดึงดูดความสนใจของพวกเขาให้ได้ด้วยกลวิธีต่างๆ เช่น กรณีของพิธีกรหรือ Youtuber ต่างๆที่สามารถอธิบายเรื่องราวที่ซับซ้อนให้เข้าใจได้ง่ายและน่าติดตาม

ทั้งนี้ก็เป็นเพราะว่าเมื่อมนุษย์เริ่มตระหนักรู้ถึงความไม่รู้ของตัวเอง เมื่อนั้นพวกเราก็จะเริ่มสงสัยและตั้งคำถามที่นำไปสู่ความเข้าใจที่ลึกซึ้งถูกต้องมากยิ่งขึ้น

 




<<< ติดตาม [สรุปหนังสือ] เล่มอื่นๆต่อได้ทางนี้เลยครับ [CLICK] >>>

 

<<< ที่สำคัญ อย่าลืมกดไลค์ Panasm’s Facebook Page เพื่อติดตามอัพเดทใหม่ๆของผมนะครับ [CLICK] >>>

 

<<< ปิดท้าย สิ่งที่ผมทำสรุปมานั้นเป็นเพียงแค่เนื้อหาส่วนที่ผมสนใจที่สุดของหนังสือเล่มนี้ สำหรับเพื่อนๆที่ถูกใจสรุปของหนังสือเล่มนี้ อย่าลืมซื้อหนังสือเล่มเต็มและอุดหนุนผู้เขียนกันด้วยนะครับ ขอบคุณที่ติดตามครับผม >>>

 

Be the first to comment

Leave a Reply

Your email address will not be published.


*