分類
❄閱讀筆記

《數據識讀者 X 數據的假象》筆記

身處在網路時代假訊息無處不在,像是在 LINE、Facebook 或電子郵件上,親朋好友傳來的圖片或貼文,內容經常未被驗證,還被不斷轉傳。因此,練好資訊辨識、查證的基本功夫,是在這個數位時代的必要的課題,看《數據的假象》和《數據識讀者》這兩本書,或許能夠增強幾層防護的功力。

數據識讀者》作者(Jordan Morrow)素有「數據素養教父」之稱,被視為是數據素養運動的創始人和先驅者之一,他在書中介紹了如何有效地呈現和解讀數據,以及如何避免常見的數據陷阱和錯誤。你可以從這本書中學習到如何使用圖表、表格、地圖等工具來傳達數據的訊息,以及如何評估其他人所呈現的數據是否可信。

而《數據的假象》兩位作者分別是演化生物學家(Carl Bergstrom)和資訊學家(Jevin West),他們在書中揭露了許多利用數據來誤導、欺騙或隱瞞真相的例子,並且教你如何用邏輯和批判思考來抵抗這些假象。你可以從這本書中學習到如何辨別假新聞、偽科學、統計謬誤等等,以及如何用簡單而有效的方法來揭穿這些假象。此外,之前介紹的「影響判斷的《雜訊》」也不妨一看。

這兩本書都是非常值得一讀的好書,可以提升我們的數據識讀能力,並且讓我們能夠在這個充斥著數據的時代,找出那些「鬼扯」(bullshit)訊息。有句話說「謬誤傳播神速,而真相在其後跛行」,在網路時代假訊息多又傳播飛快,唯有謠言止於智者。

數據素養(data literacy)是什麼?為什麼我們需要它?數據素養是指能夠理解、分析、評估和應用數據的能力。在這個數據爆炸的時代,數據素養是一種必備的技能,可以幫助我們做出更好的決策,提高工作效率,創造更多價值。數據素養有哪些用途和好處呢?以下是一些例子:

  • 數據素養可以幫助我們找出問題的根源,並提出解決方案。例如,如果我們想要提高網站的流量,我們可以利用數據分析網站的訪客行為,找出哪些內容最受歡迎,哪些地區最有潛力,然後針對這些因素進行優化。另一個例子是,如果我們想要減少客戶的流失率,我們可以利用數據分析客戶的滿意度,找出哪些因素影響了客戶的忠誠度,然後改善這些因素。
  • 數據素養可以幫助我們發現新的商機,並創造競爭優勢。例如,如果我們想要開發一款新的手機遊戲,我們可以利用數據分析市場的需求,找出哪些類型的遊戲最受歡迎,哪些功能最吸引用戶,然後根據這些信息設計遊戲。另一個例子是,如果我們想要推出一款新的美妝產品,我們可以利用數據分析消費者的偏好,找出哪些顏色、香氣、質地最適合不同的膚質和場合,然後根據這些信息製作產品。
  • 數據素養可以幫助我們提升自己的學習能力,並增加自信心。例如,如果我們想要學習一門新的語言,我們可以利用數據分析自己的學習進度,找出哪些部分最需要改進,哪些方法最有效果,然後根據這些反饋調整學習計劃。另一個例子是,如果我們想要提高自己的健康水平,我們可以利用數據分析自己的運動和飲食習慣,找出哪些運動和食物對我們有益或有害,然後根據這些信息制定健康計劃。

你是否曾經被數據所誤導,或者被數據所欺騙?在這個數據爆炸的時代,我們需要學會如何辨別數據的真偽,以及如何避免被數據所迷惑。以下根據「數據的假象」(calling bullshit)的四個方面,各舉一個例子加以說明:

  1. 混淆因果關係:有時候,我們會看到一些數據顯示兩個變數之間有很強的相關性,但是這並不代表其中一個變數就是另一個變數的原因。例如,有一個研究發現,每年吃巧克力的國家,其諾貝爾獎得主的人數也越多。這是否意味著吃巧克力可以提高智力,或者諾貝爾獎得主都很愛吃巧克力?當然不是。這只是一個偶然的巧合,或者是有其他的隱藏變數影響了這兩個變數,例如經濟發展水平、教育程度、文化習慣等。因此,我們不能單純地根據相關性就斷定因果關係,而要考慮其他可能的解釋。
  2. 數字絕對會騙人:有時候,我們會看到一些數字看起來很驚人,但是如果仔細分析,就會發現它們是有問題的。例如,有一個報導稱,美國每年有超過10萬人死於醫療失誤。這個數字聽起來很恐怖,但是它是怎麼來的呢?原來,它是根據一些非常寬鬆和主觀的定義來計算的,例如把任何在醫院死亡的人都算作醫療失誤的受害者,或者把任何可能和醫療有關的死因都歸咎於醫療失誤。這樣的計算方法是非常不嚴謹和不公平的,而且會誇大醫療失誤的嚴重性和頻率。因此,我們不能單純地相信一個數字,而要問問它是怎麼得出來的,以及它有沒有被扭曲或誇大。
  3. 取樣偏誤:有時候,我們會看到一些數據是根據一些取樣來得出的,但是這些取樣是否能代表整體呢?例如,有一個民意調查顯示,大多數的美國人支持某個政策或某個政治人物。但是,如果我們仔細看看這個民意調查是怎麼做的,就會發現它可能只問了一小部分的人,或者只問了某個特定的群體,或者只問了某個特定的時間點,或者只問了某個特定的問題。這樣的取樣是有偏誤的,而且不能反映真實的民意。因此,我們不能單純地相信一個取樣,而要看看它是否能代表整體,以及它有沒有被選擇或操作。
  4. 數據資料視覺化:有時候,我們會看到一些數據是用圖表或圖像來呈現的,但是這些圖表或圖像是否能真實地反映數據呢?例如,有一個圖表顯示,某個國家的經濟成長率在過去幾年中一直在上升。但是,如果我們仔細看看這個圖表的刻度和坐標軸,就會發現它可能用了一些不合理的方法來美化或誤導數據,例如把刻度放大或縮小,或者把坐標軸截斷或延長,或者把數據分組或排序。這樣的圖表是有欺騙性的,而且不能真實地反映數據。因此,我們不能單純地相信一個圖表或圖像,而要看看它是否能準確地呈現數據,以及它有沒有被美化或誤導。

大家最關心的是吃的食品問題,很推薦林慶順教授的「科學的養生保健」網站,他會幫我們驗證各種保健品的真假,或是誇大不實的廣告,並將網站內容整理出書了《餐桌上偽科學系列》很值得一看。透過可以信賴的領域專家網路。也是破解鬼扯的最佳方法。

分享