6 Mistakes Cover

我們看到了厲害的草莓、不錯的蘋果、可以的夏威夷豆跟龍眼,還有其它一堆無關緊要的傢伙

做好圖表不容易,做圖不犯錯更難 - 錯誤有時是筆誤,有時是物理因素,但視覺化圖表往往更能反應出人類心智上的缺陷。我們在這裡整理了許多常見的圖表製作陷阱,看完以後你可以把他收藏自書籤,未來有製作視覺化或資訊圖表的需求時,別忘了利用這份檢查表再次檢查你的內容。

人類製作圖表已經有上千年的歷史,但正如人類所做的其他事情一樣,圖表也會犯錯。因為圖表製作的目的是提供更容易、快速的理解管道,在這個目的之下很多資訊簡化、隱含了,但卻這簡化的過程卻不一定能將資料完整的重現出來,以致於有時候甚至 - 與本意完全相反地 - 誤導了讀者的思考。下面的七種常見的圖表問題,值得大家認真的去思考與學習。

1. 軸線、比例尺錯誤的截短

有過這樣的經驗嗎?畫線圖時因為數據都很大,畫出來只有一條近乎水平的線高高的掛在圖表的上方 - 的確,這樣的圖不僅不美觀,也不甚吸引人;一條單調無奇的水平線,如手寫般的稍微扭動。你可能會想,「讓我們把他變得更戲劇化一些吧!」然後就動了一些手術,比方說截取圖表的一部份範圍,拉大至整張圖表。

但有時候,這樣做是有問題的 - 曲線被拉開,數據之間的比例也因此而失真了。原本 100.1% 的比例,可能因為你的一個拉開,就變成了 200% -試想在財務報表上這樣做吧!業績成長 200% ?很抱歉,如果營業額一起剪掉 100 萬的話。

當然在你需要突顯出他的變化狀況時,局部放大可能會是必要的。這類的手法並非完全不行,還是要依照實際的情境來考量使用。

2. 繪製泡泡圖時半徑對應到數據

Obama 2013 Budget Proposal

另一種常見的錯誤在繪製泡泡圖時,直接使用數字做為泡泡的半徑。依據圓形的面積公式 A = 2πr*r ,這將使得泡泡的大小與數據的平方成正比,原本只大32 倍的數字,圖表顯示會變成大 1000 倍 -你的圖表將帶給讀者不一樣的視聽震憾!

這個問題到 3D 圖表上會更顯嚴重,因為體積與半徑的三次方正比。不過話說回來,你看得到的 3D 圖表大部份都是不必要的 3D。當你使用區域來呈現數據時,讀者就會用區域大小來理解數據。千萬要弄好區域跟資料間的關係!

3. 地圖區塊造成的大小誤導

US Heatmap

猜猜看美國中部住的人多還是東部住的人多?

 

有些數據 - 例如人口、選舉結果等等 - 很適合用地圖的方式來呈現,最常看到的方式就是依行政區著色,藍色執政就畫藍色,綠色執政就畫綠色。這會造成什麼問題呢?問題在於空間的大小不見得與圖表關切的議題相關,有時甚至會有誤導之嫌。

例如執政黨著色這一點,通常我們比較想關心的是有政黨範圍下影響了多少人,但是人口不盡然與土地面積正相關。這就造成了一個有趣的現象:因為台灣山地的行政區面積通常比較大,如果某政黨獲得了較多山地區域的執政權,畫圖出來時很可能你會以為該政黨佔有較高的支持率,即便這些山地區域的人口數僅佔全國人口的 1% 。

地圖的區塊大小同時還會受另一個問題影響 - 由於地球是圓的,在平面顯示時使用的投影法有可能讓地形失真。我們最常看到的麥卡托投影法投出來的世界地圖中,格陵蘭與非洲差不多大,即便他們的面積實際上差了 14 倍以上,有興趣了解的話可以看一下這個網頁:  petersmap.com - Greenland Problem :

Greenland Problem - from Petersmap.com

Greenland : Africa = 1 : 14.5

 

4. 現切的立體圓餅圖

使用圓餅圖有一些地方值得注意 - 資料量不能太多, 2 ~ 4 個資料大致上是適合的,再多就要考慮呈現效果的問題。然而,就算資料多也只是難以閱讀,有些手法卻是會混淆視聽,例如「現切的立體圓餅圖」,最著名的例子來自於 Engadget 在 2008 年的這篇 Steve Jobs Keynote ,裡面恰好有一張照片拍到賈伯斯如何利用圖表讓 19.5% 看起來比 21.2% 還大:

Steve Jobs and His Pie Chart

Steve Jobs and His Pie Chart

當一個東西變成立體的時候,視覺上遠方的東西會小一些,而近處的東西會大一些;這時候若作者刻意將想強調的資料放置在下方 - 通常在立體圓餅圖中是比較近的一方 - 那他看起來就會比實際的大。圓柱型的圓餅圖會加劇這個效果,因為遠方的餅看不到柱面,但近處的餅可以看到,整體視覺上的面積因此而增加了。而最後最常見也最不必要的效果 - 彈出的圓餅 -把你有興趣的餅稍微往外推離圖表,則是更進一步的混淆了你的視聽。

除了立體圓餅圖以外,有些圖表工具讓你繪製立體錐狀圖等其他莫名奇妙的形狀,卻仍然使用單一參數 -例如半徑、高度、角度 - 來對應你的數據。如第二點所提到的,當你使用區域來呈現數據時,讀者就會用區域來理解,像是圓錐體這樣頭輕腳重的東西最適合拿來誤導讀者了,建議立體圖表能避免則避免。

簡而言之,想要吃月餅的話,去買一塊來吃就是了,別用圖表來表達你的渴望。

5. 倒因為果的圖表解釋 - Correlation or Causation?

I used to think correlation implied causation until I took a statistics class...

XKCD – Correlation

想要證明什麼嗎?拿兩條線來,再來個問題就行了。彭博商業周刊 ( BusinessWeekly ) 在 2011 年發表了一篇圖表說明相關性與因果關係的誤用,其中最經典的圖是一座山脈與紐約謀殺案件比率的吻合 - 這太驚人了!原來紐約謀殺犯罪率跟山的走勢相同!這代表山脈會帶紐約客殺人的衝動嗎?山脈接下來的走勢可以預測犯罪率的變化嗎?當然不行。

在製作圖表的同時,往往你可能會有一些有趣的想法跟發現。試著疊合人口數與年收入?好像人越多的地方收入越高。試著研究罹癌率與鄉鎮名筆畫數量的關係?試著了解進出口量與新聞提到拼經濟次數的關係?好的嘗試,但千萬要記住 - 你也許可以發現什麼,但這不代表你證明了什麼。

7. 堆疊走勢

線圖,長條圖等等的圖表用來比較數字的絕對大小相當的方便,但前提是在數據的立足點都在同一個軸線上。有時候我們會畫堆疊線圖 ( Stacked Line Chart ) ,這時候必須要注意的是這樣的圖會讓人難以辨勢堆疊成份個別的趨勢。以下圖為例,歷年來台灣不動產開發業與經紀業的薪資走勢堆疊圖:

從這張圖裡大約可以觀察到不動產開發業的薪資水平不斷的攀升,整體總合也是有上升的趨勢。因此不動產經紀業的薪資水平就是上漲的嗎?從這張圖並不容易看出。事實上當我們將兩條走勢分開呈現的時候,你會發現事實上,不動產經紀業的薪水其實是逐年減少的:

幅度並不是很明顯,也似乎有反彈趨勢,但是這張線圖比起上面的堆積圖是否更容易能比較出走勢與差異呢?

事實上堆疊圖的用途更接近於比較相對性,類似泡泡圖、圓餅圖等等的,他有類似線圖的走勢特性所以適合用來比較各種資料間時序上的比例大小。圖表本身並不是個問題,怎麼使用他才會是問題,你能否好好的利用這些工具?就端看你能否掌握到視覺化的重點 - 各種不同的資料,搭配上你希望表達的故事,都有其最適合的表現形式。


Written by infographics.tw

1 Comment

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *