cover

長得很像圓餅圖,但概念更接近直方圖 ( Histogram ) — 這樣的極區圖又被稱做南丁格爾玫瑰圖,他與南丁格爾有什麼關係呢?今天的《圖表101》就來為大家介紹這個曾被譽為世界上三個最偉大圖表之一的南丁格爾玫瑰圖,是怎麼被設計出來的。

「極座標餅圖」、「南丁格爾玫瑰圖」、「Wind Rose Chart」、「Nightingale’s Coxcomb」、「Circular Histogram」 — 做為一種與圓餅圖極相似的統計圖表,極區圖 ( Polar Chart ) 有著許多的別稱。其中,大家最有印象的應該就是「提燈的天使」南丁格爾這個名字。 1820 年出生於義大利的英國人弗羅倫斯.南丁格爾 ( Florence Nightingale ) 畢生致力於推動護理制度的發展與改革,因此被人們視做護士的精神代名詞,甚至連國際護士理事會也為了紀念南丁格爾所付出的貢獻而以其生日訂為國際護士節。

然而,一般人比較不知道的,南丁格爾除了是位護士,其實也是一位統計學家,也是英國皇家統計學會的第一位女性會員。「The Collected Works of Florence Nightingale」這個網站中保留了許多南丁格爾的原始著作與書信 ( 例如 Archival Material ) ,從其著作中我們可以看到,南丁格爾除了對護理制度的改革貢獻了極大的心力以外,對社會改革、女權運動與統計等領域也都相當有貢獻,而她在統計學界最著名的貢獻,便是今天的主題 — 「南丁格爾玫瑰圖」。

Florence Nightingale

佛羅倫絲.南丁格爾。 adopted from wikipedia

適逢 1854 年的克里米亞戰爭,南丁格爾與其它 38 位女性志願者的身份來到英軍位於俄國克李米亞半島的野戰醫院;當時的野戰醫院衛生條件極差,甚至連乾淨的水源與廁所都沒有,讓 1854 年冬天的傷士死亡率高達 23%,直到 1855 年 John Sutherland 博士等土木、水利工程專家所帶領的衛生委員會來到醫院改善整體的衛生環境後,才將死亡率戲劇性的降至 2.5% 。當時的南丁格爾注意到這件事,並認為政府應該要改善戰地醫院的品質來拯救更多年輕的生命。從她於 1857 年所寫的一封書信中我們看出他對政府所表現的不滿:

Our government is quite determined to do nothing. Of that, everyone is now persuaded—nothing, I mean, to prevent another army, under the same circumstances, being destroyed as the last was. Everyone is well aware that, if war were to break out tomorrow, we should have the whole scene of ’54 over again.

戰後,南丁格爾寫了一本堪稱其一生最長著作、厚近 900 頁的報告書:「Notes on matters affecting the health, efficiency and hospital administration of the British Army」, 指出衛生條件等原因造成了戰地醫院的高死亡率,並使用了極區圖來說明這件事情,下圖即為當時所使用的圖表:

Polar Area Diagram - mortality in hospital in Crimea War

這張圖用來說明與比較戰地醫院傷患各種死亡原因的人數,每塊扇形代表著各個月份中的死亡人數,面積越大代表越多死者。圖表的說明簡譯如下:

  • 各色塊圓餅區均由圓心往外的面積來表現數字 ( 也就是色塊互相重疊 )
  • 藍色區域:死於原本可避免的感染的士兵數
  • 紅色區域:因受傷過重而死亡的士兵數
  • 黑色區域:死於其它原因的士兵數
  • 1854 年 10 月、1855 年 4 月的紅黑區域恰好相等
  • 1856 年 1 月與 2 月的藍、黑區域恰好相等
  • 1854 年 11 月紅色區域中的黑線指出該月的黑色區域大小。

這張圖中,左右兩塊圖表各包含了一年份 12 個月的資料,右圖為 1854 年 4 月至 1955 年 3 月,左圖則為 1855 年 4 月至 1856 年 3 月。南丁格爾刻意以 1855 年 4 月做為分界,將 24 個月的資料切分為左右兩張圖再用黑色線條連結,是因為這大約便是衛生委員會來改善環境時的日期,也因此我們可以比較兩個年度的死亡人數與其原因的概略比例。

在這裡我們可以觀察到一些有趣的特點:

  1. 一般圓餅圖利用餅塊的夾角大小來表現資料,但極區圖中各餅塊的角度卻是固定的,資料則利用面積來表現。很多人可能會以為是使用餅塊的長度,這其實是錯的,因為面積同樣會受長度影響,但表現出來的數值卻是平方倍,容易讓讀者誤以為資料的差異比想像中的還劇烈而產生誤解。
  2. 直覺看來我們可能會以為各個色塊是堆積在一起,而非互相重疊,不過若圖表是將色塊互相堆積,那麼便不容易比較各組數字間的大小,尤其是在扇形圖表中。

此處的資料為 24 組 3 個數值的資料,12組一個周期,有些人可能會問這樣的資料不是用長條圖或折線圖可以表現得更好嗎?英格蘭杜倫大學教授 Hugh Small 在 2010 年發表的文章「Did Nightingale’s ‘Rose Diagram’ or ‘Coxcomb’ save millions of lives?」裡面即探討了這個問題,裡面提到了幾個值得思考的論點:

  • 圖表希望呈現的是兩年間的對比,將所有資料拉成一個長條圖會減弱跨年與跨季的對比效果
  • 1854 年冬天的數據比起其它時間來說相當的大,容易讓人誤解成「冬天造成死亡率提高」;相較之下,使用楔形區塊以面積表現資料,可以減低極端值的影響。

下圖為將原始數據中的「感染死亡人數」繪製成簡單長條圖的樣子,是否有感到冬季因為長條而被突顯了呢?

Data in Bar Chart

此外在表現週期性資料的時候,單純的長條或折線圖未必會是最好的方式;例如,若網站的流量總是在週末下降,我們便可能會想要以星期為單位來觀察週間每天的流量變化。所幸現在已是 21 世紀,我們有不少新式武器可以使用,例如 2008 年 Robbins 博士所提出的 Cycle Plot ( 循環圖 ) 將周期性資料拆開各別化成線圖 ( 如下圖 ) ,我們便可以同時比較一週內各天的數據,以及各週內同一天的走勢:

Cycle Plot

Cycle Plot Example, adopted from “Introduction to Cycle Plots”, Naomi B. Robbins, Visual Business Intelligence Newsletter, Jan., 2008

或者雷達圖 ( 與其變形  Radial Chart ) 也是表現週期性資料的好方式。下圖為 Elijah Meeks 利用 d3.js 製作的 Brushable Radial Chart,即用來表現紐約市的歷史溫度:

Brushable Radial Chart

這些都是較晚期才出現的圖表形式,在兩百年前統計圖表還正在發展,在當時南丁格爾的極區圖可說已經將資料做了相當好的詮釋了。這樣的圖表將複雜的統計資料以容易閱讀的形式遞到了不善於閱讀統計資料的國會議員面前,這正是資料視覺化所希望做到的 — 降低資訊解讀的門檻、提升訊息傳播的效率。

結語

此後,南丁格爾在印度花了四十年的時間,持續關心與改善從英軍到印度人民的公共衛生、健康與饑荒的狀況。南丁格爾玫瑰圖比起南丁格爾一生所做的奉獻的一切來說,真的是微不足道,但我們仍從圖表中看到了她的故事。這個圖表以現代的眼光來看,也許不是那麼美觀、有效,然而他卻成功的傳達了作者想要訴說的故事,在充斥著圖表糟粕的現代,我們應該要好好思考,什麼樣才算是好的圖表。

最後,雖然 Hugh Small 教授替我們解釋這張圖表的設計理念,仍然有些人對南丁格爾玫瑰圖抱持反面的看法,若你有興趣的話,在視覺化大師 Edward Tufte 教授的網站上也有關於這張圖的討論,很值得一讀,可別錯過囉!


Written by infographics.tw

2 Comments

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *