Data Journalism - 6 Tips Cover

資料翻來翻去,就是不知道哪裡有玄機?如果你曾經試著解讀手上的資料,那你大概也了解:要用資料講故事,最困難的一點就是找出「爆點」了。資料新聞學手冊 ( The Data Journalism Handbook ) 提到了六個使用視覺化幫助資料分析跟觀察的工具,我們這次將之整理成更容易理解的版本,幫助大家在前往資料說書人的道路上更進一步。

書中所提到的以下六個訣竅主要都是用來理解、探詢資料內隱藏的玄機,可以想像成是利用資料視覺化做為一個輔助工具來掘開資料堅硬難懂的表面。那麼讓我們逐項來解說吧!

1. 多用簡易的視覺化來尋找方向

視覺化不僅可以幫助讀者理解資料,也能幫助作者自己理解資料。長條圖、圓餅圖 … 主流圖表現成的工具相當多,透過快速的用不同面向的資料生出許多圖表,我們可以協助自己找到分析與鑽研的方向。舉例來說,下面幾張圖是去年選舉時新聞 E 論壇研究村里長專題時使用的視覺化 ( 專案有開放源始碼,所以圖表可以在 這裡 與 這裡 找到 ) :

Village Age Distribution

村里長出生年次 / 人數分布圖,可看出 50 年代出生的村里長為大宗

Village Geographical Distribution

村里長地理分布。從左到右:政黨分布 ( 藍色為國民黨,灰色為無黨籍 );年齡分布 ( 紅色年長,綠色年輕 );性別分布 ( 藍男紅女 )

Village Chief Party Trend

政黨人數變化趨勢

Village Chief Trends (cont.)

政黨人數變化趨勢 (少數政黨部份)

這些圖表大多使用現成套件製作,例如 chart.js 、 c3.js 、 也有利用 d3.js 製作的 ( 地理區塊圖 ) ,但基本上主要用途在做資料觀察,透過這些圖你是否也看到了一些有趣的趨勢呢?比方說:

  • 雖然村里長年紀大多近 60 歲,但有 20 多歲的年輕人,也有快 90 歲的老里長喔!
  • 一般人可能認為里長大多是國民黨的,但實際上以無黨籍為多數,而且還在成長。

像這樣的觀察,透過簡單的視覺化就很容易看到。我們可以利用各種現成的視覺化工具-比方說 Google Spreadsheet -加速圖表製作的步調,這樣就可以在最短的時間內看出端倪,再進一步做資料的深入分析,比方說:「里長是否都是灰皮藍骨?」「年輕里長都在哪個地區?」

 

2. 多從不同的角度觀察資料

Young People vs Voting Rate

投票率與年輕人比例的關係 - 橫軸為投票率,縱軸為青年比例,每個點代表一個村里

手上有一筆資料,你會怎麼去看他?這裡的重點在於:「沒有爛角度,只怕沒角度」,所以試著從各種角度去理解資料吧,就算是看起來很沒意義的方向,也可能帶給我們不同的啟發。這其實很像 Brain Stoming 創意發想的階段:不要怕失敗,試著列出各種可能性,我們需要的是多樣性跟創意。

以村里長專題為例,你會怎麼去看資料呢?年輕人比例與投票率的關係?不錯!村里長年紀與海拔的關係?也好!犯罪率與里長政黨關係? Nice Try!更別忘了你甚至可以打破傳統圖表的禁忌 - 誰說線圖一定要從 0 開始?拉大資料的尺度,使用 Log 或平方根來呈現,各種角度都可以嘗試。

 

3. 資料好像有問題?不要忽略這些問題

碰到資料看起來很奇怪、像是資料承辦人員打錯字的時候,不要單純的覺得這只是個錯誤。這些問題可能是個錯誤,也可能是個頭條-但無論如何,要提供資料解讀,你必須要能處理這些問題。

回頭去看看資料來源的說明,致信給承辦人員確認資料細節,追根究底到最原始的資料來源-求知與求真不光只是新聞報導的理念,也是資料視覺化要追求的理想。

 

4. 避免過度追求精確

避免略過小問題的同時,我們也應該要避免追求過度的精確。就像第二點所說的,創意、發想、天馬行空最大的殺手就是精確、細節跟過於理性。這是一個探索的階段,視覺化幫助我們理解趨勢、看出趨勢,這時候忽略掉小數點下的數字、製作有點粗糙的圖表並不妨礙我們做到這點。

以下圖為例,雖然圖中有資料錯誤無法對應的黑色區塊,我們觀察村里長性別趨勢的能力並不受中間黑色區塊的影響。:

Not Obeseeing in Detail
做地圖視覺化時,地理面積有時候會影響對統計數字的認知,比方說由於上圖東部的村里區塊較大,我們感受到的女性里長數量會比實際上的多。然而,我們藉由地理區塊的視覺化可以觀察位置上的分布,所以在決定要使用這類方式實作給一般讀者看的作品前,這樣的問題並不用急著修正。

 

5. 為事件、案例製作時間表

計畫要敘說一個長篇故事之前,將手上的事件做出一個時間表有助於幫助我們觀察任何可能遺漏的部份。不用太複雜的時間表,利用手繪、 Microsoft Excel 或是 Google Spreadsheet 等等工具就可以簡單的製作出效果不錯的時間表。

Timeline JS

Timeline JS 讓我們可以很快的利用 Google Spreadsheet 製作超讚時間表,不妨試試看

 

6. 常與設計部門討論,越早開始越好

Discussion Earlier
若我們不是孤軍奮戰,可以多與合作夥伴們討論作品的內容。專業分工時,不同領域往往有差異極大的思維,而不同面向的想法常能激起不同的火花。

透過不同領域的對話,也可以得到更多關於作品可能呈現的細節,對於需要搜集的資料也會有更具體的想像;資料分析與處理相當費時,若能進早開始,對於整個故事的製作或視覺化作品的製作都會更有幫助。


結語

資料新聞學手冊由世界各地對資料新聞有熱忱的記者朋友們共同編撰而成,內容涵蓋許多面向,而且很佛心的用 CC-BY 3.0 (姓名標示) 做為授權,因此有像是 正體中文翻譯 與 簡體中文翻譯 的計劃在進行,今天這篇小品文也才有機會出來。

書中除了談到資料分析與理解,資料視覺化訣竅以外,也有相當多的各國案例分享,不論是否要走新媒體或新聞這條路的朋友,我們都很建議大家好好的讀他一遍喔!


Written by infographics.tw

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *