
在各種領域的研究中,我們時常會製作統計圖形,讓整個數據的呈現一目了然。以地理資訊系統來說,我們會在地圖上每個地點著上不同顏色,代表不同程度的數據。譬如十筆以下是白色、十筆到二十筆是淺灰色、二十筆到三十筆是淺灰色。
可是什麼樣的標準才會是好的標準,才能夠呈現讓使用者最容易讀到正確的意思。尤其如果統計資料不是平均地、常態地分佈,我們究竟該取多少做為繪圖的依據?
我們這邊特別介紹兩種比較好用的量化方式。
「Nested means」,假如我們要將統計資料分成四種層級,我們先取出平均值做第一刀,再把剩下個兩個部分各取平均值,再切一刀。呈現出來的圖形就會是如圖一。另一種則是「Arithmetic pregression」,則是利用一種等比方式做切割。也就是把統計資料中最多筆數的那份,開四次根號,達到一次方以下,一次方、二次方、三次方的不同數據分別用不同顏色代替。如同圖二。
這兩種方法對於變動資料量的統計資料都會有不錯的成果。不管資料量多大多小,都能夠恰如其分的做一個最適合的切割。我們的土地移轉圖系統,其中人名的排列採用的是標籤雲的方式(tag cloud),也同樣是利用這樣的量化方式,因此不管是十個人名,或著一百個人名,標籤雲都能夠以較正確的語意方式呈現排列結果。
這兩種排列方式,視覺化出來的圖形,會比原本以單純規定數據做為分割標準來的更具有正確的語意。而不會因為規定數據設定的錯誤,使研究者有錯誤的解讀和誤解。