網頁

2013年11月5日 星期二

[Data News] 資料視覺化應用的例子

最近看到兩個不錯的資料視覺化應用例子
首先是 http://guns.periscopic.com/?year=2013


(圖片截取自網頁)

這網頁將 2010 及 2013 年在美國因槍擊而死的案件呈現在同一張圖表中,橘色的是受難者的年紀,灰色則是依據健康資料估計的壽命。點擊單一線條還可以看到受難者名字、性別以及受難地點。透過強烈的視覺印象喚起大家對因槍擊而死的議題重視,也是替這些早逝的受難者發聲。

每條線都可連結到對應的新聞頁面,資料來源之一有萃取新聞網站內容。
在網頁底端的右側有 Sources and Methods ,有興趣的朋友可閱讀參考。

WIRED 的相關報導
http://www.wired.com/design/2013/02/periscopic-gun-statistic-visualization/


再來則是
http://hotshotcharts.com/
這網頁可以查得到 2012 年 NBA 各球隊、各球員在主、客場的進攻位置記錄,還能看到他大多和哪位球員助攻。想知道哪一位球員的記錄呢?

以下這張是林書豪 ( Jeremy Lin ) 在 2012 年 NBA 的記錄視覺呈現 (圖片截取自網頁)


                                                      


    

2013年11月3日 星期日

[Data News] Big Data is ......

最近幾天很常看到關於 Big Data 的戲謔投影片轉貼

( 圖片轉貼自 http://share.inside.com.tw/posts/3012 )

是今年一月初由知名的行為經濟學家 Dan Ariely 在臉書所發表的內容。

Dan Ariely 目前在臺灣已出版的三本中譯著作內容很有趣,推薦大家閱讀!

誰說人是理性的! + 不理性的力量












2013年10月3日 星期四

[Data News] 美國政府 Open Data 官網 data.gov 網站暫時關閉



美國國會朝野兩黨在十月一日零時新會計年度開始前,仍未就臨時動支預算達成協議,
美國聯邦政府十七年來首次局部關閉,八十萬政府員工被迫放無薪假。

美國聯邦政府關閉部分政府職能的部門,現在連接到美國政府 Open Data 官網 http://data.gov,會被引導到 http://notice.usa.gov/,顯示以下訊息:


Due to the lapse in federal government funding, this website is not available. 
We sincerely regret this inconvenience.

以下是紐約時報於9/27以圖表說明哪些職務的政府員工
在這次政府關門放無薪假事件中會受到較大的影響。

2013年9月11日 星期三

[Data News] 2013 Big Data Forum - Taiwan

2013年8月29日(四) 臺灣有一場產、官、學關於 Big Data (Open Data) 的論壇
中央研究院資訊科技創新研究中心於9月6日有將論壇的影片公開至 YouTube
以下僅選產、官、學各一部影片

Statistics in the Big Data Era - Going beyond the buzzword
Dr. Ivan, Yuan-Chin Chang
張源俊研究員 中央研究院-統計科學研究所




Open Data
Dr. Yennun Huang, Deputy Executive Secretary
黃彥男副執行秘書 行政院-科技會報辦公室



2013年8月29日 星期四

[Books] Nate Silver 的 The Signal and the Noise 繁體中譯本《精準預測》出版啦!

圖片取自 http://pic.eslite.com/Upload/Product/201308/l/635129301094863750.jpg

期盼很久的 Nate Silver 著作 《The Signal and the Noise: Why So Many Predictions Fail—but Some Don’t》終於在原文書出版 (2012/09/27) 接近一年後要出繁體中譯本《精準預測:如何從巨量雜訊中,看出重要的訊息?》了!

Nate Silver 是誰呢? 大學就讀芝加哥大學經濟系,曾在大三時前往倫敦政經學院研修一年,2000年大學畢業後,進入KPMG事務所擔任顧問,因為對實際工作內容缺乏熱情,開始(充分)利用時間發展自己的興趣,研發以數據預測美國職業棒球員表現與球隊賽果的PECOTA系統打出名堂,因為精準至極,因而吸引Baseball Propectus於2003年時收購。

2004年及2005年靠著打線上德州撲克牌賺了40萬美元,但2006年因為線上撲克受到「非法網路賭博禁止法案」影響,可以參與的雜魚玩家大幅減少(被迫退出或是破產了),沒有較弱的雜魚玩家支撐比賽,贏錢難度大幅增加,2006年和2007年輸了共13萬5千美元後(約先前賺來的1/3),停損,不打了。

從線上賭博法案通過後 Nate Silver 對政治程序興趣大增,也因此發覺政治競選活動預測競爭門檻低得讓人心動,只要有做一些相當基本的研究,了解政治競選活動中什麼東西才是有預測力的,看起來就會像個天才!(因為特定的立場和意識形態,所以很多預測是以有偏見的眼光看待調查與數據,只看到他們想看到的,提出引人注目但背離事實的解讀,所以更多的資訊並沒有讓有偏見的人預測得更好,因為這隱藏了預測者的壞習慣或看待資訊的態度),所以開始寫部落格,貼出詳細、以資料為主的分析,討論民意調查、募款數字之類的議題,2008年3月時將所分析的內容開始轉到 FiveThirtyEight (網站命名來自於美國選舉人團的總票數538票)發表他的選情預測。

2008年美國總統大選,他成功預測歐巴馬勝選:50州個別選舉結果,49州預測正確,而且35席參議員的勝選者,全部預測正確。 
2012年,他再次力抗全國媒體、政治名嘴團、預測機構所稱「勢均力敵」的說法,成功預測歐巴馬勝選, 這次 50州全部命中, 在關鍵州的預測更驚人的準確徹底打敗傳統電視台的民調、傳統政治名嘴的預測、傳統大型民意調查機構的預測 (例如: 蓋洛普 Gallup 和 Rasmussen) 可參考 Which Polls Fared Best (and Worst) in the 2012 Presidential Race 

《精準預測》書內涵蓋非常多元豐富的內容 (地震預測、氣象預測、氣候預測、反恐預測、西洋棋電腦對戰棋王、撲克贏錢預測、金融市場贏錢預測、經濟預測、職業棒球賽預測、職業籃球賽預測、流行病傳染預測、政治選舉結果預測.....等),而且充分利用他於紐約時報擔任部落客與記者的資源 (2008年~2012年書籍出版前),訪問了以上相關領域不同意見的核心專家(超過百位)的說明與看法,並內化與統整精粹成書籍內容。

與其說 Nate Silver 是預測鬼才(天才),倒不如說他是對造成預測準確或錯誤的根本原因或侷限與盲點,有深刻體認與時時自省並檢討修正的持續改進者!非常推薦大家閱讀 Nate Silver 的《精準預測》!


《The Signal and the Noise: Why So Many Predictions Fail—but Some Don’t》
★ 出版三個月穩居亞馬遜書店銷售總榜前 20 名、商業理財類第 1 名、政治社會科學類第 1 名 
★《紐約時報》暢銷書排行榜前 10 名 
★ 榮登亞馬遜書店 2012 年度「非文學類」第 1 名 
★ 獲選為亞馬遜書店編輯嚴選2012年度「商業類」最佳書籍 
★ 獲選《華爾街日報》2012「十大最佳非文學類好書」 
★《紐約時報》書評盛讚:「10 年來最重要的一本書」 
★ 2009 年《時代雜誌》將奈特˙席佛列入「世界最有影響力的百大名人」 
★ 2012 年《滾石雜誌》將奈特˙席佛譽為「改變遊戲規則的人」 


◎ Nate Silver 在書中不斷提醒讀者: 
˙預設立場或過度自信,對預測來說,是非常可怕的事。  
˙預測不是在追求是與非,而是估算事情發展的「機率」。有精準的機率,才能做出有利的決策。 
˙做預測時,最怕一看見「有相關」就解釋成「因果關係」。(冰淇淋 vs. 森林大火) 
˙預測時不能忽略「誤差」,並要勇於承認有「不確定性」。 不然你會過度解釋,變成不精準的預測。 
˙根據預測出來的機率,做了最有利的選擇,即使最後結果不好,仍然是好預測。 
˙在很多情境中,不是一定要追求終極完美的預測,只要預測比競爭對手好,你就贏了。 
˙當大家不免被雜訊迷惑時,問問自己,你有什麼法寶,能讓自己更接近真相?跟著法寶走,不要跟著群眾走。 
˙有新的重大資訊進來時,能保持客觀,隨時更新的預測,才有可能是精準的預測。


以下修改自簡體中譯本之目次,可以快速一窺內容主題之精髓