網頁

2014年4月2日 星期三

[Books] Nate Silver 《精準預測》文句節錄

內容節錄出處 Nate Silver 奈特.席佛 
The Signal and the Noise: Why So Many Predictions Fail—but Some Don’t
  • 只要我們對資訊的理解程度比不上資訊的成長程度,我們就會面臨危險。p20

  • 數字沒辦法為自己講話。是我們在為它們說話。我們賦予它們意義。我們可能會用對自己有利的方式來解釋資料,讓資料脫離客觀的現實。p22

  • 客觀這個詞有時候被人當成量化的同義詞,但並非如此。而它的意思是看清我們個人的偏見和成見,看到問題的真相。p93

  • 只要有人的判斷,就有偏見的可能。要更客觀的方法就是認清我們的假設在預測中發揮的影響,並質疑自己這些假設。p93

  • 只要牽涉到人為的判斷,也就引進了偏見的可能。對預測的態度如果錯誤,更多的資訊其實會讓人把事情弄得更糟。p115

  • 你是不是個稱職的預測者,真正的考驗就在於更多的資訊有沒有讓你的預測更好。如果你搞砸了,你就是有些壞習慣和態度。p125

  • 預測人員幾乎永遠都不應該忽視資料,尤其是研究像經濟衰退或總統大選這種較少出現的事件時,這種資料一開始的資料都不多。忽視資料常常是個訊息,顯示預測人員過度自信,或是過度配試了他的模型─他對炫耀比較有興趣,而不是想力求正確。p226

  • 所以如果我們想做出更好的預測的話,更了解我們自己、我們用什麼方式扭曲和詮釋接受到的訊號,才會那麼重要。p270

  • 就經驗而言我們都有信念和偏見,是我們的經驗、我們的價值觀、我們的知識,或許還有我們的政治或專業理念之間的結合而建立起來的。p299

  • 我們思考的盲點通常是我們自己造成的,而且隨著我們年齡增長還會增加。p330

  • 我們會為真的很糟糕的預測找藉口,宣稱那些是運氣不好。但就像預設好的一樣,就如同我們在預測的時候察覺到訊號比實際上的多,預測就成功了,我們後來檢討的時候,也常常不顧根據,比較歸功於技巧。p374

  • 如果你跟最頂尖的玩家談話的話,他們不會把自己的任何成功視為理所當然;他們會盡可能專注在自我改進上。p374

  • 我們會做某件事,是因為別人都在做。我們的錯誤沒有彼此抵銷〈這是群眾智慧背後的概念〉,而是彼此開始增強、加速失控。以盲領盲,那所有人都會跌落懸崖。這種現象相當少發生,但是一旦發生就可能釀成大禍。p408

  • 資訊只有放在脈絡裡的時候才會變成知識。沒有知識,我們就沒有辦法區隔訊號和雜訊,我們對真理的追尋也會被假陽性拖累。p511

  • 要是我們的想法值得,我們就應該願意建立可以證偽的假設,用這些想法來提出預測檢驗它們。大多數的時後,我們不會去意識到資料中有多少雜訊,所以我們的偏差是會去太過著重最新的資料點。p512

  • 從雜訊中分辨出訊號需要科學知識,也需要自知:平靜接受我們不能預測的事,勇敢預測我們能預測的事,睿智看出差異何在。p513


內容節錄出處 Nate Silver 奈特.席佛 
The Signal and the Noise: Why So Many Predictions Fail—but Some Don’t

2013年11月5日 星期二

[Data News] 資料視覺化應用的例子

最近看到兩個不錯的資料視覺化應用例子
首先是 http://guns.periscopic.com/?year=2013


(圖片截取自網頁)

這網頁將 2010 及 2013 年在美國因槍擊而死的案件呈現在同一張圖表中,橘色的是受難者的年紀,灰色則是依據健康資料估計的壽命。點擊單一線條還可以看到受難者名字、性別以及受難地點。透過強烈的視覺印象喚起大家對因槍擊而死的議題重視,也是替這些早逝的受難者發聲。

每條線都可連結到對應的新聞頁面,資料來源之一有萃取新聞網站內容。
在網頁底端的右側有 Sources and Methods ,有興趣的朋友可閱讀參考。

WIRED 的相關報導
http://www.wired.com/design/2013/02/periscopic-gun-statistic-visualization/


再來則是
http://hotshotcharts.com/
這網頁可以查得到 2012 年 NBA 各球隊、各球員在主、客場的進攻位置記錄,還能看到他大多和哪位球員助攻。想知道哪一位球員的記錄呢?

以下這張是林書豪 ( Jeremy Lin ) 在 2012 年 NBA 的記錄視覺呈現 (圖片截取自網頁)


                                                      


    

2013年11月3日 星期日

[Data News] Big Data is ......

最近幾天很常看到關於 Big Data 的戲謔投影片轉貼

( 圖片轉貼自 http://share.inside.com.tw/posts/3012 )

是今年一月初由知名的行為經濟學家 Dan Ariely 在臉書所發表的內容。

Dan Ariely 目前在臺灣已出版的三本中譯著作內容很有趣,推薦大家閱讀!

誰說人是理性的! + 不理性的力量












2013年10月3日 星期四

[Data News] 美國政府 Open Data 官網 data.gov 網站暫時關閉



美國國會朝野兩黨在十月一日零時新會計年度開始前,仍未就臨時動支預算達成協議,
美國聯邦政府十七年來首次局部關閉,八十萬政府員工被迫放無薪假。

美國聯邦政府關閉部分政府職能的部門,現在連接到美國政府 Open Data 官網 http://data.gov,會被引導到 http://notice.usa.gov/,顯示以下訊息:


Due to the lapse in federal government funding, this website is not available. 
We sincerely regret this inconvenience.

以下是紐約時報於9/27以圖表說明哪些職務的政府員工
在這次政府關門放無薪假事件中會受到較大的影響。

2013年9月11日 星期三

[Data News] 2013 Big Data Forum - Taiwan

2013年8月29日(四) 臺灣有一場產、官、學關於 Big Data (Open Data) 的論壇
中央研究院資訊科技創新研究中心於9月6日有將論壇的影片公開至 YouTube
以下僅選產、官、學各一部影片

Statistics in the Big Data Era - Going beyond the buzzword
Dr. Ivan, Yuan-Chin Chang
張源俊研究員 中央研究院-統計科學研究所




Open Data
Dr. Yennun Huang, Deputy Executive Secretary
黃彥男副執行秘書 行政院-科技會報辦公室