網頁

2013年7月31日 星期三

[Data News] 網路上的一分鐘

網路上的1分鐘

Google 有200萬次的搜尋
YouTube 有72小時的影片被上傳
facebook 有180萬個讚
Amazon 有8萬3千美元的銷售
Email 有2億4百萬封電子郵件寄送
......

via+ World Economic Forum 


http://blog.qmee.com/wp-content/uploads/2013/07/Qmee-Online-In-60-Seconds2.png

[Update 2013/8/8]
英國衛報 Mona Chalabi 
評論這張圖表的問題點如下
Though 'email' and 'Pinterest' don't occupy the same amount of our time online, they each get the same sized slice in this confusing inforgraphic about what a minute on the Internet looks like. You know you have a bad infographic when it raises more questions than it answers - which country are we talking about? Is this what the average minute at noon looks like or the average minute at midnight? The average minute in July or in December? How did that list of sources (which includes dailymail.co.uk who conveniently later published the infographic) get their hands on this data?
http://www.theguardian.com/news/datablog/gallery/2013/aug/01/16-useless-infographics#/?picture=414096789&index=12 

2013年7月30日 星期二

[Data News] 透視蓋洛普

透視蓋洛普 
■發聲管道  ■發問的技巧  ■取樣的祕密  ■意見的真實度  ■解讀資料
   
位於華盛頓特區的蓋洛普總部 (圖片來源:維基百科)

某個夜晚,一家四口聚在餐桌前,一邊享用食物一邊聊著當天的生活。這時電話突然響了,媽媽接起電話,話筒那頭是個陌生男子的聲音:「您好,這裡是蓋洛普調查中心,我們想要蒐集您的意見可以嗎?」電訪人員以這種型式訪問美國的家家戶戶,提出各種不同問題,並收集調查的結果。民調結果可以反應整個社會的情緒,但社會的情緒卻可以被問題的設計方式所左右。

在美國的選舉文化中,民意調查是普遍存在的元素。雖然民調數字不一定都很可靠,但只要調查結果發布,新聞頭條、社論、記者、名嘴、部落客,都會忙著報導和解讀。每一次選舉時,都有許多機構對有投票資格的民眾做許多調查。他們想要知道人們對現任總統、現任政府和其競爭者看法如何,還有人們對何議題有興趣,從經濟到同性戀婚姻不一而足。

2013年7月28日 星期日

[Data Journalism] 巧克力消費量 v.s. 諾貝爾獎得獎人口比

Does chocolate make you clever?
http://www.bbc.co.uk/news/magazine-20356613


[Data Journalism]


[Data Journalism] 治亂世用重典?

治亂世用重典?
"...施尤登說,另一個有趣的現象,在德國看報,也經常可以看到用重罰防止犯罪氾濫的主張。可是如果心平氣和用科學方數據式來看這件事情:男性犯罪行為人,五年內的再犯罪機率,罰金刑者29%, 緩刑者39%, 判徒刑者49%。數據顯示,刑度刑種越重,再犯率越高,證實用重典治亂世是個迷思..."
文字出處:http://pnn.pts.org.tw/main/?p=46664

[Data Journalism]

2013年7月24日 星期三

[Paradox] 辛普森詭論 Simpson's Paradox

辛普森詭論 Simpson's Paradox



文件若出現左窄右寬雙欄位,可按左方欄框左上方 < 可以"較大之版面"閱讀。
(閱讀網誌內鑲文件,建議使用瀏覽器: Google Chrome / IE) [使用 Mozilla Firefox 或 Safari 瀏覽器,文件顯示可能空白]



2013年7月20日 星期六

[Books] 書摘 Survey Sampling - Scheaffer 抽樣調查 - 林定香審閱

[書摘1]
在意見民調的歷史中,典型的誤差之一是非抽樣誤差,與未回覆以及不當選取的架構很有關係。

文學摘要曾經從該摘要 (Digest) 的訂閱者、電話簿與汽車擁有者中,抽出一千萬人,郵寄明信片問卷給他們,企圖以此來預測1936年總統大選的結果。在2376523張回覆的明信片中,顯示了獲勝者蘭登與羅斯福的支持率為57%對43%。但是,羅斯福卻以62.5%對37.5%贏得了該次的選舉。

[Data Journalism] 數字與感受 為何差很大 - OECD 經濟研究員 陳文豪

     近年來台灣最令政府頭痛的二項問題就是持續的高失業率,以及貧富差距的擴大。然而與其他國家相較,從失業率來看,以去年平均四.四%左右的水準,台灣在三十四個發達的經合組織國家 (OECD) 中排名第五,比 OECD 的平均值(八.三%)低了近一半,也低於鄰近的日本、澳洲,甚至遠低於美國與歐盟國家。從貧富差距來看,二○一○年全國最富有的二十%家庭,與最貧窮的二十%家庭的平均家庭所得差距倍數為六.一九,吉尼系數為○.三四二。這樣的水準使台灣的所得差距比多數 OECD 國家還低,其表現僅次於北歐福利國家。

     台灣在這些「數字」上表現優異,奇怪的是,台灣民眾卻普遍不表認同,覺得數字與感受落差極大。到底是台灣的民眾喜歡抱怨?還是官員們所信賴的數據有誤?筆者透過分析,提供新的解釋。

2013年7月19日 星期五

[Books] The price of Inequality 不公平的代價 - Joseph E. Stiglitz

先看一段影片 - [ 美國的貧富差距 - 中文字幕 ]



文字轉貼自 Albert Tzeng
很清楚的影片,將美國人「理想中」與「認知到」的財富分配,跟「實際上的」結果,做出清楚的對照。這則短片對美國式資本主義 (特別是1980s年代以來受新自由主義影響的版本) 的社會經濟後果,提供一個反省的點。

五千個美國人的 Survey 出於哈佛商學院的 Michael Norton 之手,可以參考 Harvard Magazine 2011年11月的 What We Know About Wealth
http://harvardmagazine.com/2011/11/what-we-know-about-wealth

影片原出處: http://www.youtube.com/watch?v=QPKKQnijnsM&hd=1

[Data Journalism] 蓋洛普 蓋離譜 國際透明組織

[相關報導1] 

「國際透明組織」調查台灣貪腐指數較前年暴增五倍,指稱百分卅六的人有行賄經驗,相當於台灣每三人就有一人曾行賄公務員。離奇是,這份問卷調查究竟是哪家公司做的, 一度成謎,引發各方質疑,有如羅生門。

國際透明組織緊急和委託進行調查的美國蓋洛普國際 (Gallup International)公司聯繫後,昨晚表示,該組織官網上有關台灣部分,由上海慧思公司調查的訊息有誤,實際上是另一家位於中國大陸的世研公司 (Cass Research Center簡稱CRC)所作,且是採用網路線上調查、並非電話民調。

[Data News] Becoming a Data Scientist – Curriculum via Metromap

[quote]
Swami Chandrasekaran 任職於 IBM,擔任首席架構師 (the Chief / Executive Architect) 一職。他依所知建立「數據分析學習」課程地圖指南,指南中的每一個領域主題都以一條「地鐵路線」 來描述表示,而站點就是這個領域中的某個主題。所以,可以透過從最基礎的認識到精通再到應用自如的漸進方式來學習。就像去搭地鐵,會依據起點與目的地來挑選行進的路線,甚至會在行進中途決定轉換到不同的路線。

2013年7月14日 星期日

[Tools] MathJax & LaTex

終於可以在Blog不使用貼圖就顯示數學式了!

displayMath:使用"${$$}$"以及"${$$}$"包夾TEX語法

原始碼