公告版位111

讓天賦自由(10萬冊紀念版)發現天賦之旅

 

 

 

 

 

 

 

 

 

 

 

 

 

 

熱銷書"讓天賦自由(The Element_How Finding Your Passion Changes Everything)的作者Ken Robinson接連在2009初版,2010年第一版第30次,2011年發行10萬冊,及2013年又出版相同系列新書"發現天賦之旅"(Finding Your Element)。

由這些熱銷的數字背後不難看出其實人們是急於找尋心中的自我。當生命的旅途有發生不如意事時,人們會進行反思人生的意義,並試圖告訴自已其實不需要太在乎社會所設下的規範。

我無法針對以上書中觀點立下結論,例如去回答人生的目的為何? 但我卻可以發現以上的這些社會情況只會發生在人類遇到困惑的時候,會想要找尋一種"說法"來讓生命找到出路。姑且不論這種"說法"的正確性為何,是否能通過歷史長時間的考驗,但至少他能為人類帶來短暫的出口。

更進一步的說,透過研究熱銷書的種類,數字,趨勢,可以用來分析人類內心深處所缺乏的原素,可作為社會現象研究及行銷研究的有用資訊。

 

 

 

 

 

MR. MINING 發表在 痞客邦 留言(0) 人氣()

聰明學統計的13又½堂課:每個數據背後都有戲,搞懂才能做出正確判斷

 

 

 

 

 

 

 

  

聰明學統計的13又½堂課:每個數據背後都有戲,搞懂才能做出正確判斷

 

"數據(Data)"本身就已經極簡化整個待描述事件及過程,並且試圖用合理地、可說明人地理由讓使人相信這些行為所產生的"數據"是具代表性的。可惜,事實往往並非如此,大多數的數據都仍未能充份地解懌一項行為,且在未經合理的分析前,總是沒有用處,甚至會誤導人們。(通常的原因是其中充滿太多的outliers)

統計本身的迷人之處在於其透過分析的技巧,可讓這些似是而非的"數據"變的更容易解讀,以進而作出正確的選擇決策。但這中間的成功關鍵則取決於統計分析者的專業能力及品德。統計學者可以因為"自已的無知"或"讀者的無知",有意或無意地使其分析結果讓人誤判。所以強烈建議每個人都必需有解讀"數據"或者"統計報告"的能力,一些簡單的邏輯判斷即可有助作出正確的決策。在此,我不願意去提及有些因為政治因素而利用統計這項利器來愚弄人民,甚不可取。

作者在文章之末提到了幾項統計軟體,有些軟體隨手可得且可完成大部份你想的到的統計分析,例如Microsoft Excel。如果你的手中有一些資料,而你也想透過這資數據來作出一些屬於你的分析決策的話,不彷一試。

  •  Microsoft Excel
  • Stata (www.stata.com)
  • SAS (www.sas.com/technologies/analytics/statistics)
  • R
  • IBM SPSS

作者介紹

作者簡介

查爾斯.惠倫 Charles Wheelan


  芝加哥大學公共政策博士。大學畢業於歷史悠久的常春藤盟校「達特茅斯學院」,碩士就讀普林斯頓大學。2012年6月起任教於達特茅斯學院。2004~2012年擔任芝加哥大學公共政策哈里斯學院資深講師,任教第一年即獲得學生票選為非必修課程的「年度最佳教授」。他的第一本著作《聰明學經濟的12堂課》(先覺出版)榮登博客來「年度百大趨勢書」。繼《非典型人生建言》(先覺出版)之後,本書2013年出版即登上《紐約時報》非文學類暢銷榜。

  作者討厭微積分,卻深愛統計學,因為他發現,統計可以幫助你回答五個重要的問題:
  民調是如何計算出來,又怎樣加以操弄?
  在哈佛這類名校求學,真的會改變人生?
  為什麼我們不應該花錢延長產品的保固期?
  信用卡公司如何從你的消費紀錄看出你是會延遲繳款的人?
  如何提升做決策的效果,而不白忙一場?

 

 

 

 

 

 

 

MR. MINING 發表在 痞客邦 留言(0) 人氣()

Lock-in,套牢是指消費在購買一項商品後,使用後習慣而產生極大的轉換成本。直到消費者興起了想換產品的念題時,lock-in cycle就又重新啟動。

幾種常見的lock-in策略:

  1. Contractual commitment:訂定長期的契約,或者是最小訂購量及折扣。
  2. Durable pruchase:耐久品,用不壞。
  3. Brand-specific trainning:品牌意識,例如文書處理就是要用word
  4. Information and data:隨著成長而更有價值,例如Facebook是因為有朋友才會穩定發展。
  5. Specialized suppliers:專門的供應商,例如NASA的供應商。
  6. Search cost:搜尋成本,例如信用卡吸引新客戶。
  7. Loyalty program:忠誠方案,讓會員有打折扣。

一般而言,賣方會想要讓使用者lock-in,而買方則會避免被lock-in

Seller's strategies to exploit lock-in

  • Invest: 在產品導入初期盡可能用最低成本建立極大的Installbase
  • Entrench: 設計產品反行銷,使顧客繼購買產品。例如會員制,或是折扣行銷
  • Leverage:最大化Installbase的價值。

Buyer's strategies to avoid lock-lin

  • 在購買初期即討價還價。
  • 限制你的弱點,例如找出替代品。
  • 小心緩慢入侵的lock-in,堅持有權利與賣方相關的資訊。

MR. MINING 發表在 痞客邦 留言(0) 人氣()

所謂的Experience good是指一項商品在使用之前,使用者難以得知其品質,必需在使用之前才能發現商品的價值。

MR. MINING 發表在 痞客邦 留言(0) 人氣()

VPRC是V(Value), P(Price), R(Revenue), C(Cost)的縮寫,是在資訊經濟(Information Economics)學術上在分析一項新發明(Innovation)成功上市的可行性。其分析概念類似於SWOT分析,可找出該新發明(產品、服務)的優勢、劣勢。

V(Value),價值。指的是該新發明與原有品相較之下,是否能為顧客帶來更高的價值。可以用三個面向衡量:

  1. New:此產品是否為新發明,在市場上是否已有相同或極類似的產品。若為新發明時,通常能為顧客帶來較大的價值感。
  2. Quality:此產品的品質是否比既有品好。
  3. Quantity:使用此產品是否能讓顧客有較高的使用量。

P(Price),價格,指的是該新發明與原有品相較之下,顧客的"取得成本"是否能減少。可以用三個面向衡量:

  1. Pay:指的時實值所付出的費用。
  2. Transaction cost:指的是為了取得該產品所必需付出的代價,例如開了100公里的車才能買的到。
  3. Switch cost:指的是由原用品轉換至該新發明的代價,例如要從Windows轉換到Mac。

R(Revenue),收入,指的是該新發明與原有品相較之下,企業的營收是否可增加,可以用三個面向衡量:

  1. Market size:指的是該產品的市場大小。
  2. Saturation rate:指的是在其市場內的滲透率。
  3. Value transfer rate:指的是能讓使用者真正拿出錢的比率。

C(Cost),成本,指的是該新發明與原有品相較之下,企業的成本是否可以降低,可以用三個面向衡量:

  1. Sourcing cost:生產該產品原料之取得成本。
  2. Production cost:生產該產品之成本。
  3. Distribution cost:通路成本。

 

VPRC  

MR. MINING 發表在 痞客邦 留言(0) 人氣()

Network externality 網路外部性,也可稱為網部效應(Network Effect)是指當有愈來愈多人使用一項產品時,此產品就會自然擴散至更多使用者。成功的案例如:Facebook, Skype。

其反例是電話,當沒有人安裝電話時,電話機本身是不具價值的。

MR. MINING 發表在 痞客邦 留言(0) 人氣()

XCS (Extend Classify System)主要系為了改善LCS(Learning Classifier System)機制中之缺點,目的在於使各知識法則在相互競爭中可以真正的反應其實力,改善在知識法則競爭過程中之不公平行為,例如:

  • 競爭不公平:各知識法則是否只能拿其擁有分數的10%來競爭? 如此將會讓(先賺2年再輸2) 的知識法則與(先輸2年再賺2)的知識法則在評分上產生不公平。
  • 獎罰不公平: 連續猜對的知識法則是否應給較高的獎利?
  • 交配不公平:"看多"的知識法則是否只能跟"看多"的交配?

改善項目:

XCS利用準確度(p),錯誤率(e)Fitness (F)來進行競爭而非單一指標。

MR. MINING 發表在 痞客邦 留言(0) 人氣()

應用:LCS (Learning Classifier System) 是一個機器學習(machine learning)的系統,其主要為了解決在動態環境中,對於問題解答品質的改善。

原理:透過讓多個的知識法則之間進行競爭,根據各知識法則在特定環境所產出的結果給予評分。並透過基因演算法讓得分較高的知識法則族群進行交配、複制、突變產生新知識法則,並將新法則法則一同競爭。如可讓較優秀的法則勝出。

範例:假設初始有50個知識規則,每一個知識規則各自100分的點數開始進行競爭,猜對者+1%分,猜錯者扣-1%分。

第一天15個知識規格符合第一天的決策環境,猜對的加分(100 + 100x1%=101分),猜錯的扣分(100-100x1%=99分)

第二天假設有10個知識規則符合第二天的環境,其中有3個已在第一天猜對,有6個在已第一天猜錯,另外有1個在第一天未作答。則:

  第一天猜對,第二天猜對 : 101 + 101x1%

  第一天猜對,第二天猜錯: 101 - 101x1%

  第一天猜錯,第二天猜對: 99 + 99 x 1%

  第一天猜錯,第二天猜錯: 99 - 99 x 1%

  第一天末作答,第二天猜對: 100 + 100 x 1%

  第一天末作答,第二天猜錯: 100 - 100 x 1%

  依此規則進行100天之競賽,並取前20名知識規則進行交配、複製、突變後,所產生之新的知識法則再與原有之知識法則再進行競爭。

系統架構圖:

 

LCS  

 

 

 

MR. MINING 發表在 痞客邦 留言(0) 人氣()

異常值的偵測可以應用於許多領域上,但也常會遇到以下的挑戰:

  1. 很難有效地為正常/異常物件建置模型: 通常而言,正常與異常的界限並不十分明確,而且存在著很大的灰色地帶。甚至有一些異常值偵測(Outlier Detection)的方法論不會直接為物件定義(正常)或(異常),而是給每個物件一個所謂的異常分數(Outlier-ness)。
  2. 特定領域的異常偵測:技術上來說,在異常偵測中,相似度及距離量測的方法選用是相當關鍵的。但不幸的是,這些方法的選擇通常與其應用領域有極大的相關。不同的應用領域會有不用的需求。例如:在醫學資料的分析上,很小的變異程度就足夠被定義為異常。但相對的,在市場分析上,所分析的物件通常有很大的變異,所以可能需要用比較大的變異才能用來定義市場上的異常。所以異常偵測通常很難被發展為一通用的方法。
  3. 在異常偵測中的雜音處理(Handling Noise): 如同上一篇文章中所提到的,異常(Outlier)與雜音(Noise)是不同的。而且大家也都有所認知,我們所分析的資料的品質一般是不好的。在這之中,雜音(Noise)可能以變異或是遺值(data missing)的方式出現,而將真正的異常(Outlier)給隱藏了。
  4. 可解讀性(Understandability):在某些應用領域中,使用者可能不只要找出異常值,更想要了解這些物件為何是異常值。為了要達到這個"可解讀性"的需求,在設計異常值偵測的方法時,則必需給予充分的理由。

MR. MINING 發表在 痞客邦 留言(0) 人氣()

一般而言,異常值(Outlier)是指其資料顯著地別於其它的資料物件,且它是因為不同的機製所產生的。雖然有時我們把outlier稱為abnormal data,但並非所有的outlier都要排除。例如在信用卡詐騙偵測(credit card fraud detection)的分析上,客戶的abnormal行為就是分析上重要的特點。

而雜音(nosie)則是因隨機產生的誤差或變數,在資料探勘分析上,通常在異常值偵測(outlier detection)分析前,會先將雜音(nosie)去除。

異常值(Outlier)可大致分為三大類

Global outlier

也稱為 'point anomalies'。是指該資料有顯著地別於其它的資料集合,大多數的outlier detection都是在於尋找這類的異常值。

要有效偵測這類的異常,最重要的議題就是需針對欲分析的主題是要找到一個合適地衡量誤差(deviation)方法。用各種不同的方法轉換後,再用outlier detection的方法進行分類。

 Contextual outlier

也稱為conditionl outlier"。"今天的溫度是38度" <-這算是一個異常值(outler)嗎? 這很難有一個肯定的答案,因為仍需看這是在什麼'時間'及'地點'才能決定是否為異常值。所以contextual outlier需根據資料的特定內容(contex)來進行分析

  • Contextual attributes
  • Behavioral attributes

 Collective outlier

"每個月缺料10次"<-這是一個異常值(outler)嗎? 也許不是,但如果這10次缺料都發生在同一天,這就是很明顯的異常了。個別的資料並沒有異常,但如果這些資料都發生在特定的子集合上時,則可能為異常。故在異常偵淵上,我們也需要了解背景資料,才能有效分析。



MR. MINING 發表在 痞客邦 留言(0) 人氣()