公告版位111

資料庫常出現null值,但大致來說,其可能有下列三種可能性:

1. Unknown value - 例如某位員工的生日無從得知,所以就用null

2. Unavailable or withheld value - 例如某位員工只有家用電話號碼而無公司用電話號碼

3. Not applicable attribute - 例如某位學生沒有大學學歷,故沒有主修科目的資料

MR. MINING 發表在 痞客邦 留言(0) 人氣()

三種刪除資料的限制的處理方式

1. Restric ; 無法刪除

2.Cascade; 當刪除資料時,一併行除其相關連的資料

3.Set null or set default; 當刪除資料時,將期關連的資料設為null或設為預設值

MR. MINING 發表在 痞客邦 留言(0) 人氣()

常用的SQL指令如下:

SELECT <attribute and function list>

FROM <table list>

[WHERE <condition>]

[GROUP BY <grouping attribute>]

[HAVING <group condition>]

[ORDOR BY <attribute>]

 

Aggreagte Function in SQL

COUNT(*), COUNT (DISTINCT *), AVG(*), SUM(*), MAX(*), MIN(*)

 

 

EXISTS, NOT EXISTS Funciton in SQL

SELECT

FROM 

WHERE EXISTS (........有值=True)

 

SELECT

FROM

WHERE NOT EXISTS (.........無值=Ture)

 

MR. MINING 發表在 痞客邦 留言(0) 人氣()

常見的資料庫限制(Database Constraint)大致上可分為三類:

1.Inherent model-based constaints 或 Implicit constraints

2.Schema-based constaints 或Explicit constraints

3.Application-based 或Semantic constaints或Business rule

 

MR. MINING 發表在 痞客邦 留言(0) 人氣()

在資料庫系統的定義中:

Tuple代表資料中的行;

Attribute代表每個欄位的屬性

Table代表各欄位的關係

Atomic 指的是不能再切割的值

Domain指的是所允許格式的範圍

Relation schema就是meta-data指的是一組Attribute清單

MR. MINING 發表在 痞客邦 留言(0) 人氣()

目前公司的跨國專案(Be-Warned)有在台灣提供Intership的機會,有興趣的人請參考。這是一個非常有挑戰的大型專案,可以落實Data mining及Predictive modeling的概念於實際應用。

請參考: 104 ASML Data Analyst (4 months Internship; 4個月實習機會)

職務說明:

Sector Information:
Be-Warned project plan to deliver the predictive model solution at July, and we currently have 110 models which are collected from WW offices but the quality is unknown. In order to secure the models we delivered are all with good prediction quality, the in-house model validation and fine-tune is necessary. However, due to the fact to test a model cost lots of time, we propose to hire the intern to speed up the progress and ensure we can deliver the deliverable on time.

Job Describtion:
    • Based on the predictive model building guideline to verify whether the model information is sufficient or not. 
    • Test the model performance based on model definition. 
    • Generate model quality report with the pre-defined template. 
    • Provide model fine tune suggestion.
學歷要求:大學以上
科系要求:統計學相關、一般商業學類
語文條件:英文 -- 聽 /精通、說 /精通、讀 /精通、寫 /精通
其他條件:

• Must be strong in discipline and willing to follow the guideline 
• Attention to the details 
• Basic statistical skill, data-mining skill is plus. 
• Good at Office excel, VBA is plus 
• Good communication skill (willing to listen and give suggestions / feedbacks) 
• Excellent English written and verbal communication skills.

更新日期:2012-03-19

連 絡 人:Ms. Evelyn

MR. MINING 發表在 痞客邦 留言(2) 人氣()

資料來源: 黎漢林 教授  商管書知識鏈(Knowledge chain for Business Books)

以下的步驟可以協助你有效,快速地去理解一篇文章,並且將其重點有組織的記錄並分享給他人。

 

Step 0:跳讀 ,決要什麼要讀,什麼要略過,以及要特別注重那些章節。

Step 1:速讀 (大約花一小時去讀約10,000字的文章),並且要能回答下面的問題:

  • Q1:這篇文章中,有多少的知識單位(Knowledge Unit)?
  • Q2:這些知識單位(Knowledge Unit)之間的關系為何? 主從? 平行? 因果? 時間前後? 上下?
  • Q3:要如何將這些知識單位(Knowledge Unit)轉換為數個cluster? (化繁為簡)
  • Q4:這些Cluster之間有何邏輯關係?
  • Q5:這些Cluster之間有多少可能的可能圖形? 那一種是最合理的? 那一種是你最喜歡的? 畫出"快覽圖稿"
n1  

Step 3:記讀,根據快覽圖稿來解讀文章的內容,並回答下列問題:

  • Q1:現有的快覽圖稿可以被合理的擴充嗎?
  • Q2:所有重要的內容都已被包含在內嗎?   (並作出章節 章覽圖)

Step 4:登錄,將文章展成兩頁的擴展摘記(Expanded abstract)

n2  

Step 4:成卡,濃縮擴展摘記(Expanded abstract)成一張知識卡(Knowledge card)

n4  

Step 5:通覽,將知識卡(Knowledge card)整合為一張主題圖(Issue diagram),或放置於通覽圖(Overall diagram)中

n3  

MR. MINING 發表在 痞客邦 留言(0) 人氣()

Face book的時間軸(timeline)真是令人又愛又恨,外觀感覺得專業,但實際上要找資料時,卻要花上許多時間也還不見得找的到。Timelineremove提供了一個回覆的機會,不過它並非真的將你的個人檔案改回原來的樣子,而是讓你的browser在看自已以及別人的檔案時,能以舊板的檢視方式。也就是說,你的朋友也需在別台電腦安裝Timelineremove才能用舊板檢視。

 

http://www.timelineremove.com/

1   

 

 共有四種版本,Firefox, Google crome, IE, 而Apple的Browser還在製作中。 

2

 

3

 

4     

MR. MINING 發表在 痞客邦 留言(2) 人氣()

Conceptual design: that can be represented and manipulated using some computerized tools so that it can be easily maintained, modified, and transformed into a data baesd implementation. Such as: ER model (Entity-Relationship model)

Logical design:that can be expressed in a data model implemented in a commerical DBMS. Such as: Relational Data Model

Physical design: during which further specifications are provided for storing and accessing the database

 

Source: Database Systems by Rmaes Elmasri

 

下表可以看出其在不同特性上的差異:

1    

MR. MINING 發表在 痞客邦 留言(0) 人氣()

作者:安德烈.科斯托蘭尼 Andre Kostolany

初版:2002年

IMAG0363 

這本書是科斯托蘭尼的遺作。

開宗明義點出:「錢,屬於狂熱追求金錢的人。他必須對金錢著迷,就像被魔法師催眠的蛇,但又必須和錢保持一定距離」- 很多人會說錢夠用就好,不需強求,但是我們可以看的到的現象卻是大家莫不無默契般地追求金錢,這樣的現象是很難被解釋的。不過作者提到另外一個觀點也許可以參考,就是大多數的人會透過賺錢的過程來肯定自已,就像富家美女也會因為有人高價收購自已的相片而感到高興。

文中一再地重覆道:「投資是種藝術,而不是科學。」這一點是目前的我所不能理解的。我能體會股市的漲跌是基於投資者的心理而產生的行為,要能掌握投資者的心態也的確不容易,畢竟要了解自已的心理本來就不容易,更何況要了解別人的。只是,若因此就把它歸類為"藝術",那不就有點像是賭博,無所根據。也許這就是作者所謂的"經驗,經驗,經驗"。??

最讓我省思的部份是:一位客戶去找經紀人,想聽取一些建議。經紀人使出渾身解數,勸他繼續買進IBM的股票。經紀人說完後,客戶才察覺自已原本是想賣掉IBM的股票。「原來如此,」經紀人說:「賣掉--這也不壞!」  其實經紀人的獲利模式並不是從你交易的獲利中拿錢,而是透過不斷地鼓勵你交易賺取交易費。可想而之,他們只會建議你可能有興趣的交易,而不是真正可以讓你獲利的交易。先去思考別人給你這個訊息背後的意義後,再去處理的這個訊息,會讓你比較不會盲目而失去方向。

另外,作者非常不相信電腦程式分析與圖表,「任何一台電腦頂多只和它的程式設計者一樣聰明。」「任何學校都教不出投機家,他的工具,除了經驗外,還是經驗。」「經濟學家只會計算,不會思考。他們的統計不僅錯誤,也發現不了數字背後藏的東西。他們懂得從書本上學到的所有東西,卻忽略其中的關連。」我個人也同意程式是人寫出來的,但畢竟電腦是用來補足人類的不足,而不是用來取代人類的。在這個前提下,其實也不用那麼排斥利用電腦所帶來的便利性。

「不同的專家會對於同樣一個因素,例如:利率提高,作出不同的評論。」這些的評論都是多餘,市場是不需多去解釋的。

「固執的投資者須具備四種要素:金錢,想法,耐心,還有運氣。」

「絕對不要借錢買股票。」-即使再厲害的投資者,都會面臨外在的不確定因素,造成短期投資虧損,此即若有資金上的壓力,則不得不認賠變現。
「我非常認同愛因斯坦說過的話:想像力比知識更重要!」 -  其實這也讓我想起陳安斌教授上課中提到的:知識是變動地,在不同時領域,不同的時間,會產生不同的知識。過去已經發生的歷史不見得能適用於未來。

「只有少數人能投機成功;關鍵在與眾不同,並相信自已:我知道,其他人都是傻瓜。」 - 如果利用大家都看的到的資訊作出跟大家相同的決策,那麼這之中就沒有投機的獲利空間,要有自已獨立思考的能力,看出別人所看不出來,或來不及看出來的資訊。
 

MR. MINING 發表在 痞客邦 留言(0) 人氣()