close

先貼幾個大家在數據分析工具的選用上的建議及偏好,提供給大家參考。

總結到最後,總是會因為SAS, SPSS等套裝軟體太貴而不被選用,而開源(open source)的數據分析工具中最被常使用的不外乎就是R和Python,所以常常有在到底要選擇R及Python的討論。

R及Python最大的差異點在於Python本身是通用性的程式語言,而R則是專門為數據/統計分析學門而存在的工具,所以Python在這方面就佔了極大優勢,因為Python除了可以拿來作數據分析外,還可以拿來處理更多的案例。而且在所謂「大數據 」的應用環境上,Python也提供許多不需額外coding的套件,使用大數據分析開發更為便捷。但是如果是真的要在真的大數據平台上開發的話,例如:Spark,那比較建議你還是使用它專門的編輯程式語言Scala。

總結:程式語言的更新與演進是不間斷的,怎麼學也學不完。如果在這個時間點你對Python及R都還不熟的話,那就先學Python吧!

  •  

  •  
arrow
arrow
    全站熱搜

    MR. MINING 發表在 痞客邦 留言(0) 人氣()