資料剖析，要用R還是Python－samantea3fvn0@outlook.com

R是一個專門的統計剖析說話，不但語法獨樹一格，且在其他方面能做的工作不多；但也因為目標專一，所以假如有什麼新的統計剖析手藝的話，在R上也會比力輕易找到相幹的實作。

R的問題之一在於延展性，所以計較與暫存資料預設都是利用Memory，所以Memory不敷大的話，能處置的資料集巨細也會受限。固然有一些公司在改進這個瑕玷，但我不肯定是否這些公司的產品是不是能施展影響力。

"65306", {});

說其實的，華頓翻譯公司兩個都不是很熟XD，所以華頓翻譯公司只能很不專業的比較翻譯

以R來講，這是設計給統計範疇的人做資料剖析的語言翻譯學過其他說話的人會發現R有許多奇特的內建型別，像是：

Factor：這是R的一種資料型別，透露表現這資料是屬於種別變數(Categorical variable)，有別於陸續變數(Continuous Variable)
Formula：表示一個公式，如y相依於x可以透露表現成"y ~ x"

辨別這些內建型別對於統計來講是很天然的，因為這些物件在統計上都有分歧的用處與操作體例。可是其他說話是很少會內建這些器械的。

別的，在R的社群問Data Analysis問題的話會比力能獲得謎底，這應當也算是個長處。

這兩種都是Data Analysis經常使用的程式說話，想知道更多的話可以參考以下這幾本O'reilly的書翻譯

所以，以下幾個狀態我會建議先嘗嘗R：

至於Python呢，我的建議是：

快速Prototyping：Python跟其他說話/GUI接合比較輕易，假如要快速做出可展現的系統，用Python較輕易。
分離式處置：若是資料量很大，用Python會比用R更輕易將資料divide & counquer，不外資料假如真的很大，照樣先斟酌一下Hadoop/Mahout比較現實...
只需要使用常見的資料剖析模子時

翻譯社

samantea3fvn0

samantea3fvn0@outlook.com

samantea3fvn0 發表在痞客邦留言(0) 人氣()

E-mail轉寄

samantea3fvn0@outlook.com