作者:
NCKUer (NCKUer)
2017-10-18 09:03:09※ 引述《rosenzulu (玫瑰祖魯)》之銘言:
: 大數據
: 最近被媒體使用到爛掉的名詞
: 常常看到新聞「大數據顯示...」
: 身為統計系的我 也稍微爬文瞭解一下
: 大數據的魅力所在
: 但看到的不外乎是
: 「未來產業大宗就是AI、物聯網與大數據的結合」
: 「運用大數據分析得到相關 進一步得知未來趨勢作為政策」
: 但如果是要探討相關性、做預測
: 使用統計方法不是也可以嗎?
: 再查一些大數據最夯的課程
: 幾乎都是R,Python這2個程式語言
: 然後使用該2語言實作資料探勘、機器學習
: 實在搞不懂大數據的新科技點在哪裡
: 有沒有產業界大數據大師可出來為小弟解惑?
完全不一樣的兩個東西
大數據有三個限定 不是任何的數據分析都可以叫做大
Volume容量、Velocity速度、Variety多樣性 總共三個V
不符合以上三者任何一項都不該叫大數據
大數據跟統計不同 統計不適處理變量太多的分析 表會畫不完
統計是給人做實驗和檢定的 實驗前要先定義各項因變數和對應變數 檢定也要有
大數據沒有這些東西 直接丟進去就給你結果
大數據的使用完完全全不需要統計基礎 你只要會寫程式就行了
甚至根本不需要寫程式 只需要會用、會輸入即可
例如分群 這些東西用統計的說法講不通的
商管也有很多工具也一樣是統計講不通的 並不是只有大數據有這個問題 例如田口方法
田口當時會流行就是因為他有避開統計繁瑣的優勢
沒有統計基礎一樣可以解決很多問題
商管、化學、生物實驗比較適合統計 不適合大數據
因為實驗和問卷沒辦法做那麼多份
大數據根本不需要統計基礎 就算你有統計基礎也講不通大數據裡面的很多工具
例如distribution、confidence 這些基本統計的模型在很多大數據的工具裡常常看不到
總之 就算你學完統計也不知道大數據在幹嘛 完全是兩碼子事
隨便舉個例子 非監督式學習、監督式學習 裡面一大堆都跟統計扯不上邊
類神經呢? 也不符統計模型 機器學習更不說了 neuron根本不是統計的東西
作者:
xzcb2008 (éžå¸¸æ£®77牛)
2017-10-18 09:06:00ncku沒資格說大數據
作者: NVCat (在下魯宅) 2017-10-18 09:09:00
不知道在亂講什麼 快笑死
深度學習就算了 機器學習跟統計扯不上邊?你還是回去套tool吧就連kmeans cluster背後都有統計了
分群的好壞就須透過統計學判斷Cluster的聚集性了
作者:
tas001 (演奏夢想之夜)
2017-10-18 09:17:00其實就in time與否的最大差異
作者: NVCat (在下魯宅) 2017-10-18 09:17:00
"分析"跟機器學習混為一談 文不對題ML跟統計無關 貽笑大方 有多少ML的方法都是基於統計發展的
作者:
flac (老獅子)
2017-10-18 09:18:00受教了,謝謝
作者:
sam7207 (三畝)
2017-10-18 09:18:00...你知道每個模組(套件)後面都是一連串的公式 跟 統計嗎
只要有透過整理資料 整理分析然後解釋就是統計範疇了
以kmeans來說你的起始群心會決定你的最終分群結果
只是方式不一樣 誰說統計一定要你說的這樣才叫統計?
作者:
tkigood (提谷德)
2017-10-18 09:19:00ML跟統計無關 嗚噗噗噗噗
kmean有保證每次迭帶不會比上次差 這裡的證明要用資
作者:
sam7207 (三畝)
2017-10-18 09:20:00你以為 數據丟進去 繃繃繃 就出來結果...是大數據XD?
kmean保證每次迭代不會比上次差 這裡的證明要用資訊
作者:
pierreqq (葉子上的風)
2017-10-18 09:20:00把大數據跟類神經混在一起就成了AI了...
作者: whcat 2017-10-18 09:21:00
妳絕對要強調 妳是自學 不然人家會誤以為ncku教授素質低落
作者:
sam7207 (三畝)
2017-10-18 09:21:00最小化組間差距....嗯..你查查組間差距 這概念是怎麼來的好了..
作者:
pierreqq (葉子上的風)
2017-10-18 09:21:00這是最近AI人的新論點...不知帶不帶的起來
作者:
sam7207 (三畝)
2017-10-18 09:22:00ncku .... uccu
唉.. 半瓶水響叮噹。哪個ML的TOOL背後不是統計背書的
作者:
soem (æµæ°´)
2017-10-18 09:23:00長見識了,原來NCKU是這樣教學的……
作者:
DIDIMIN ( )
2017-10-18 09:23:00簡單的類神經說穿了只是非線性轉換的迴歸分析
作者:
redsa12 (哈吉米)
2017-10-18 09:27:00噗噗 監督式學習跟統計無關?
作者: NVCat (在下魯宅) 2017-10-18 09:32:00
你就老實講 你是來黑NCKU的吧
作者:
mingchei (mingchei)
2017-10-18 09:34:00現在哪個資料沒有三個大V?
作者:
Joker3 (丑角3)
2017-10-18 09:37:00靠杯 推玟一堆半瓶水在那邊吵 我真的笑出來
作者: Kazimir (Kazimir) 2017-10-18 09:50:00
一件事情可以用數學的觀點來理解 不代表這件事情叫數學
作者:
patentstm (暖暖苗圃沒有樹...)
2017-10-18 09:50:00原po跟推文看似沒歷練過統計與BD>......