一,數據師(Datician['detɪʃən])一般特指數據分析師和數據挖掘工程師,以下是兩者的區別:
1、“數據分析”的重點是觀察數據,而“數據挖掘”的重點是從數據中發現“知識規則”KDD(Knowledge Discover in Database);
2、“數據分析”得出的結論是人的智慧型活動結果,而“數據挖掘”得出的結論是機器從學習集(或訓練集、樣本集)發現的知識規則;
3、“數據分析”得出結論的運用是人的智力活動,而“數據挖掘”發現的知識規則,可以直接套用到預測。
4、“數據分析”不能建立數學模型,需要人工建模,而“數據挖掘”直接完成了數學建模。如傳統的控制論建模的本質就是描述輸入變數與輸出變數之間的函式關係,“數據挖掘”可以通過機器學習自動建立輸入與輸出的函式關係,根據KDD得出的“規則”,給定一組輸入參數,就可以得出一組輸出量。
5.相對而言,數據挖掘工程師對統計學,機器學習等技能的要求比數據分析師高得多。
6. 很多情況下,數據挖掘工程師同時兼任數據分析師的角色。
二,數據科學家(Daticist)與數據師(Datician)的區別和聯繫:
數據科學家更多關注的是新算法的開發(發明輪子),而數據師更多關注的是算法的運用(使用輪子)。
在企業中當數據師(主要是數據挖掘建模師)發現現有算法不能滿足其需求時可能會自行開發新算法( 也可能求助於數據科學家),因此很多情況下數據師同時也承擔了數據科學家的角色。
Datician['detɪʃən]:Dat(a)數據+Ician精通**的人,即數據師。