×

Loading...
Ad by
  • 最优利率和cashback可以申请特批,好信用好收入offer更好。请点链接扫码加微信咨询,Scotiabank -- Nick Zhang 6478812600。
Ad by
  • 最优利率和cashback可以申请特批,好信用好收入offer更好。请点链接扫码加微信咨询,Scotiabank -- Nick Zhang 6478812600。

数据挖掘(data mining)就是用智能计算技术从大量数据中发现潜在规律的过程.

数据挖掘采用的技术主要有两大来源,统计学和人工智能AI. 往下细分,统计学里有很多统计模型;人工智能里有很多算法,比如决策树decision tree, 关联规则,clustering,人工神经网络等. 每种模型/算法有其适用范围和局限性,因此一个实用的数据挖掘应用往往是多种技术的混合.

原则上来说,只要掌握上述技术,用什么编程语言都应该可以实现. 为了效率高,可以采用一些现有的工具或DM软件包/类库. DM商用软件最流行的是SAS和SPSS. 如果要在现有的应用中嵌入DM功能,要看现在的应用采用的什么平台,环境,编程接口,可扩展性等. 另外要看对DM的要求程度高低. Oracle 10g, MS SQL Server 2005都提供了一定的DM功能.如果现有应用中已经在使用这些数据库的话,可以考虑直接调用.
Report

Replies, comments and Discussions:

  • 工作学习 / 学科技术讨论 / 数据挖掘需要些什么技能? 是编程? 如果要在现有应用中加入数据挖掘功能,有什么主流产品可供选择?
    • 看是什么数据,也看你想挖什么。总的来说有两样技能可能有用,一是统计学, 二是visulaization.
      • 通常做数据挖掘会使用什么工具?
        • 我现在是没有用工具,自己编程。用一些数据处理工具包,我用Python, 所以用SciPy. 还有一些绘图工具。
    • 数据挖掘(data mining)就是用智能计算技术从大量数据中发现潜在规律的过程.
      数据挖掘采用的技术主要有两大来源,统计学和人工智能AI. 往下细分,统计学里有很多统计模型;人工智能里有很多算法,比如决策树decision tree, 关联规则,clustering,人工神经网络等. 每种模型/算法有其适用范围和局限性,因此一个实用的数据挖掘应用往往是多种技术的混合.

      原则上来说,只要掌握上述技术,用什么编程语言都应该可以实现. 为了效率高,可以采用一些现有的工具或DM软件包/类库. DM商用软件最流行的是SAS和SPSS. 如果要在现有的应用中嵌入DM功能,要看现在的应用采用的什么平台,环境,编程接口,可扩展性等. 另外要看对DM的要求程度高低. Oracle 10g, MS SQL Server 2005都提供了一定的DM功能.如果现有应用中已经在使用这些数据库的话,可以考虑直接调用.
    • 同意楼上. 如果是想学一门技能, 可以溜溜狗, 找本书, 看看原理, 常用工具; 如果是工作中要用, 就得结合现有的DB,工具, 和理念. 我工作过的一个公司, 有个专门的DM组, 组员资格都不低, 成天就是把几个DB里的东西往一起攒攒, 把行和列换换算算 再做个报表, 看看有没有规律.