数据挖掘实训总结
数据挖掘是现代兴起的技术,它被广泛地应用于各种行业中,如零售业、银行、电信等等。通过学习数据仓库与数据挖掘技术这一门课程,我基本掌握了数据挖掘的概念、功能、算法、模型的构建。当然,这些只是理论知识,更多的收获在于实训过程。
在实训中,我们借用相应的软件,构建数据挖掘模型。我们主要学习了决策树模型、贝分类器两种模型的构建及分析。通过自己动手,把理论用于实践中,懂得决策树和贝分类的区别、两者的优缺点。更重要的是我们能够更深入地掌握了决策树的ID3算法。这个算法能够普遍的用于企业的数据分析。同时,关联规则算法也很重要。关联规则就是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。在关联规则算法中,主要侧重于置信度和支持度。置信度和支持度的计算并不是很复杂,而我们也知道在一些县城、乡镇的超市或者是小型零售店,他们很少拥有技术人员运用软件来构建模型分析,但关联规则算法对于他们来说是可以实现且非常有用的。我觉得如果我以后开店做生意,我也会用关联算法来分析我的客户需求。