数据挖掘是近几年来一个在IT领域非常活跃的实用性技术学科,由于其广泛的应用,极为出彩的实际应用效果,对于各行业几乎都可以无门槛地进行分析和挖掘部署,受到了越来越多的关注。数据挖掘是一门综合学科,它包括了数据库技术、统计学、信息科学、机器学习、可视化、以及其他学科的部分内容。
在互联网行业大行其道的今天,越来越多的传统行业受到了冲击,而在这一切竞争的背后,数据都被认为是能够战胜对手使企业脱颖而出的利器,从数据中学习知识已经是众多大型企业的共识,而在各行业中的领头羊企业的数据挖掘水平也常被称道,如阿里巴巴的大数据挖掘,百度的深度学习等等
数据挖掘工程师作为一个职业,有着非常好的前景和巨大的职位缺口,有志向职位发展的同学急不可急于求成,要扎实地打好基础,学习数据挖掘算法,有一定的行业知识了解,清楚各行业分析过程中更为看重的目标是什么。
第一部份 数据挖掘算法体系与常用挖掘软件
第二部份 K-NN算法与建立模型
第三部份 朴素贝叶斯算法与交叉验证
第四部份 零售行业的客户挖掘
第五部份 教育行业的关联推荐算法
第六部份 医疗主题的聚类算法学习
第七部份 文本挖掘:垃圾邮件检测
第八部份 文本挖掘:语言识别与客户反馈分析
第九部份 基于天体物理学和医疗行业的特征选择和分类学习
第十部份 基于生物医疗行业的建模学习
第十一部份 异常检测和实例选择
第十二部份 元建模学习和特征选择以及参数优化