第一部份:某企业级大数据应用服务架构演进
1)大数据在企业中的主要应用
2)业务快速迭代背景下对技术的挑战
3)企业级大数据应用服务整体介绍
第二部份:大数据服务高可用设计原则
1)多维度切入高可用架构设计理念
2)可用性评价维度介绍
3)资源隔离保护核心服务
4)流量控制打造柔性可用系统
5)分钟级定位故障以及纠错方案
6)兜底以及回滚、降级减少故障恢复时间
7)常态化的故障演练机制以及容灾方案
第三部份:基于MySQL集群构建可伸缩性存储层
1)数据量以及请求量对查询服务的冲击
2)可伸缩的应对上下游压力的实践
3)读写分离下MySQL的高可用设计
第四部份:基于HBase的支撑百亿级别数据查询(1)
1)hbase入门
2)hbase简单操作
3)hbase架构详解(what and why)
第五部份:基于hbase的支撑百亿级别数据查询(2)
1)hbase核心源码深度剖析
2)hbase优劣势以及技术选型
3)hbase企业级典型应用场景以及较佳实践
第六部份:企业级大数据OLAP介绍
1)OLAP是什么以及常见操作
2)OLAP引擎技术方案选型
第七部份:Kylin离线大数据OLAP引擎解决方案
1)Kylin介绍
2)海量数据较精确去重的实现
3)Kylin的优势以及局限
4)Apache Kylin的应用场景和较佳实践
第八部份:Druid实时大数据分析引擎
1)Druid介绍
2)Druid原理深度剖析
3)Druid应用场景和较佳实践
第九部份:大数据查询服务 统一SQL引擎层
1)为什么需要SQL接口层
2)SQL接口层的技术方案选型
3)基于apache calcite实现标准SQL查询
第十部份:深度挖掘企业大数据价值
1)企业大数据指标体系以及管理策略
2)我们需要收集哪些数据
3)企业大数据应用的痛点
4)讨论一下机器学习的问题域
5)算法工程师们都在做些什么
第十一部份:机器学习算法入门
1)机器学习入门 — 什么是机器学习
2)线性回归算法由浅入深— 麻雀虽小、五脏俱全
3)手把手完成线性拟合数据集实战
第十二部份:用户画像应用介绍
1)比你更了解你,浅谈用户画像
2)用户画像与个性化推荐系统领域
3)用户画像效果实时在线评估策略
第十三部份:竞价广告系统点击率预测算法与实战
1)线性模型logistic回归算法介绍
2)基于线性模型logistic回归的点击率预测实战
3)非线性模型GBDT算法介绍
4)非线性模型GBDT与推荐排序
5)基于AUC值、ROC曲线的模型评价方法 |