第一部份:Spark Streamin深度源码剖析(上)
(1)Spark Streaming整体架构剖析
(2)基于Receiver+Kafka接收数据的源码剖析
(3)基于DStream生成RDD的源码剖析
(4)基于JobGenerator生成Job的源码剖析
第二部份:Spark Streaming深度源码剖析(下)
(1)Spark Streaming Driver容错的源码剖析
(2)Spark Streaming Executor容错的源码剖析
(3)Spark Streaming State相关操作的源码剖析
(4)Spark Streaming Window相关操作的源码剖析
第三部份:互联网公司用户流量实时大盘实战
(1)互联网用户流量分析业务介绍
(2)互联网用户流量分析架构设计:Spark Streaming+Kafka+HBase
(3)完成互联网用户流量指标体系的开发
(4)实时计算作业上线运维:部署、代码升级以及监控
(5)对Spark Streaming作业进行初步的性能优化
(6)基于前端展示用户流量分析大盘
第四部份:广告系统实时数据平台架构实战(上)
(1)广告系统实时数据平台的业务介绍以及架构设计
(2)完成广告用户与客户价值的实时数据指标体系开发
(3)完成广告运营与营销活动的实时数据指标体系开发
(4)基于广告实时数据支持的点击率预测
(5)基于广告实时数据支持的精准广告营销
第五部份:广告系统实时数据平台架构实战(下)
(1)广告系统实时数据平台架构优化设计
(2)基于Spark Streaming checkpoint实现全流程的容错机制
(3)基于Spark Streaming实现全流程的exatcly once语义
(4)基于Kafka实现数据不丢失的技术方案
(5)基于前端页面展示广告数据分析
第六部份:微博热点话题实时探测系统架构实战(上)
(1)微博热点话题探测业务介绍
(2)微博热点话题探测系统架构设计
(3)基于Flume+Kafka完成实时微博数据的接入
(4)自己动手改进FP-Growth频繁集挖掘算法
(5)基于改进后的繁集挖掘算法完成热点话题的实时探测
第七部份:微博热点话题实时探测系统架构实战(下)
(1)基于Spark自己动手实现word2vec算法
(2)基于自己实现的Spark word2vec算法实现关联热点话题挖掘
(3)基于Spark Streaming完成实时计算作业开发
(4)基于前端页面展示微博热点话题
第八部份:微博社交关系实时挖掘平台实战(上)
(1)微博社交关系实时数据分析平台业务介绍以及架构设计
(2)Titan分布式图数据库介绍
(3)Cassandra分布式NoSQL数据库介绍
(4)Elasticsearch分布式搜索引擎介绍
(5)基于Spark Streaming+GraphX+Titan完成微博社交关系挖掘
第九部份:微博社交关系实时挖掘平台实战(下)
(1)基于Spark Streaming+文本挖掘完成微博用户的情感分析
(2)基于Spark Streaming完成微博用户群分析
(3)基于Spark Streaming完成用户城市地图分析
(4)基于Spark Streaming完成热门话题趋势分析
(5)基于前端页面展示微博社交数据
第十部份:股票交易分析实时大盘系统实战
(1)股票分析业务介绍
(2)实时股票分析大盘系统架构设计
(3)Druid分布式OLAP引擎介绍
(4)结合Spark Streaming + Druid完成股票数据实时分析
(5)结合Spark Streaming完成实时热门股票排行
(6)结合Spark Streaming完成实时股票走势预测
(7)基于前端页面展示股票分析数据
第十一部份:实时用户画像系统架构实战
(1)实时用户画像组成分析
(2)实时用户画像的标签数据字典
(3)实时用户画像的兴趣度模型
(4)基于Spark Streaming实现一套实时用户画像系统
(5)基于ElasticSearch对实时用户画像数据进行分析
第十二部份:实时个性化推荐系统架构实战(上)
(1)基于Flume+Kafka实现用户行为的实时采集与清洗
(2)基于实时用户画像构建数据仓库
(3)针对元数据库构建实时索引
(4)基于Spark Streaming完成第一个版实时个性化推荐系统
第十三部份:实时个性化推荐系统架构实战(下)
(1)基于频繁模式的选择性集成分类算法
(2)基于选择性集成分类算法和网页对用户进行分类以及兴趣组构建
(3)基于Spark Streaming+协同过滤算法实现的实时推荐系统
(4)基于相关性算法实现的实时个性化推荐冷启动优化方案
|