自然语言数据是大数据的主要形态之一,每个企业几乎都积存有大量的文字,语音数据,互联网公司有网站上的评论留言论坛帖子,移动运营商有文字短信息,电子商务平台有客服录音,证券公司需要处理大量的上市公司年报资料,IT企业积累了大量的技术文档等等。自然语言处理(NLP)是机器学习当前神秘,红火,具难度,也让引人关注的分支。在搜索引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无可限量的应用。NLP能发挥威力的场景不胜枚举。过去受限于企业的处理能力,面对宝山空手而归,现在随着深度学习技术在NLP中的应用,一大批成熟度高的算法模型应运而生,在NLP几乎所有的子领域都取得巨大突破,现在从深度学习的角度去学习NLP,可谓正逢其时。
第1部份 深度学习知识要览,两小时入门深度学习。
第2部份 自然语言数据是大数据的主要形态,任何企业都需要自然语言处理技术。自然语言处理(NLP)场景概述,两小时入门NLP。深度学习初试牛刀,在推荐系统中结合自然语言处理的应用,一举解决新商品上架时的冷启动问题
第3部份 基于深度学习的语言模型,词向量与embedding。google神器word2vec详解与内幕揭秘,部署和训练word2vec从此一剑走天下,用word2vec轻松实现文本分类,文本相似性判断,文本自动摘要,新闻自动配图
第4部份 集外词怎样求embedding?多种解决方案,中文集外词解决方案,段向量与基于深度学习的情感分析,实际分析长篇大论的影评是好评还是差评?
第5部份 更加复杂的情感分析问题:新浪微博情感倾向性分析,集体情感趋势分析:舆情监控,大企业公关部门和政府管理部门的管控利器
第6部份 LSTM详解,用LSTM解决集外词编码问题,准确率惊人的基于LSTM的命名实体识别解决方案,横扫一切可转化为标注问题的场景
第7部份 Encoder-Decoder-Attention机制,横扫一切“从序列到序列”场景的终极模型,机器翻译,文本自动摘要,聊天机器人等都可归结为此类场景下的问题。谷歌机器翻译技术解读,BBC新闻结合计算机视觉的语音识别(唇语识别)
第8部份 “春天丽日照晴川,十里桃花映满山。燕子呢喃寻旧梦,清风拂面柳如烟”,谁敢相信这是机器写的诗?庖丁解牛剖析“机器湿人”。把生成式对抗网络的思路迁移到自然语言处理(序列处理)场景:SeqGAN,利用SeqGAN创作诗歌,假冒奥巴马演讲词,写贝多芬式的音乐
第9部份 下一个人工智能热点(自然语言处理,爬虫技术,图论算法,图数据库等多项技术的综合应用):知识图谱简介,深度学习用于知识图谱,在文本中用卷积网络和LSTM析取实体之间的语义关系,怎样用知识图谱构建QA系统(聊天机器人)? |