pdf文档 微博在线机器学习和深度学习实践-黄波

16.69 MB 36 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档阐述了微博在在线机器学习和深度学习实践中的经验,包括推荐场景的构建、在线机器学习模型的应用效果、深度学习模型的选择与优化。微博自2008年起逐步构建了包括Hadoop、大数据、机器学习等技术体系,2019年实现了在线深度学习。平台架构涵盖了数据计算、模型训练、特征工程等核心环节,确保了高效的模型开发与部署。通过在线FM模型和DeepFM模型的应用,微博在推荐系统中取得了显著的效果提升,相关指标较离线模型提升5%-8%。
AI总结
以下是对文档《微博在线机器学习和深度学习实践-黄波》的总结,重点突出核心观点和关键信息,语言简洁明了,逻辑连贯: --- ### 目录 1. **推荐篇** - **推荐场景**:微博的推荐场景包括关注/兴趣、分发/推荐、生产/传播等,涉及普通用户、优质用户、优质内容和潜力内容的挖掘与分发。 - **在线机器学习**: - 在线FM模型相比离线FM,相关指标提升了5%+。 - 增量在线FM(基于离线模型初始化)提升了8%+。 - 特征深度化:采用特征Embedding,模型深度化:引入Wide&Deep、DeepFM等深度学习模型。 - **深度学习**: - 物料粗排:基于Item2vec的特征向量化和向量索引(FM/FFM/DSSM)。 - 物料精排:结合DIN/DIEN/TDM模型,融入用户近期互动行为。 - 多目标优化:点击FM+互动FM,排序损失为DeepFM+Pair-Wise Rank Loss。 - 单目标排序:从LR到W&D、FM、DeepFM的排序优化。 2. **平台篇** - **平台背景**:微博的技术发展里程碑包括: - 2008年:Hadoop - 2009年:微博Feed - 2011年:开放平台 - 2013年:大数据 - 2015年:机器学习 - 2016年:机器学习平台 - 2017年:大规模机器学习 - 2018年:深度学习平台 - 2019年:在线深度学习 - **平台架构**:微博机器学习平台包括以下模块: - **数据/特征**:特征生成、存储与服务。 - **样本库**:正样本(曝光有互动)与负样本(曝光无互动)。 - **模型训练/评估**:基于WeiFlow的模型训练与评估。 - **模型服务**:推荐引擎与模型服务。 - **算法/模型**:涵盖PS/WeiPS、IDE(WeiIDE)等开发套件。 - **控制中心**:实时计算与特征计算。 - **平台效果**: - 成本与效率:平台化建设使业务A和业务B的开发效率提升明显,特征工程与模型开发更加高效。 - 实验数据:在线FM模型效果优于离线FM,增量在线FM进一步提升了效果。 3. **总结篇** - **微博技术里程碑**:从Hadoop到在线深度学习,微博在技术发展上不断迭代,尤其是在机器学习与深度学习领域取得了显著成果。 - **微博业务生态**: - 内容生产与传播:包括优质内容的生成与用户兴趣的挖掘。 - 用户与内容的互动:通过AI技术提升内容分发与推荐的精准度。 - 优质用户与潜力用户的关系拓展:通过AI算法挖掘与分析,实现内容的高效分发与用户需求的满足。 --- ### 核心观点 1. 微博在推荐系统中广泛应用了在线机器学习和深度学习技术,显著提升了推荐效果。 2. 微博技术平台的建设 (如WeiFlow、WeiIDE等) 提高了业务开发效率,实现了特征工程与模型开发的规范化与高效化。 3. 微博的业务生态涵盖了内容生产、分发、用户互动等多个环节,AI技术在其中发挥了重要作用。 通过以上总结,可以全面了解微博在机器学习与深度学习领域的实践与成果。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 24 页请下载阅读 -
文档评分
请文明评论,理性发言.