超大规模深度学习在美团的应用-余建平
PaddlePaddle、XDL,etc. 内部: Abacus、XPS, etc. • Online Learning的价值 用户的近期行为,更能表现意图和偏好 增强新item的模型感知能力 • 更快数据反馈、更少资源消耗 分钟级的数据反馈 增量训练、避免batch重训带来的资源消耗 关于Online Learning MLX的模型能力 • 支持千亿级特征、千亿级样本 • 支持计算图模式,模型结构灵活多样 AUC、Loss、MAE、RMSE 支持外部eval工具,计算MAP、NDCG MLX的模型能力 • 提供离线、近线、在线全流程解决方案,各阶段提供扩展方案,降低算法迭代成本; • 支持Online Learning,提供从近线到在线的模型数据通路; • 提供从召回到排序全流程的模型解决方案,为业务提供最佳实践; • 提供系统的平台化工具,为用户提供易用的界面操作; MLX模型能力 Request 流式模型的通路 • 持久化存储 本地disk存储,持久化对齐kafka的数据 • PS快速failover Compaction机制,降低load数据量 • Online Learning对数据流的要求 不重不丢:重复的数据会使模型有偏,数据的缺失 会使模型丢失重要信息 数据有序性:数据乱序会导致样本穿越的现象 • Log Join框架 双流拼接框架,通过组合方式支持多流拼接0 码力 | 41 页 | 5.96 MB | 1 年前3搜狗深度学习技术在广告推荐领域的应用
领域特征 模型训练 查询日志 点击日志 查询特征 广告特征 匹配特征 线性模型 非线性模型 Data Feature Model 线上Server CTR预估 Rank Online 特征抽取 CTR预估涉及技术 CTR预估 数据 模型 平台 MPI XgBoost Parameter Server 线性(LR) 非线性(GBDT) 深度(DNN) Ctr特征/模 型中间结果 DNN Train Feature Maker One Case ALL One Hot 特征 Final CTR Bidding Server OFFLINE ONLINE OneHot Float LR Model DNN Model Retriever Server CTR Table DNN Model Feature LR0 码力 | 22 页 | 1.60 MB | 1 年前3keras tutorial
Keras provides a special module, datasets to download the online machine learning data for training purposes. It fetches the data from online server, process the data and return the data as training the keras dataset module. Line 3 calls the load_data function, which will fetch the data from online server and return the data as 2 tuples, First tuple, (x_train, y_train) represent the Keras0 码力 | 98 页 | 1.57 MB | 1 年前3Lecture 3: Logistic Regression
Regression September 20, 2023 2 / 29 Classification Classification problems Email: Spam / Not Spam? Online Transactions: Fraudulent (Yes/No)? Tumor: Malignant/Benign? The classification result can be represented0 码力 | 29 页 | 660.51 KB | 1 年前3亚马逊AWSAI Services Overview
analysis Netflix • Recommendation engine Pinterest • Image recognition search Fraud.net • Detect online payment fraud DataXu • Leverage automated & unattended ML at large scale (Amazon EMR + Spark)0 码力 | 56 页 | 4.97 MB | 1 年前3从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱
更基础的复杂模型,场景的快速适应 � 多场景建模 � 端云⼀体的协同 推荐技术 [KDD2020] DCAF: A Dynamic Computation Allocation Framework for Online Serving System � 推荐全链路⾃适应 � 统⼀建模,根据请求量削峰填⾕,资源利⽤最⼤化 [ijcai2021] UNBERT: User-News Matching BERT0 码力 | 22 页 | 6.76 MB | 1 年前3Keras: 基于 Python 的深度学习库
None, 默认为 K.epsilon(). • decay: float >= 0. 每次参数更新后学习率衰减值. 引用 • Adaptive Subgradient Methods for Online Learning and Stochastic Optimization 优化器 OPTIMIZERS 141 9.2.4 Adadelta [source] keras.optimizers0 码力 | 257 页 | 1.19 MB | 1 年前3动手学深度学习 v2.0
,我们会得到奖励 或损失。许多实际问题都属于这一类。例如,我们需要预测明天的股票价格,这样我们就可以根据这个预测 进行交易。在一天结束时,我们会评估我们的预测是否盈利。换句话说,在在线学习(online learning)中, 我们有以下的循环。在这个循环中,给定新的观测结果,我们会不断地改进我们的模型。 model ft −→ data xt −→ estimate ft(xt) −→ observation [Duchi et al., 2011] Duchi, J., Hazan, E., & Singer, Y. (2011). Adaptive subgradient methods for online learn‐ ing and stochastic optimization. Journal of Machine Learning Research, 12(Jul), 2121–2159 arXiv:1412.6980. [Kolter, 2008] Kolter, Z. (2008). Linear algebra review and reference. Available online: http. [Koren, 2009] Koren, Y. (2009). Collaborative filtering with temporal dynamics. Proceedings0 码力 | 797 页 | 29.45 MB | 1 年前3
共 8 条
- 1