联邦学习算法 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

机器学习课程-温州大学-06深度学习-优化算法

1 2023年04月深度学习-优化算法黄海广副教授 2 01 小批量梯度下降本章目录 02 优化算法 03 超参数调整和BatchNorm 04 Softmax 3 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax 1.小批量梯度下降 4 小批量梯度下降小批量梯度下降（Mini-Batch (?) ?? (?) (同步更新?? ，(j=0,1,...,n )) 5 小批量梯度下降 6 01 小批量梯度下降 02 优化算法 03 超参数调整和BatchNorm 04 Softmax 2.优化算法 7 伦敦温度的例子 days temperature ?1 = 40°F ?2 = 49°F ?3 = 45°F ... ?180 = 60°F (1 − ?)??， ?: = ? − ????， ?: = ? − ????，这样就可以减缓梯度下降的幅度。通常情况下：? = 0.9 11 RMSprop 在第?次迭代中，该算法会照常计算当下mini-batch的微分??，??，所以我会保留这个指数加权平均数，我们用到新符号??? ，而不是??? ，因此??? = ???? + (1 − ?)??2，澄清一下，这个平方的操作是针对这一整个符号的，这样做

0 码力 | 31 页 | 2.03 MB | 1 年前
3
机器学习课程-温州大学-06机器学习-KNN算法

1 2021年04月机器学习-KNN算法黄海广副教授 2 01 距离度量 02 KNN算法本章目录 03 KD树划分 04 KD树搜索 3 01 距离度量 02 KNN算法 03 KD树划分 04 KD树搜索 1.距离度量 4 距离度量欧氏距离(Euclidean distance) ? ?, ? = ෍ =1 ? ( ??)2 10 01 距离度量 02 KNN算法 03 KD树划分 04 KD树搜索 2.KNN算法 11 2.KNN算法 ?近邻法（k-Nearest Neighbor,kNN）是一种比较成熟也是最简单的机器学习算法，可以用于基本的分类与回归方法。算法的主要思路：如果一个样本在特征空间中与?个实例最为相似(即特征空间中最邻近)，那么这对于回归问题：对新的样本，根据其?个最近邻的训练样本标签值的均值作为预测值。 12 2.KNN算法 ?近邻法（k-Nearest Neighbor,kNN）是一种比较成熟也是最简单的机器学习算法，可以用于基本的分类与回归方法。 ?近邻法的三要素： • ?值选择。 • 距离度量。 • 决策规则。 13 2.KNN算法算法流程如下： 1.计算测试对象到训练集中每个对象的距离 2.按照距离的远近排序

0 码力 | 26 页 | 1.60 MB | 1 年前
3
房源质量打分中深度学习应用及算法优化-周玉驰

2019 KE.COM ALL COPYRIGHTS RESERVED 1 周玉驰贝壳找房 - 数据智能中心 - 策略算法部 AI选房中深度学习的实践及优化 2019 KE.COM ALL COPYRIGHTS RESERVED 2 2019 KE.COM ALL COPYRIGHTS RESERVED 2 2019 KE.COM ALL COPYRIGHTS RESERVED 3 自我介绍周玉驰  硕士毕业于中科院  先后就职于华为，百度和医渡云  目前就职于贝壳找房  主要负责两个方向  房源策略算法  房客人关系图谱扫一扫二维码图案，加我微信 2019 KE.COM ALL COPYRIGHTS RESERVED 4 目录  为什么要做AI选房  如何做AI选房  模型演变历程  实践应用  总结&思考 2019 COPYRIGHTS RESERVED 14 模型演变历程 2019 KE.COM ALL COPYRIGHTS RESERVED 15 模型演变历程 v1.0 初版模型系统 v2.0 深度学习模型 v2.0+ 效果持续优化 XGBoost DNN+RNN 特征建设 v1.0 初版模型系统 2019 KE.COM ALL COPYRIGHTS RESERVED 16 v1.0

0 码力 | 48 页 | 3.75 MB | 1 年前
3
Greenplum 排序算法

Greenplum内核揭秘之排序算法 5 ● 内排序算法 ● 外排序算法 ● Greenplum TupleSort ● 排序在Greenplum中的应用 Outline 6 ● 冒泡排序 ● 插入排序 ● 快速排序 ● 堆排序 ● 基数排序内排序算法 7 快速排序是最常用的排序算法，由Tony Hoare在1959年发明。快速排序算法的三个步骤： ● 挑选基准值列分别进行排序快速排序 8 ● 快速排序算法每次选取一个基准元素，将比基准元素小的排到基准元素左边，比基准元素大的排到基准元素的右边，从而将待排序数组分成两个子集。快速排序 6 8 3 2 7 1 7 9 8 7 7 9 6 3 2 1 分治法 9 快速排序 ● 快速排序算法： 10 堆排序是最常用的排序算法，由J.Williams在1964年发明。 ● 堆堆是一种近似完全二叉树的结构，最大值堆要求每个子节点的键值总是小于父节点。最小值堆要求每个子节点的键值总是大于父节点。堆排序算法 ● 步骤1：建立最大值堆,最大元素在堆顶 ● 步骤2：重复将堆顶元组移除并插入到排序数组，更新堆使其保持堆的性质 ● 步骤3：当堆的元素个数为零时，数组排序完毕堆排序 11 ● 建堆堆排序 9 5 8 1 3 6 2 1 2 5 9 8

0 码力 | 52 页 | 2.05 MB | 1 年前
3
机器学习课程-温州大学-08机器学习-集成学习

1 2022年12月机器学习-集成学习黄海广副教授 2 本章目录 01 集成学习方法概述 02 AdaBoost和GBDT算法 03 XGBoost 04 LightGBM 3 1.集成学习方法概述 01 集成学习方法概述 02 AdaBoost和GBDT算法 03 XGBoost 04 LightGBM 4 Bagging 结果进行综合产生最终的预测结果：集成学习模型n …… 模型1 模型2 预测n …… 预测1 预测2 训练数据最终预测结果测试数据 5 Boosting 训练过程为阶梯状，基模型按次序一一进行训练（实现上可以做到并行），基模型的训练集按照某种策略每次都进行一定的转化。对所有基模型预测的结果进行线性综合产生最终的预测结果。集成学习模型n 最终预测预测结果模型2 预测n …… 预测1 预测2 转化模型1 模型3 转化转化训练数据测试数据 6 集成学习模型n …… 模型1 模型2 预测n …… 预测1 预测2 训练数据第二层数据 Stacking 最终预测结果 Stacking 将训练好的所有基模型对训练基进行预测，第j个基模型对第i个训练样本的预测值将作为新的训

0 码力 | 50 页 | 2.03 MB | 1 年前
3
机器学习课程-温州大学-05深度学习-深度学习实践

1 2023年03月深度学习-深度学习实践黄海广副教授 2 01 数据集划分 02 数据集制作 03 数据归一化/标准化 04 正则化 05 偏差和方差本章目录 3 训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。验证集（Validation Set）：也叫做开发集（ Dev 确定的，用来辅助我们的模型的构建，即训练超参数，可选；测试集（Test Set）：为了测试已经训练好的模型的精确度。三者划分：训练集、验证集、测试集机器学习：60%，20%，20%；70%，10%，20% 深度学习：98%，1%，1% （假设百万条数据）数据集划分数据集训练集验证集测试集 4 交叉验证 1. 使用训练集训练出10个模型 2. 用10个模型分别对交叉验证集的样本能够让模型学习到更多更有效的特征，减小噪声的影响。 2.降维即丢弃一些不能帮助我们正确预测的特征。可以是手工选择保留哪些特征，或者使用一些模型选择的算法来帮忙（例如PCA）。 3.正则化正则化(regularization)的技术，保留所有的特征，但是减少参数的大小（magnitude），它可以改善或者减少过拟合问题。 4.集成学习方法集成学习是把多个模型集成在一起，来降低单一模型的过拟合风险。

0 码力 | 19 页 | 1.09 MB | 1 年前
3
机器学习课程-温州大学-05机器学习-机器学习实践

1 2022年02月机器学习-机器学习实践黄海广副教授 2 01 数据集划分 02 评价指标 03 正则化、偏差和方差本章目录 3 01 数据集划分 02 评价指标 1.数据集划分 03 正则化、偏差和方差 4 训练集（Training Set）：帮助我们训练模型，简单的说就是通过训练集的数据让我们确定拟合曲线的参数。确定的，用来辅助我们的模型的构建，即训练超参数，可选；测试集（Test Set）：为了测试已经训练好的模型的精确度。三者划分：训练集、验证集、测试集机器学习：60%，20%，20%；70%，10%，20% 深度学习：98%，1%，1% （假设百万条数据） 1.数据集划分数据集训练集验证集测试集 5 交叉验证 1. 使用训练集训练出k个模型 2. 用k个模型分别对交叉验证集计算得数据不平衡是指数据集中各类样本数量不均衡的情况. 常用不平衡处理方法有采样和代价敏感学习采样欠采样、过采样和综合采样的方法不平衡数据的处理 7 SMOTE(Synthetic Minority Over-sampling Technique)算法是过采样中比较常用的一种。算法的思想是合成新的少数类样本，而不是简单地复制样本。算法过程如图：不平衡数据的处理（a）原始样本（b）选定少类样本

0 码力 | 33 页 | 2.14 MB | 1 年前
3
Hello 算法 1.1.0 Dart版

Hello 算法 Dart 语言版作者：靳宇栋（@krahets）代码审阅：刘玉新（@gvenusleo） Release 1.1.0 2024‑04‑15 序两年前，我在力扣上分享了“剑指 Offer”系列题解，受到了许多读者的鼓励和支持。在与读者交流期间，我最常被问的一个问题是“如何入门算法”。逐渐地，我对这个问题产生了浓厚的兴趣。两眼一抹黑地刷题似乎是最受欢迎的方法，力，啃厚重的书往往变成了一项艰巨的挑战。如果你也面临类似的困扰，那么很幸运这本书“找”到了你。本书是我对这个问题给出的答案，即使不是最优解，也至少是一次积极的尝试。本书虽然不足以让你直接拿到 Offer，但会引导你探索数据结构与算法的 “知识地图”，带你了解不同“地雷”的形状、大小和分布位置，让你掌握各种“排雷方法”。有了这些本领，相信你可以更加自如地刷题和阅读文献，逐步构建起完整的知识体系。我深深赞同费曼教授所言：“Knowledge 网页版以获得更优的阅读体验。推荐语 “一本通俗易懂的数据结构与算法入门书，引导读者手脑并用地学习，强烈推荐算法初学者阅读！” ——邓俊辉，清华大学计算机系教授 “如果我当年学数据结构与算法的时候有《Hello 算法》，学起来应该会简单 10 倍！” ——李沐，亚马逊资深首席科学家计算机的出现给世界带来了巨大变革，它凭借高速的计算能力和出色的可编程性，成为了执行算法与处理数据的理想媒介。无论是电子游戏的逼真画面、自动驾驶的智能决策，还是

0 码力 | 378 页 | 18.45 MB | 1 年前
3
Hello 算法 1.1.0 Go版

Hello 算法 Go 语言版作者：靳宇栋（@krahets）代码审阅：刘代富（@Reanon） Release 1.1.0 2024‑04‑15 序两年前，我在力扣上分享了“剑指 Offer”系列题解，受到了许多读者的鼓励和支持。在与读者交流期间，我最常被问的一个问题是“如何入门算法”。逐渐地，我对这个问题产生了浓厚的兴趣。两眼一抹黑地刷题似乎是最受欢迎的方法，简单、直接力，啃厚重的书往往变成了一项艰巨的挑战。如果你也面临类似的困扰，那么很幸运这本书“找”到了你。本书是我对这个问题给出的答案，即使不是最优解，也至少是一次积极的尝试。本书虽然不足以让你直接拿到 Offer，但会引导你探索数据结构与算法的 “知识地图”，带你了解不同“地雷”的形状、大小和分布位置，让你掌握各种“排雷方法”。有了这些本领，相信你可以更加自如地刷题和阅读文献，逐步构建起完整的知识体系。我深深赞同费曼教授所言：“Knowledge 网页版以获得更优的阅读体验。推荐语 “一本通俗易懂的数据结构与算法入门书，引导读者手脑并用地学习，强烈推荐算法初学者阅读！” ——邓俊辉，清华大学计算机系教授 “如果我当年学数据结构与算法的时候有《Hello 算法》，学起来应该会简单 10 倍！” ——李沐，亚马逊资深首席科学家计算机的出现给世界带来了巨大变革，它凭借高速的计算能力和出色的可编程性，成为了执行算法与处理数据的理想媒介。无论是电子游戏的逼真画面、自动驾驶的智能决策，还是

0 码力 | 383 页 | 18.48 MB | 1 年前
3
Hello 算法 1.1.0 Java版

Hello 算法 Java 语言版作者：靳宇栋（@krahets） Release 1.1.0 2024‑04‑15 序两年前，我在力扣上分享了“剑指 Offer”系列题解，受到了许多读者的鼓励和支持。在与读者交流期间，我最常被问的一个问题是“如何入门算法”。逐渐地，我对这个问题产生了浓厚的兴趣。两眼一抹黑地刷题似乎是最受欢迎的方法，简单、直接且有效。然而刷题就如同玩“扫雷”游戏，自学能力力，啃厚重的书往往变成了一项艰巨的挑战。如果你也面临类似的困扰，那么很幸运这本书“找”到了你。本书是我对这个问题给出的答案，即使不是最优解，也至少是一次积极的尝试。本书虽然不足以让你直接拿到 Offer，但会引导你探索数据结构与算法的 “知识地图”，带你了解不同“地雷”的形状、大小和分布位置，让你掌握各种“排雷方法”。有了这些本领，相信你可以更加自如地刷题和阅读文献，逐步构建起完整的知识体系。我深深赞同费曼教授所言：“Knowledge 网页版以获得更优的阅读体验。推荐语 “一本通俗易懂的数据结构与算法入门书，引导读者手脑并用地学习，强烈推荐算法初学者阅读！” ——邓俊辉，清华大学计算机系教授 “如果我当年学数据结构与算法的时候有《Hello 算法》，学起来应该会简单 10 倍！” ——李沐，亚马逊资深首席科学家计算机的出现给世界带来了巨大变革，它凭借高速的计算能力和出色的可编程性，成为了执行算法与处理数据的理想媒介。无论是电子游戏的逼真画面、自动驾驶的智能决策，还是

0 码力 | 378 页 | 18.47 MB | 1 年前
3

共 973 条前往

页

机器学习课程温州大学 06 深度优化算法 KNN 房源质量打分应用周玉驰 Greenplum 排序 08 集成 05 实践 Hello 1.1 Dart Go Java

分类

语言

格式