动手学深度学习 v2.0
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 537 12.7 参数服务器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540 12.7.1 . . . . . . . . . . . . . . . . . 758 16.4 选择服务器和GPU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 758 16.4.1 选择服务器 . . . . . . . . . . . . . . . . . . . . . . . . 多个输出,并为论坛提供讨论。 虽然我们的体系尚不完善,但这些选择在相互冲突的问题之间提供了一个很好的妥协。我们相信,这可能是 第一本使用这种集成工作流程出版的书。 1 http://distill.pub 2 http://discuss.d2l.ai 2 目录 在实践中学习 许多教科书教授一系列的主题,每一个都非常详细。例如,Chris Bishop的优秀教科书 (Bishop, 2006)0 码力 | 797 页 | 29.45 MB | 1 年前3【PyTorch深度学习-龙龙老师】-测试版202112
Advances in Neural Information Processing Systems 32 (页 8024–8035). Curran Associates, Inc. 检索来源: http://papers.neurips.cc/paper/9015-pytorch-an-imperative-style-high-performance-deep- learning-library Origin 每加 仑燃 油英 里 气缸数 排量 马力 重量 加速度 型号 年份 产地 Auto MPG 数据集一共记录了 398 项数据,我们从 UCI 服务器下载并读取数据集到 DataFrame 对象中,代码如下: import tensorflow as tf from tensorflow import keras import pandas pandas as pd # 在线下载汽车效能数据集 dataset_path = keras.utils.get_file("auto-mpg.data", "http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto- mpg.data") # 利用 pandas 读取数据集,字段有效能(公里数每加仑),气缸数,排量,马力,重量0 码力 | 439 页 | 29.91 MB | 1 年前3《TensorFlow 快速入门与实战》6-实战TensorFlow验证码识别
Turing test to tell Computers and Humans Apart,简称CAPTCHA),俗称验证码,是一种区分用户是 计算机或人的公共全自动程序。在CAPTCHA测试中,作为服务器的计算机会自动生成一 个问题由用户来解答。这个问题可以由计算机生成并评判,但是必须只有人类才能解答。 由于计算机无法解答CAPTCHA的问题,所以回答出问题的用户就可以被认为是人类。 一种常用 FLASK_ENV=development && flask run --host=0.0.0.0 打开浏览器访问测试 URL(http://localhost:5000/ping) 访问 验证码识别服务 $ curl -X POST -F image=@2140.png 'http://localhost:5000/predict' 2140.png 1459.png 6598.png “Hello0 码力 | 51 页 | 2.73 MB | 1 年前3Qcon北京2018-《文本智能处理的深度学习技术》-陈运文
0, 0, 0, 0, 0, 0, 0, 0, 0, … ] [ 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, … ] 服务器 [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, … ] [ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 8651976585, -3.9351148605, 1.3284717798 ] RNN与LSTM RNN LSTM Ref: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ LSTM原理 Ref: http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 1,单元状态丢弃0 码力 | 46 页 | 25.61 MB | 1 年前3Keras: 基于 Python 的深度学习库
Uber, Yelp, Instacart, Zocdoc, Square 等众多网站上使用。它尤其受以深度学习作为产品核心的创业公司的欢迎。 Keras 也是深度学习研究人员的最爱,在上载到预印本服务器 arXiv.org 的科学论文中被提 及的次数位居第二。Keras 还被大型科学组织的研究人员采用,特别是 CERN 和 NASA。 2.3 Keras 可以轻松将模型转化为产品 与任何其他深度学习框架相比,你的 Python shell 并通过下面的命令加载模块 import h5py 快速开始 38 如 果 模 块 导 入 没 有 错 误, 那 么 模 块 已 经 安 装 成 功, 否 则 你 可 以 在 http://docs.h5py.org/en/latest/build.html 中找到详细的安装说明。 模型 39 4 模型 4.1 关于 Keras 模型 在 Keras 中有两类主要的模型:Sequential RemoteMonitor(root='http://localhost:9000', path='/publish/epoch/end/', field='data', headers=None) 将事件数据流到服务器的回调函数。 需要 requests 库。事件被默认发送到 root + '/publish/epoch/end/'。采用 HTTP POST ,其中的 data 参数是以0 码力 | 257 页 | 1.19 MB | 1 年前3微博在线机器学习和深度学习实践-黄波
Serving PS Traing PS Traing Model System Predict Score Sample Data worker worker worker 3 在线机器学习-参数服务器 serving serving serving server server server server server worker worker worker PSscheduler PSserver HA Fault tolerance checkpoint Local HDFS Param Server System Model Serving System 3 在线机器学习-参数服务器 • 参数规模 • 支持百亿特征维度,千亿参数 • 模型版本 • 多模型多版本:多组实验并行执行,提高实验迭代效率 • 在线版本切换:基于ZK的版本感知机制,动态进行版本切换,实现BASE OD),解决数据倾斜导致的流量热点瓶颈问题,性能提升2-5倍 • 存储优化:自定义存储方式(ByRow&ByKey),基于row进行矩阵压缩存储,参数内存占用减少90% 3 在线机器学习-参数服务器 模型验证 离线训练 实时训练 模型训练 模型部署 在线服务 离线验证 在线发布 在线验证 在线一致性/ 模型稳定性/… 一键打包 端口探测 蓝绿部署/灰度发布 AUC/准确率/0 码力 | 36 页 | 16.69 MB | 1 年前3AI大模型千问 qwen 中文文档
openai.api_server --model Qwen/Qwen1.5-7B-Chat 然后,您可以使用 create chat interface 来与 Qwen 进行交流: curl http://localhost:8000/v1/chat/completions -H "Content-Type: application/json" - �→d '{ "model": "Qwen/Qwen1 OpenAI's API key and API base to use vLLM's API server. openai_api_key = "EMPTY" openai_api_base = "http://localhost:8000/v1" client = OpenAI( (续下页) 1.2. 快速开始 5 Qwen (接上页) api_key=openai_api_key, txt │ │ ├── tokenizer_config.json │ │ └── vocab.json 随后你需要运行 python server.py 来启动你的网页服务。请点击进入 `http://localhost:7860/?__theme=dark` 然后享受使用 Qwen 的 Web UI 吧! 1.6.2 下一步 TGW 中包含了许多更多用途,您甚至可以在其中享受角色扮0 码力 | 56 页 | 835.78 KB | 1 年前3李东亮:云端图像技术的深度学习模型与应用
n 峰值时会达到1500 QPS SACC2017 检测-人脸检测/人形检测 场景多样、人脸小、位置边缘 本页图片均来自公开摄像头 SACC2017 检测-人脸检测/人形检测 手机 服务器 可缩小尺寸 240P 720P CPU ARM(千元机) E5-2630 时间 50ms 120ms GPU 2-5ms(K40) SACC2017 图像技术的三个核心难点>>小、快、准 传输、存储压力 多任务串联 GPU服务框架-图像特点 通用计算(Caffe/Tensorflow/Mxnet) SACC2017 GPU服务框架 人形检测 人脸识别 100台-> 10台服务器 300QPS/台(4*k40) 轮询结果 SACC2017 SACC20170 码力 | 26 页 | 3.69 MB | 1 年前3TensorFlow on Yarn:深度学习遇上大数据
⼿动指定机器很繁琐� • 端⼝冲突� • 机器负载不均� TensorFlow使用现状及痛点 • ⼿动分发训练样本� • ⼿动拉取训练模型� TensorFlow使用现状及痛点 • 多⼈多服务器使用混乱,计算资源如何划分?� • 没有GPUs集群资源管理和调度(内存、CPU、GPU、 端⼝),集群资源负载不均� • 训练数据⼿动分发,训练模型⼿动保存� • 进程遗留问题,需要⼿动杀死�0 码力 | 32 页 | 4.06 MB | 1 年前3从推荐模型的基础特点看大规模推荐类深度学习系统的设计 袁镱
算法 1. ⾼性能 2. 效果⽆ 损的优化 � Feature 1(基本特点) � Feature 2(数据的时空 特点) � Feature3(机器学习 的特点) 训练框架—基于参数服务器架构的分布式训练框架 TB级模型 分⽚ 存储/更新 百TB数据 分⽚训练 Feature 1: 动态空间 Feature 2.1:短时间内只有部分item和user 被命中,只有部分参数被⽤到0 码力 | 22 页 | 6.76 MB | 1 年前3
共 48 条
- 1
- 2
- 3
- 4
- 5