华为云深度学习在文本分类中的实践-李明磊
华为云深度学习在文本分类中的实践 华为 Cloud&AI 李明磊 3 2 3 1 4 分类 算法 简史 深度 学习 架构 难点 应用 案例 目录 4 文本分类介绍 内容: 买没几天就降价一点都不开心,闪存跑分就五百多点点 --- 外观漂亮音质不错,现在电子产品基本上都是华为的了 --- 汽车不错,省油,性价比高 --- 这个政策好啊,利国利民 --- f(text)=label 词 句子 篇章 对话 5 文本分类方法简史-机器学习 特征提取 特征选择 输入 文本 模型训练 模型部署 评测 label 预测标签 词袋 TFIDF Ngram 词典 … 卡方 PCA 互信息 RFE … 分类器 SVM LR XGBoost 随机森林 … 6 文本分类方法简史-深度学习 输入 文本 模型训练 模型部署 评测 label label 预测标签 RNN CNN LSTM DCNN Attention HAN Transformer Elmo BERT MT-DNN 7 文本分类方法简史-深度学习 神经网络 语言模型 2003 神经网络NLP里程碑: Word2vec 2013 CNN RNN 2014左右 Attention 2014 Elmo, Bert 2018 解决维度灾难0 码力 | 23 页 | 1.80 MB | 1 年前3Qcon北京2018-《文本智能处理的深度学习技术》-陈运文
达观数据 陈运文 文本智能处理的深度学习技术 达观数据CEO 陈运文 博士 • 中 国 计 算 机 学 会 高 级 会 员 , A C M 和 I E E E 学 会 会 员 , 复 旦 大 学 计 算 机 博 士 和 杰 出 毕 业 生 • 原 腾 讯 文 学 高 级 总 监 、 盛 大 文 学 首 席 数 据 官 、 百 度 核 心 技 术 工 程 师 • 三 十 项 国 家 技 术 挖 掘 技 术 和 相 关 应 用 系 统 的 服 务 个人简介——达观数据CEO 陈运文 达观数据:全球领先的文本智能处理专家 l 为企业提供文本挖掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服 务,是国内首家将自动语义分析技术应用于企业数据化运营的人工智能公司 专注于文本挖掘的国际领军人工智能企业 l 获得全球三十大最佳AI企业等荣誉,拥有国家级高新技术企业、CMMI3资质认 证 全 l 覆盖金融、制造、法律、电商、传媒等行业,提升企业文档自动化处理能力 为数百家中国知名客户提供完善的文本智能处理服务 01 文本智能处理背景简介 7 文本 语音 图像 人工智能 Voice Image Text 达观专注于人工智能中的文本处理细分领域 文本处理任务 什么是NLP 概念:Natural Language Processing 自然语言处理 目的0 码力 | 46 页 | 25.61 MB | 1 年前3使用适用于 Mac 的 VMware View Client 2012 年 5 月
断开桌面或从桌面注销 11 从主屏幕移除 View 服务器的快捷方式 11 回滚桌面 12 在 Mac 上使用 Microsoft Windows 桌面 12 功能支持表 12 国际化 13 复制和粘贴文本和图像 13 排除 View Client 故障 13 重置桌面 13 卸载 View Client 14 索引 15 VMware, Inc. 3 使用适用于 Mac 的 VMware 体系结构规划指南》文档。 国际化 View Client 的用户界面和文档提供英文、日文、法文、德文、简体中文和韩文版本。 复制和粘贴文本和图像 如果管理员已启用此功能,您可以在远程 View 桌面和客户端系统之间或两个 View 桌面之间复制和粘贴格式 化文本和图像。但会有一些限制。 如果使用 PCoIP 显示协议和 View 5.x 或更高版本的 View 桌面,您的 View 管理员便可以设置该功能,以便只 支持的文件格式包括文本、图像和 RTF(富文本格式)。剪贴板可以容纳 1 MB 的复制和粘贴操作数据。如果 要复制格式化文本,部分数据是文本,部分数据是格式化信息。例如,复制一个 800 KB 的文件时可能会使用 超过 1 MB 的数据,因为可能会有超过 200 KB 的 RTF 数据被放在剪贴板中。 如果要复制大量格式化文本或文本和图像,当您尝试粘贴文本和图像时,可能会看到部分或全部内容为纯文本, 而没0 码力 | 16 页 | 742.04 KB | 1 年前3使用适用于 Mac OS X 的 VMware View Client 2012 年 3 月
注销或断开桌面连接 11 从主屏幕移除 View 服务器的快捷方式 11 回滚桌面 12 在 Mac 上使用 Microsoft Windows 桌面 12 功能支持表 12 国际化 13 复制和粘贴文本和图像 13 排除 View Client 故障 13 重置桌面 13 卸载 View Client 14 索引 15 VMware, Inc. 3 使用适用于 Mac OS X 的 体系结构规划指南》文档。 国际化 View Client 的用户界面和文档提供英文、日文、法文、德文、简体中文和韩文版本。 复制和粘贴文本和图像 如果管理员已启用此功能,您可以在远程 View 桌面和客户端系统之间或两个 View 桌面之间复制和粘贴格式 化文本和图像。但会有一些限制。 如果使用 PCoIP 显示协议和 View 5.x 或更高版本的 View 桌面,您的 View 管理员便可以设置该功能,以便只 支持的文件格式包括文本、图像和 RTF(富文本格式)。剪贴板可以容纳 1 MB 的复制和粘贴操作数据。如果 要复制格式化文本,部分数据是文本,部分数据是格式化信息。例如,复制一个 800 KB 的文件时可能会使用 超过 1 MB 的数据,因为可能会有超过 200 KB 的 RTF 数据被放在剪贴板中。 如果要复制大量格式化文本或文本和图像,当您尝试粘贴文本和图像时,可能会看到部分或全部内容为纯文本, 而没0 码力 | 16 页 | 738.09 KB | 1 年前3适用于Mac的View Client 2012 年 9 月
断开桌面或从桌面注销 14 从主屏幕移除 View 服务器的快捷方式 15 回滚桌面 15 在 Mac 上使用 Microsoft Windows 桌面 16 功能支持表 16 国际化 16 复制和粘贴文本和图像 16 PCoIP 客户端映像缓存 17 排除 View Client 故障 17 重置桌面 17 卸载 View Client 18 索引 19 VMware, Inc. 3 desktopProtocol=PCoIP。 domainName 与连接至 View 桌面的用户相关联的域。 vmware-view URI 示例 您可以使用 vmware-view URI 方案创建超文本链接或按钮,并将这些链接包含在电子邮件或网页中。最终用户 可以点击这些链接来执行一些操作,例如,通过指定的启动选项启动特定 View 桌面。 URI 语法示例 在每个 URI 示例后,会有一项关于最终用户在点击 mycompany.com/Finance%20Desktop?desktopProtocol=PcoIP View Client 启动并连接至 view.mycompany.com 服务器。在登录框中,用户名文本框中填充了 fred 名称。 用户必须提供域名和密码。成功登录后,客户端会连接至显示名称为财务桌面的桌面,而用户则登录到客 户机操作系统。此连接使用 PCoIP 显示协议。 4 vmware-view://fred@view0 码力 | 20 页 | 823.40 KB | 1 年前3OpenShift Container Platform 4.2 Service Mesh 的安装、使用和发行注记信息
有效的位置设置为 BannerTop、BannerBottom 和 BannerTopBottom。 4. 点 Create 以应用您的更改。 5.7. 自定义 CLI 下载 您可以使用自定义链接文本和 URL 来配置用于下载 CLI 的链接。它们可以直接指向软件包的文件或提供 软件包的外部页面。 先决条件 先决条件 您必须具有管理员特权。 流程 流程 1. 进入 Administration 控制台中快速启动的自定义 资源(CR)中。 8.4.2.1. conclusion 元素 元素 查 查看 看 YAML 文件中的 文件中的 conclusion 元素 元素 conclusion 文本 在 在 web 控制台中 控制台中查 查看 看 conclusion 元素 元素 最后会出现在快速开始的最后部分。 $ oc explain consolequickstarts ... summary: Web 控制台 控制台 26 1 8.4.2.2. description 元素 元素 查 查看 看 YAML 文件中的 文件中的 description 元素 元素 description 文本 在 在 web 控制台中 控制台中查 查看 看 description 元素 元素 这个描述会出现在快速开始 快速开始页的介绍中。 apiVersion: console.openshift0 码力 | 44 页 | 651.51 KB | 1 年前3AI大模型千问 qwen 中文文档
针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 • 基础模型和聊天模型都支持多种语言; • 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 等; 想了解更多信息,欢迎访问: • 博客 • GitHub • Hugging Face • ModelScope • Qwen1.5 Collection max_new_tokens 参数则用于设置响应的最大长度。此 外,通过 tokenizer.batch_decode() 函数对响应进行解码。关于输入部分,上述的 messages 是一个 示例,展示了如何格式化对话历史记录和系统提示。默认情况下,如果您没有指定系统提示,我们将直接使 用 You are a helpful assistant. 作为系统提示。 1.3.2 流式输出 借助 TextStreamer max_new_tokens=512, streamer=streamer, ) 除了使用 TextStreamer 之外,我们还可以使用 TextIteratorStreamer ,它将可打印的文本存储在一 个队列中,以便下游应用程序作为迭代器来使用: # Repeat the code above before model.generate() # Starting here, we add0 码力 | 56 页 | 835.78 KB | 1 年前3OpenShift Container Platform 4.10 虚拟化
工具和 VIRTCTL GUESTFS libguestfs 工具可帮助您访问和修改虚拟机 (VM) 磁盘镜像。您可以使用 libguestfs 工具查看和编辑客户 机中的文件、克隆和构建虚拟机,以及格式化和调整磁盘大小。 您还可以使用 virtctl guestfs 命令及其子命令在 PVC 上修改、检查和调试虚拟机磁盘。要查看可能子命 令的完整列表,请在命令行中输入 virt- 并按 Tab 键。例如: openshift 前缀的现有命名空间。 从 web 控制台创建虚拟机时,请选择配置了引导源的虚拟机模板。具有引导源的虚拟机模板标记为 Available boot source,或者它们显示自定义标签文本。使用有可用引导源的模板可促进创建虚拟机的过 程。 没有引导源的模板被标记为 Boot source required。如果完成了向虚拟机中添加引导源的步骤,您可以使 用这些模板。 重要 重要 创建虚拟机的过程。红帽虚拟机模板会预先配置 操作系统镜像、操作系统的默认设置、flavor(CPU 和内存)以及工作负载类型(server)。当模板配置为 使用引导源配置时,会使用自定义标签文本或者默认标签文本 Available boot source 进行标记。这些模 板可用于创建虚拟机。 您可以从预配置的模板列表中选择模板,查看设置并使用Create virtual machine from0 码力 | 307 页 | 3.45 MB | 1 年前3OpenShift Container Platform 4.8 日志记录
发行注 行注记 记 11 在此次更新之前,使用 oc edit 编辑 Collector 配置非常困难,因为它对空格的使用不一致。这个 更改引入了在 Operator 更新前对配置进行规范化和格式化的逻辑,以便使用 oc edit 轻松编辑配 置。(LOG-2319) 在此次更新之前,FluentdNodeDown 警报无法正确在 message 部分中提供实例标签。在这个版 本中,通过修复 日志。您还可以 将它们存储在默认日志存储中,将它们转发到第三方系统,并查询和视觉化存储在默认日志存储中的 存储日志。 日志 日志记录 记录收集器 收集器 日志记录收集器从集群收集日志,对其进行格式化,并将它们转发到日志存储或第三方系统。 日志存 日志存储 储 日志存储用于存储聚合的日志。您可以使用默认的 Elasticsearch 日志存储,或将日志转发到外部日志 存储。默认日志存储经过优化并测试以进行简短存储。 志存储。您可以使用集中 web UI 使用汇总的数 据创建丰富的视觉化和仪表板。 OpenShift Logging 的主要组件有: collection(收集) - 此组件从集群中收集日志,格式化日志并将其转发到日志存储。当前的实现 是 Fluentd。 log store(日志存储) - 存储日志的位置。默认是 Elasticsearch。您可以使用默认的 Elasticsearch 日0 码力 | 223 页 | 2.28 MB | 1 年前3OpenShift Container Platform 4.10 架构
Kubernetes 体验。 第 第 1 章 章 架 架构 构概述 概述 3 部署 部署 维护应用程序生命周期的 Kubernetes 资源对象。 Docker 包含要在终端执行以编译镜像的用户命令的文本文件。 托管 托管 control plane OpenShift Container Platform 功能,允许从其 data plane 和 worker 在 OpenShift Container 部署在跨裸机、虚拟、私有和公共云环境中提供一致的平台。这提供了速度、灵活性和可移植性。 Ignition RHCOS 在初始配置期间用于操作磁盘的实用程序。它可完成常见的磁盘任务,如分区磁盘、格式化分 区、写入文件和配置用户等。 安装程序置 安装程序置备 备的基 的基础 础架 架构 构 安装程序部署并配置运行集群的基础架构。 kubelet 在集群的每个节点上运行的一个主节点代理,以确保容器在 安装程序创建部署集群所需的 Ignition 配置文件。Red Hat Enterprise Linux CoreOS(RHCOS)在初始配置过程中使用 Ignition 执行常见磁盘任务,如分区、格式化、写入文件 和配置用户。首次启动时,Ignition 从安装介质或您指定的位置读取其配置,并将配置应用到机器。 您可以了解 Ignition 的工作原理,以及 OpenShift Container0 码力 | 63 页 | 1.40 MB | 1 年前3
共 92 条
- 1
- 2
- 3
- 4
- 5
- 6
- 10