文本分类 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

华为云深度学习在文本分类中的实践-李明磊

华为云深度学习在文本分类中的实践华为 Cloud&AI 李明磊 3 2 3 1 4 分类算法简史深度学习架构难点应用案例目录 4 文本分类介绍 内容：  买没几天就降价一点都不开心，闪存跑分就五百多点点 ---  外观漂亮音质不错，现在电子产品基本上都是华为的了 ---  汽车不错，省油，性价比高 ---  这个政策好啊，利国利民 --- f(text)=label 词句子篇章对话 5 文本分类方法简史-机器学习特征提取特征选择输入文本模型训练模型部署评测 label 预测标签词袋 TFIDF Ngram 词典 … 卡方 PCA 互信息 RFE … 分类器 SVM LR XGBoost 随机森林 … 6 文本分类方法简史-深度学习输入文本模型训练模型部署评测 label label 预测标签 RNN CNN LSTM DCNN Attention HAN Transformer Elmo BERT MT-DNN 7 文本分类方法简史-深度学习神经网络语言模型 2003  神经网络NLP里程碑： Word2vec 2013 CNN RNN 2014左右 Attention 2014 Elmo, Bert 2018 解决维度灾难

0 码力 | 23 页 | 1.80 MB | 1 年前
3
情感分类实战

情感分类实战主讲人：龙良曲 Google CoLab ▪ Continuous 12 hours ▪ free K80 for GPU ▪ no need to cross GFW Load Dataset Network Load word embedding Train Test 下一课时 GAN Thank You.

0 码力 | 11 页 | 999.73 KB | 1 年前
3
LR多分类实战

多分类问题主讲人：龙良曲 Network Architecture Train em…. 下一课时 PyTorch全连接层 Thank You.

0 码力 | 8 页 | 566.94 KB | 1 年前
3
Qcon北京2018-《文本智能处理的深度学习技术》-陈运文

达观数据陈运文文本智能处理的深度学习技术达观数据CEO 陈运文博士 • 中国计算机学会高级会员， A C M 和 I E E E 学会会员，复旦大学计算机博士和杰出毕业生 • 原腾讯文学高级总监、盛大文学首席数据官、百度核心技术工程师 • 三十项国家技术挖掘技术和相关应用系统的服务个人简介——达观数据CEO 陈运文达观数据：全球领先的文本智能处理专家 l 为企业提供文本挖掘、知识图谱、搜索引擎和个性化推荐等文本智能处理技术服务，是国内首家将自动语义分析技术应用于企业数据化运营的人工智能公司专注于文本挖掘的国际领军人工智能企业 l 获得全球三十大最佳AI企业等荣誉，拥有国家级高新技术企业、CMMI3资质认证全 l 覆盖金融、制造、法律、电商、传媒等行业，提升企业文档自动化处理能力为数百家中国知名客户提供完善的文本智能处理服务 01 文本智能处理背景简介 7 文本语音图像人工智能 Voice Image Text 达观专注于人工智能中的文本处理细分领域文本处理任务什么是NLP 概念：Natural Language Processing 自然语言处理目的

0 码力 | 46 页 | 25.61 MB | 1 年前
3
动手学深度学习 v2.0

softmax回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 3.4.1 分类问题 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 3.4.2 网络架构 3.4.8 模型预测和评估 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 3.5 图像分类数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.5.1 读取数据集 3.6.4 定义损失函数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.6.5 分类精度 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.6.6 训练

0 码力 | 797 页 | 29.45 MB | 1 年前
3
Ubuntu 桌面培训 2010

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 6.9.1 软件仓库分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294 6.10 添加新语言设置 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 4.60 三维文本 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 4.87 在绘图区域中编辑文本 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 4.88 应用视觉效果

0 码力 | 524 页 | 57.54 MB | 1 年前
3
2022年美团技术年货合辑

Decoupled Head 在 YOLOv6 中，我们采用了解耦检测头（Decoupled Head）结构，并对其进行了精简设计。原始 YOLOv5 的检测头是通过分类和回归分支融合共享的方式来实现的，而 YOLOX 的检测头则是将分类和回归分支进行解耦，同时新增了两个额外的 3x3 的卷积层，虽然提升了检测精度，但一定程度上增加了网络延时。因此，我们对解耦头进行了精简设计，同时综合考虑到相关算子表征能力和硬件上计 1.3% AP。 SIoU 边界框回归损失为了进一步提升回归精度，YOLOv6 采用了 SIoU[9] 边界框回归损失函数来监督网络的学习。目标检测网络的训练一般需要至少定义两个损失函数：分类损失和边界框回归损失，而损失函数的定义往往对检测精度以及训练速度产生较大的影响。近年来，常用的边界框回归损失包括 IoU、GIoU、CIoU、DIoU loss 等等，这些损失函数通过考 7.4%，在实际工程中基本不可用。而 YOLOv6s_repopt 网络的量化模型精度为 40.9%，精度损失仅为 1.5%，相比原版模型有了极大的改善。表 1 使用 RepOpt 在标准分类和检测任务上的 INT8 精度提升 2.1.3 RepOpt 版本的 QAT 此外，使用 RepOpt 结构解决了原本的 RepVGG 网络无法直接使用现有量化感知训练的问题。对于结构重参数化的

0 码力 | 1356 页 | 45.90 MB | 1 年前
3
机器学习课程-温州大学-12深度学习-自然语言处理和词嵌入

词汇表征和文本数据处理 02 词嵌入 05 GPT 3 1.词汇表征 01 词汇表征和文本数据处理 03 Word2Vec 04 GloVe 02 词嵌入 05 GPT 4 1.词汇表征和文本数据处理 5 1.词汇表征和文本数据处理 6 1.词汇表征和文本数据处理 7 1.词汇表征和文本数据处理 8 2 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 9 2.词嵌入 “Sally Johnson is an orange farmer.” “Robert Lin is an apple farmer.” 10 2.词嵌入如何用词嵌入做迁移学习的步骤。第一步，先从大量的文本集中学习词嵌入。第二步，你可以用这些词嵌入模型把它迁移到你的新的只有少量标注训练集的任 04 GloVe 02 词嵌入 05 GPT 01 词汇表征和文本数据处理 15 3.Word2Vec 语言模型的训练机制就是这样 1.我们获得了大量文本数据（例如，所有维基百科文章）。然后 2.我们有一个窗口（比如说三个单词），我们会对所有文本进行滑动。 3.滑动窗口为我们的模型生成训练样本 16 3.Word2Vec （下图左边为CBOW，右边为Skip-Gram）

0 码力 | 44 页 | 2.36 MB | 1 年前
3
《Java 应用与开发》课程讲义 - 王晓东

. . . 98 9.4.1 标准输入/输出概述 . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 9.4.2 标准输入/输出的分类 . . . . . . . . . . . . . . . . . . . . . . . . . . 98 9.4.3 读取控制台输入的传统方法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 10 集合与映射 111 10.1 集合概念及分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112 10.1.1 集合和数组 . . . . . . . 150 12.1 异常的概念及分类 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 12.1.1 什么是异常 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 12.1.2 Java 异常分类 . . . . . . . .

0 码力 | 330 页 | 6.54 MB | 1 年前
3
【PyTorch深度学习-龙龙老师】-测试版202112

开发环境安装 1.7 参考文献第 2 章回归问题 2.1 神经元模型 2.2 优化方法 2.3 线性模型实战 2.4 线性回归 2.5 参考文献第 3 章分类问题 3.1 手写数字图片数据集 3.2 模型构建 3.3 误差计算 3.4 真的解决了吗 3.5 非线性模型 3.6 表达能力 3.7 优化方法 3.8 手写数字图片识别体验循环神经网络 11.3 梯度传播 11.4 RNN 层使用方法 11.5 RNN 情感分类问题实战 11.6 梯度弥散和梯度爆炸 11.7 RNN 短时记忆 11.8 LSTM 原理 11.9 LSTM 层使用方法 11.10 GRU 简介 11.11 LSTM/GRU 情感分类问题再战 11.12 预训练的词向量 11.13 参考文献第 12 章自编码器 Learning)和强化学习(Reinforcement Learning，简称 RL)，如图 1.2 所示。机器学习有监督学习无监督学习强化学习图 1.2 机器学习的分类有监督学习有监督学习的数据集包含了样本?与样本的标签?，算法模型需要学习到映射关系??: ? → ?，其中??代表模型函数，?为模型的参数。在训练时，通过计算模型的预测值??(?)与真实标签

0 码力 | 439 页 | 29.91 MB | 1 年前
3

共 739 条前往

页

分类

语言

格式