服务增强器社区介绍
中兴通讯ServiceMesher 社区成立以来组织了一系列翻译活动,如: • Envoy 官方文档 • Knative 入门 • Istio 官方文档 1.1 版本和 1.4 版本 社区官网投稿情况: • 翻译文章:147 篇 • 原创文章:122 篇 /03 社区活动2019年 10 月31 日 正式开始 istio 1.5 官网文档的翻译。 2 个月 累计合并 PR 数超过 300 个。 个。 300+ 超过 60 人参与了官网的翻译。 60+ 持续时间 合并 PR 数 参与人数 20 万+ 翻译字数 累计翻译的文档中汉字数超过 20 万。 /04 Istio.io 社区化翻译活动Istio 官网本地化活动卓越贡献者 官余棚 @gorda 罗小东 @ilylia 于晓博 @yuxiaobo96 高国良 @gauliang /05 Istio 官网0 码力 | 7 页 | 20.77 MB | 5 月前3机器学习课程-温州大学-13深度学习-Transformer
1.Transformer介绍 Seq2Seq任务 Seq2Seq 任务指的是输入和输出都是 序列的任务,输出的长度不确定时采 用的模型,这种情况一般是在机器翻 译的任务中出现,将一句中文翻译成 英文,那么这句英文的长度有可能会 比中文短,也有可能会比中文长,所 以输出的长度就不确定了。 上图,输入的中文长度为4,输出的英文长度为2 6 1.Transformer介绍 Encoder-Decoder模型 息会被弱化,就好像记忆能力弱的人,记不住过去的事情是一样的。 10 2017年google的机器翻译团队在 NIPS上发表了Attention is all you need的文章,开创性地提出了 在序列转录领域,完全抛弃 CNN和RNN,只依赖Attention-注 意力结构的简单的网络架构, 名为Transformer;论文实现的 任务是机器翻译。 Transformer结构 Multi-Head Attention Transformer的训练 02 Transformer的工作流程 04 BERT 14 2.Transformer的工作流程 从宏观的视角开始 首先将这个模型看成是一个黑箱操作。在机器翻译中,就 是输入一种语言,输出另一种语言。 15 2.Transformer的工作流程 那么拆开这个黑箱,我们可以看到它是由编码组件、解码组件和它们之间的 连接组成。 16 2.Transformer的工作流程0 码力 | 60 页 | 3.51 MB | 1 年前3动手学深度学习 v2.0
. 354 9.4.3 双向循环神经网络的错误应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 9.5 机器翻译与数据集 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357 9.5.1 下载和预处理数据集 上,许多重要的任务可以清晰地描述为,在给定一组特定的可用数据的情况下,估计未知事物的概率。比如: • 根据计算机断层扫描(Computed Tomography,CT)肿瘤图像,预测是否为癌症; • 给出一个英语句子,预测正确的法语翻译; • 根据本月的财务报告数据,预测下个月股票的价格; 监督学习的学习过程一般可以分为三大步骤: 1. 从已知大量数据样本中随机选取一个子集,为每个样本获取真实标签。有时,这些样本已有标签(例如, ,模型可能就需要拥有 “记忆”功能。比如,我们该如何处理视频片段呢?在这种情况下,每个视频片段可能由不同数量的帧组成。 通过前一帧的图像,我们可能对后一帧中发生的事情更有把握。语言也是如此,机器翻译的输入和输出都为 文字序列。 再比如,在医学上序列输入和输出就更为重要。设想一下,假设一个模型被用来监控重症监护病人,如果他 1.3. 各种机器学习问题 27 们在未来24小时内死亡的风险超0 码力 | 797 页 | 29.45 MB | 1 年前3第29 期| 2023 年9 月- 技术雷达
ChatGPT,Google Bard,Meta 的 LLaMA 以及亚马逊的 Bedrock 等)在我们的讨论中占据重要地位。更广泛来说,大语言模型可以应用于从 内容生成(文本、图片和视频)、代码生成到总结概述和翻译等各种问题。通过自然语言的抽象层,这些大模型 成为了强大的工具库,被诸多信息工作者广泛使用。我们讨论了大语言模型的各个方面,包括自托管式大语言 模型,相较云托管的大语言模型,它支持更多的定制和管 是一个全自动的本地化平台,它支持特定上下文的翻译。我们的团队在 ETL 流程或开发工作流中使用 Lokalise API 来翻译可本地化的内容。 Lokalise 支持多种文件格式的可本地化字符串。一个值得强调的方面是它 支持上传整个文件,其中每个键 - 值对都被视为单独的记录并被翻译。在底层,我们利用了 Lokalise 与 Google MT 的集成来处理翻译。 Lokalise 的 Web 界 界面提供了便捷的访问方式,供人工审阅员验证翻译结果,或者根据 需要简化、重新表达翻译内容。在过去,我们曾介绍过类似的工具,例如 Phrase。我们的团队在使用 Lokalise 方面有很好的体验,建议您评估该平台是否适用于协作翻译工作流程。 30. Orca 试验 Orca 是一个专有的云安全平台,用于识别、优先级排序和修复安全风险和合规问题。它支持主流的云提供商和 混合设置。Orca0 码力 | 43 页 | 2.76 MB | 1 年前3机器学习课程-温州大学-01深度学习-引言
•图像滤波与降噪 •图像增强 •风格迁移 •三维重建 •图像检索 •GAN 12 深度学习-CV典型应用案例 翻译 传统翻译采用人工查词的方式,不但耗时长 ,而且错误率高。图像识别技术(OCR)的出 现大大提升了翻译的效率和准确度,用户通 过简单的拍照、截图或划线就能得到准确的 翻译结果。 体育赛事 计算机视觉还有助于比赛和策略分 析、球员表现和评级,以及跟踪体育 节目中品牌赞助的可见性。 机科学、数学等领域的交叉学科。自然语 言处理,是指用计算机对自然语言 的形、音、义等信息进行处理 ,即对字、词、句、篇章的输入、输出、识别、 分析、理解、生 成等的操作和加工。自然语言处理的具体表现形式包括机器 翻译 、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识 别等。 可以说,自然语言处理就是要计算机理解自然语言,自然 语言处理机制涉及 两个流程,包括自然语言理解和自然语言生成 ,自然语言理解是让计算机把 基于规则的方法 2008 • 深度学习 未来 深度学习入门-NLP(自然语言处理) 19 深度学习入门-NLP(自然语言处理) 1.短文本相似 2.文本分类 3.QA机器人 4.语义标注 5.机器翻译 6.…… 20 2020 2013 2017 2019 2018 • ELECTRA • ALBERT • GPT-3 • BERT • GPT • ELMo 2014 • word2vec0 码力 | 80 页 | 5.38 MB | 1 年前3Qcon北京2018-《文本智能处理的深度学习技术》-陈运文
机交流 应用:智能问答,机器翻译,文本分类,文本摘要,标 签提取,情感分析,主题模型 NLP发展简史 1950S 1980s 1990s 2006~至今 以机器翻译为开端,作 为早期尝试,但不是很 成功 基于统计机器学习技术 及语料库,使用统计模 型,NLP发展产生革新 多数自然语言处理系统 基于规则,人工修订等 方式,包括问答、翻译、 搜索等 深度学习起步、发展及 深度学习用于各类型文本应用的实践方法 文本挖掘各种类型应用的处理框架 文本数据 结果 预处理 输出层 表示层 隐层 不同深度学习模型 后处理 NER 分词 情感分析 文本分类 机器翻译 … 文本分类 传统机器学习 • 选择分类器(朴素贝叶斯,SVM,KNN,LR,决 策树) • 特征工程构造特征 • 不同领域定制优化成本高 • 常需要分类算法融合提升效果 深度学习(CNN,RNN等)0 码力 | 46 页 | 25.61 MB | 1 年前3机器学习课程-温州大学-02-数学基础回顾-1.CS229-LinearAlgebra
本文是斯坦福大学CS 229机器学习课程的基础材料,原始文件下载 原文作者:Zico Kolter,修改:Chuong Do, Tengyu Ma 翻译:黄海广 备注:请关注github的更新,线性代数和概率论已经更新完毕。 CS229 机器学习课程复习材料-线性代数 CS229 机器学习课程复习材料-线性代数 线性代数复习和参考 1. 基础概念和符号 1.1 基本符号 2 我们将第一种情况表示为 ,第二种情况表示为 。 保持符号清晰是非常重要的,以后完成课程作业时候你就会发现。 4.2 黑塞矩阵 假设 是一个函数,它接受 中的向量并返回实数。那么关于 的黑塞矩阵(也有翻译作海 森矩阵),写做: ,或者简单地说, 是 矩阵的偏导数: 换句话说, ,其: 注意:黑塞矩阵通常是对称阵: 与梯度相似,只有当 为实值时才定义黑塞矩阵。 很自然地认为梯度与向量函数的一 处为零(这不是唯一的条件,但它是必需的)。也就是说, 请注意,这只是线性方程 。 这表明假设 ,可能最大化(或最小化) 的唯一点是 的特征向量。 线性代数和概率论都已经翻译完毕,请关注github的更新,若有修改将在github上更新 欢迎大家提交PR,对语言进行润色。 翻译:黄海广0 码力 | 19 页 | 1.66 MB | 1 年前3Kubernetes开源书 - 周立
81 Managing Compute Resources for Containers(管理容 器的计算资源) 译者按:本节中,笔者将request翻译成最⼩需求,limit翻译成最⼤限制。由于出现的次数太多,故⽽绝⼤多数地 ⽅直接不翻译了,⼤家可以当做术语来阅读。 指定 Pod 时,可选择指定每个容器需要多少CPU和内存(RAM)。当容器指定了最⼩资源需求时,Scheduler可对Pod resources (alpha feature) (不透明的整数资 源(alpha特征)) 废弃通知:从 Kubernetes v1.8 开始,该特性已被 deprecated 。 既已废弃,就没有翻译的必要了。多抱半⼩时⽼婆吧。该功能的替代品是Extended Resources。 Extended Resources(扩展资源) Kubernetes 1.8版引⼊了Extended Resources。Extended 101 Taints and Tolerations 译者按: Taints:在本⽂中根据上下⽂,有的地⽅直接叫Taints,有的地⽅翻译成“污点”或者“污染”。 Tolerations:在本⽂中根据上下⽂,有的地⽅直接叫Tolerations,有的地⽅翻译成“容忍”或“容忍度”。 here 描述的节点亲和性是⼀个Pod属性,使⽤它可将Pod吸引到⼀组Node(作为优选或硬性要求)。Taint功能相反,0 码力 | 135 页 | 21.02 MB | 1 年前3Service Mesh in China
月,ServiceMesher 发起了 Envoy 文档翻译活动 • 2018 年 6 月,由蚂蚁金服发起的 ServiceMesher 社区在杭州举办第一届 meetup • 2018 年 6 月,ServiceMesher 发起了 Istio 官网翻译活动 • 2019 年 3 月,社区发起了《Istio Handbook》共创活动 翻译 -> 线下交流(经验分享)->原创、实践与上游贡献0 码力 | 13 页 | 2.66 MB | 1 年前3Chatbots 中对话式交互系统的分析与应用
(2014) 语言生成 Natural Language Generation (NLG) • 把结构化的系统动作翻译成人类的语言 Steve Young (2016) 语言生成 Natural Language Generation (NLG) • 把结构化的系统动作翻译成人类的语言 • Semantically Conditioned LSTM (SC-LSTM) Tsung-Hsien Tsung-Hsien Wen (2016) 语言生成 Natural Language Generation (NLG) • 把结构化的系统动作翻译成人类的语言 • Semantically Conditioned LSTM (SC-LSTM) Tsung-Hsien Wen (2016) Task-Bot: 其他框架 • Microsoft: End-to-End Task-Completion0 码力 | 39 页 | 2.24 MB | 1 年前3
共 29 条
- 1
- 2
- 3