清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 指令:我想让你充当一名科研类的英汉翻译,我会向你提供一种语言的一些段落,你的任务是将这些段落准确地、学术性 地翻译成另一种语言。翻译后不要重复原文提供的段落。您应使用人工智能工具(如自然语言处理)以及有关有效写作技巧 的修辞知识和经验进行回复。我会给你如下段落,请告诉我是用什么语言写的,然后翻译。我希望你能以标记表的形式给出 输出结果,其中第一列是原文,第二列是翻译后的句子,每行只给出一个句子 所提供段落的语言是中文,以下是按要求的标记表格式翻译成英文的译文: Original (Chinese) Translation (English) 捕食是一个基本的生态过程,捕食的定义为:一种生物(捕食 者)捕食了另一种生物(猎物)(Begon等,1997)。 Predation is a fundamental ecological process,defined as one organism0 码力 | 85 页 | 8.31 MB | 7 月前3清华大学 DeepSeek 从入门到精通
代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 理) 因果分析(事件关联性) 语义分析 语义解析 情感分析(评论、反馈) 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力0 码力 | 103 页 | 5.40 MB | 8 月前3Ubuntu 桌面培训 2010
对软件进行修改,或者利用获得的代码编写并发布新的软件,使其满足自身需要,或 者进行互相协作以改进开源软件。开源和 Linux 都是在逐步变化的过程中,形成今天 的样子的。 自由分发的源代码的想法是为了鼓励人们自愿地、相互协同地开发软件。用户不断参 与增强软件、修复缺陷、开发新功能并且和其他人分享。 大量的程序员参与到软件协作开发之中,用户可以获得质量和性能比专有软件更好的 开源软件。开源软件鼓励用户对软件进行自定义,使其满足自身需要。这是一个巨大 自由软件运动 二十世纪六十年代,IBM 等公司所开发的软件都是自由分发的。那个时候的商业模式 都是以硬件为中心,软件只是被看作使硬件工作的东西。他们提供软件的同时也提供 源代码,软件可以被修改并因此得到改进,这便是现在开源软件的早期情况。但是, 随着硬件价格的不断下跌,销售硬件的利润也逐渐减小,制造商开始期望软件能够带 来额外的收入。越来越多的厂商开始单独销售软件,也不再提供软件的源代码。 1983年春天,Richard 开放源代码: • 可以被任何人获取和使用 • 可以根据个人的要求和所使用的平台定制 • 可以自由地以当前或修改的形式重新发布 最开始,Linux 是技术性非常强的开发工具。但是随着成千上万的开发者加入到改进 它的行列,为它的发展做出贡献,对于用户它变得越来越友好。于是现在有数百种商 业和非商业的为日常使用设计的发行版。 1998年 ,Jon "maddog" Hall 、Larry Augustin、Eric0 码力 | 540 页 | 26.26 MB | 1 年前3谈谈MYSQL那点事
文件引擎中速度最快的 • 不支持一些数据库特性,比如 事务、外键约束等 不支持一些数据库特性,比如 事务、外键约束等 • Table level lock Table level lock ,性能稍差,更适合读取多的操作 ,性能稍差,更适合读取多的操作 InnoDB InnoDB 特点 特点 •使用 使用 Table Space Table Space 的方式来进行数据存储 的方式来进行数据存储 ib_logfile0) • 支持 事务、外键约束等数据库特性 支持 事务、外键约束等数据库特性 • Rows level lock , Rows level lock , 读写性能都非常优秀 读写性能都非常优秀 • 能够承载大数据量的存储和访问 能够承载大数据量的存储和访问 • 拥有自己独立的缓冲池,能够缓存数据和索引 拥有自己独立的缓冲池,能够缓存数据和索引 MySQL 架构设计—应用架构 MySQL 架构设计—高可用架构 系统优化:硬件、架构 系统优化:硬件、架构 服务优化 服务优化 应用优化 应用优化 MySQL MySQL 优化方式 优化方式 影响性能的因素 影响性能的因素 应用程序 应用程序 查询 查询 事务管理 事务管理 数据库设计 数据库设计 数据分布 数据分布 网络 网络 操作系统 操作系统 硬件 硬件 使用好的硬件,更快的硬盘、大内存、多核0 码力 | 38 页 | 2.04 MB | 1 年前3JavaScript 正则表达式迷你书 老姚 - v1.1
positive lookahead 和 negative lookahead。 中文翻译分别是正向先行断言和负向先行断言。 ES5 之后的版本,会支持 positive lookbehind 和 negative lookbehind。 具体是 (?<=p) 和 (?翻译成环视,即看看右边和看看左边。 但一般书上,没有很好强调这四者是个位置。 比如 ( ^。 表示开头前面还有个位置(当然也是开头,即同一个位置,想想之前的空字符类比)。 (?=.*[0-9]) 表示该位置后面的字符匹配 .*[0-9],即,有任何多个任意字符,后面再跟个数字。 翻译成大白话,就是接下来的字符,必须包含个数字。 2.4.3.6. 另外一种解法 “至少包含两种字符”的意思就是说,不能全部都是数字,也不能全部都是小写字母,也不能全部都是大写 字母。 那么要求“不能全部都是数字”,怎么做呢? 来。写书或者说写作 是一种很好的以教为学的手段。毕竟,形成文字,教给别人算是对知识的最直接的应用了。看似为了教,其 实是为了学。只有教会别人才说明你掌握了。“以教为学”的手段除了写东西之外,还有翻译、以及面对面 的辅导等。 JavaScript 正则表达式迷你书 后记 | 第 78 页 以目标为导向的做中学,是比较有效的学习手段。本书是用 Asciidoc 写成的。它类似于 Markdown,但在0 码力 | 89 页 | 3.42 MB | 10 月前3JavaScript 正则表达式迷你书 老姚 - v1.0
positive lookahead 和 negative lookahead。 中文翻译分别是正向先行断言和负向先行断言。 ES5 之后的版本,会支持 positive lookbehind 和 negative lookbehind。 具体是 (?<=p) 和 (?翻译成环视,即看看右边和看看左边。 但一般书上,没有很好强调这四者是个位置。 比如 ( ^。 表示开头前面还有个位置(当然也是开头,即同一个位置,想想之前的空字符类比)。 (?=.*[0-9]) 表示该位置后面的字符匹配 .*[0-9],即,有任何多个任意字符,后面再跟个数字。 翻译成大白话,就是接下来的字符,必须包含个数字。 2.4.3.6. 另外一种解法 “至少包含两种字符”的意思就是说,不能全部都是数字,也不能全部都是小写字母,也不能全部都是大写 字母。 那么要求“不能全部都是数字”,怎么做呢? 来。写书或者说写作 是一种很好的以教为学的手段。毕竟,形成文字,教给别人算是对知识的最直接的应用了。看似为了教,其 实是为了学。只有教会别人才说明你掌握了。“以教为学”的手段除了写东西之外,还有翻译、以及面对面 的辅导等。 以目标为导向的做中学,是比较有效的学习手段。本书是用Asciidoc写成的。它类似于Markdown,但在此书 之前本人都没有用过。以需求为驱动,逐步百度检索,自己才0 码力 | 89 页 | 3.42 MB | 10 月前3MySQL 8.0.17 调优指南(openEuler 20.09)
2 调优原则 性能调优从大的方面来说,在系统设计之初,需要考虑硬件的选择,操作系统的选 择,基础软件的选择;从小的方面来说,包括每个子系统的设计,算法选择,如何使 用编译器的选项,如何发挥硬件最大的性能等等。 在性能优化时,我们必须遵循一定的原则,否则,有可能得不到正确的调优结果。主 要有以下几个方面: ● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难 界定性能的影响是由哪个参数造成的。 ● 由于在进行系统性能分析时,性能分析工具本身会占用一定的系统资源,如CPU 资源、内存资源等等。我们必须注意到这点,即分析工具本身运行可能会导致系 统某方面的资源瓶颈情况更加严重。 1 ● 必须保证调优后的程序运行正确。 ● 调优过程是迭代渐进的过程,每一次调优的结果都要反馈到后续的代码开发中 去。 ● 性能调优不能以牺牲代码的可读性和可维护性为代价。 1.3 调优思路 性能优化首先要较为精准的定位问题,分析系统性能瓶颈,然后根据其性能指标以及 所处层级选择优化的方式方法。 下面介绍MySQL数据库具体的调优思路和分析过程,如图1所示。 调优分析思路如下: 10 码力 | 11 页 | 223.31 KB | 1 年前3RocketMQ v3.2.4 开发指南
65535,返种优兇级问题一般使用丌同 topic 解决就非常丌合 项目开源主页:https://github.com/alibaba/RocketMQ 5 适。如果要让 MQ 解决此问题,会对 MQ 的性能造成非常大的影响。返里要确保一点,业务上是否确实需 要返种严格的优兇级,如果将优兇级压缩成几个,对业务的影响有多大? 4.3 Message Order 消息有序挃的是一类消息消费时,能挄 挂掉重启后仍然能将乀前内存的数据恢复出来。 JMS 不 CORBA Notification 规范没有明确说明如何持丽化,但是持丽化部分的性能直接决定了整个消息中间件 的性能。 RocketMQ 参考了 Kafka 的持丽化方式,充分利用 Linux 文件系统内存 cache 来提高性能。 4.6 Message Reliablity 影响消息可靠性的几种情冴: (1). Broker 正常关闭 生,在此单点上的消息全部丢失。RocketMQ 在返两种情冴下,通 过异步复制,可保证 99%的消息丌丢,但是仍然会有极少量的消息可能丢失。通过同步双写技术可以完全避免单点, 同步双写势必会影响性能,适合对消息可靠性要求极高的场合,例如不 Money 相关的应用。 RocketMQ 从 3.0 版本开始支持同步双写。 4.7 Low Latency Messaging 在消息丌堆积情冴下,消息到达0 码力 | 52 页 | 1.61 MB | 1 年前32022 Apache Ozone 的最近进展和实践分享
Ozone的实践分享 ⼤数据存储的需求 能否提供⾼并发读取和写⼊ 是否兼容主流API,如HDFS/S3 是否可以扩展⾄数百PB的存储容量,数千个 物理节点以及数⼗亿个对象 扩展性 API 兼容性 性能 是否⽀持存算分离架构同时也可以兼容存算耦合 架构 应⽤对接 安全 加密 HDFS现有的⼀些解决⽅案 Namenode Federation Router Based Federation • 性能影响,频繁open/close实例 • 磁盘使⽤量,不可精准预测 • 稳定性,频繁open/close⾮RocksDB的推荐⽤法, 容易触发潜在问题 解决办法 - 单盘单RocksDB实例 单盘单RocksDB实例 • 除了Container的删除,其他操作V3都要⽐V2有数量级的提升 • 随着单盘Container数量的增多,V2的各操作性能出现下降,⽽V3性能基本没有变化0 码力 | 35 页 | 2.57 MB | 1 年前3Apache Pulsar,云原生时代的消息平台 - 翟佳
运维痛点:替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障: 持久化(fsync)、⼀致性(ack: all)、多Topic • IO不隔离:消费者读Backlog的时候会影响其他⽣产者和消费者 streamnative.io Apache Pulsar 特性 • 云原⽣架构: • 存储计算分离 • 分层 + 分⽚ • ⾼性能 + 强⼀致性 • ⽀持统⼀的 Queue 和 Stream openLedger(5, 3, 2) streamnative.io 企业级流存储层: 读写⾼可⽤性(容错) streamnative.io 企业级流存储层: 稳定的 IO 质量 ⾼性能、强⼀致性、读写隔离、灵活SLA • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar 的云原⽣架构 • 企业级流存储: BookKeeper streamnative0 码力 | 39 页 | 12.71 MB | 6 月前0.03
共 16 条
- 1
- 2