清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek 量信息,请从中读取每一天的信息,并整理成一张表格,要求包括以下几项信息:1.当天日期;2.当天的铁路客运量、 比2024年同期多或者少的百分比、环比的百分比。3.当天的公路客运量、比2024年同期多或者少的百分比、环比的百分 比。4.当天的民航客运量、比2024年同期多或者少的百分比、环比的百分比。 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 o3mini 一般文本(7000token): 能够高效提取文本中的数据, 并整理成可视化数据表格, 格式工整、简洁,数据准确 但数据维度有所缺失。 长文本(15000token): 反应迅速,高效提取文本中 数据,输出格式规范的数据 表格,但集成数据维度仍然 不够全面。 DeepSeek R1 一般文本(7000token):能 详细全面地提取文本数据,并 集成可视化表格,但受大样本0 码力 | 85 页 | 8.31 MB | 7 月前3清华大学 DeepSeek 从入门到精通
而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 问题解决能力 擅长解决结构化和定义明确的问题 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 简洁需求,信任模型逻辑 “用Python实现快速排序” 分步指导(如“先写递归函数”) 通用模型 细化步骤,明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 “你觉得人工智能的未来会怎样?” 强制逻辑链条(如“分三点回答”) 推理模型 需明确对话目标,避免开放发散 “从技术、伦理、经济三方面分析 AI的未来”0 码力 | 103 页 | 5.40 MB | 8 月前3RocketMQ v3.2.4 开发指南
oker 在吐 Consumer 投递成功消息后,消息仍然需要保留。幵丏重新消费一般是挄照时间维度,例如由亍 Consumer 系统故障, 恢复后需要重新消费 1 小时前的数据,那举 Broker 要提供一种机制,可以挄照时间维度来回退消费迕度。 RocketMQ 支持挄照时间回溯消费,时间维度精确到毫秒,可以吐前回溯,也可以吐后回溯。 4.12 消息堆积 消息中间件的主要功能是异 消费消息过程,使用了零拷贝,零拷贝包含以下两种方式 1. 使用 mmap + write 方式 优点:即使频繁调用,使用小块文件传输,效率也很高 缺点:丌能很好的利用 DMA 方式,会比 sendfile 多消耗 CPU,内存安全性控制复杂,需要避免 JVM Crash 问题。 2. 使用 sendfile 方式 优点:可以利用 DMA 方式,消耗 CPU 较少,大块文件传输效率高,无内存安全新问题。 基础乀上增加多个字段,Consumer 看到的是 com.alibaba.rocketmq.common.message.MessageExt 返个数据结构,MessageExt 继承亍 Message,MessageExt 多 出来的数据字段如下表所述。 12 Broker 使用挃南 12.1 Broker 配置参数 获取 Broker 的默认配置 sh mqbroker -m 项目开源主页:https://github0 码力 | 52 页 | 1.61 MB | 1 年前3Ubuntu 桌面培训 2010
的概念。他是很多 Copyleft 许可证的主要作者,包括使用最广泛的自由软件许可证—— GNU 通用公共 许可证(GNU General Public License, GPL)。 小提示 更 多 关 于 Richard Stallman 和 GNU 项 目 的 内 容 , 请 访 问:http://en.wikipedia.org/wiki/Richard_stallman Copyleft I.2 开 放 源 码 运 动 的 发 起 者 开 放 源 码 运 动 和 1990 年 代 末 的 互 联 网 的 兴 起 一 起 造 就 了 Linux 的 流 行 , 随 后 出 现 了 很 多 支 持 开 源 的 公 司 , 如 Corel (Corel Linux) 、Sun Microsystems (OpenOffice.org)、IBM (OpenAFS)。在 21世纪初,互联网泡沫破碎,开源软件 开 发 者 地 带 开 发 者 聚 集 在 这 里 开 发 和 打 包 软 件 、 修 正 缺 陷 , 以 此 维 护 Ubuntu。 他 们 的 工 作 确 保 了 Ubuntu 拥 有 丰 富 多 样 的 、 稳 定 可 靠 的 软 件 。 如 果 您 想 成 为 软 件 打 包 者 , 尝 试 加 入 MOTU 是 最 好 的 选 择 。 详 情 请 访 问 https://wiki.ubuntu0 码力 | 540 页 | 26.26 MB | 1 年前3基于 KUBERNETES 的 容器器 + AI 平台
构建集群与管理理资源 - 73s 视频演示 多集群和镜像仓库 多租户和旧系统的集成 运⾏行行和构建应⽤用 Rudder - 应⽤用编排技术框架 Cyclone - 持续集成与交付引擎 运⾏行行 AI 应⽤用(机器器学习) - 58s 视频演示 Kubeflow 的应⽤用 Kubeflow 之上 构建集群与管理理资源 多集群和镜像仓库 • 企业想要的 • 隔离性和安全性 K8s - 单『控制集群』, 多『⽤用户集群』 • 镜像仓库 - 单『默认仓 库』,多仓库集成 管理理集群和节点 • 技术概览 • cloud provider • custom resource • ansible 管理理镜像仓库 • Cargo (内部项⽬目)- ⽣生产级镜像仓库解决⽅方案,基于 • ⼀一键⾼高可⽤用部署和维护 • 为多租户和复杂权限集成⽽而增强 『token 『token service』 • 管理理基于规则的镜像仓库 • 其他企业需要的优化功能 企业典型的多租户模型 租户 Tenant User User group Namespace Deployment Registry project CI/CD workspace Pod … resources CPU quota MEM quota Storage0 码力 | 19 页 | 3.55 MB | 1 年前3JavaScript 正则表达式迷你书 老姚 - v1.1
[abc],表示匹配一个字符,它可以是 "a"、"b"、"c" 之一。 JavaScript 正则表达式迷你书 1. 第一章 正则表达式字符匹配攻略 | 第 7 页 1.2.1. 范围表示法 如果字符组里的字符特别多的话,怎么办?可以使用范围表示法。 比如 [123456abcdefGHIJKLM],可以写成 [1-6a-fG-M]。用连字符 - 来省略和简写。 因为连字符有特殊用途,那么要匹配 "a"、"-"、"z" "1234", "12345", "12345"] 其中正则 /\d{2,5}/,表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、4 位、5 位连续数字。 但是其是贪婪的,它会尽可能多的匹配。你能给我 6 个,我就要 5 个。你能给我 3 个,我就要 3 个。 反正只要在能力范围内,越多越好。 我们知道有时贪婪不是一件好事(请看文章最后一个例子)。而惰性匹配,就是尽可能少的匹配: "12345678".replace(/(?=(\d{3})+$)/g, ',') console.log(result); // => "12,345,678" 2.4.2.3. 匹配其余案例 写完正则后,要多验证几个案例,此时我们会发现问题: var result = "123456789".replace(/(?=(\d{3})+$)/g, ',') console.log(result); // =>0 码力 | 89 页 | 3.42 MB | 10 月前3JavaScript 正则表达式迷你书 老姚 - v1.0
[abc],表示匹配一个字符,它可以是 "a"、"b"、"c" 之一。 JavaScript 正则表达式迷你书 1. 第一章 正则表达式字符匹配攻略 | 第 7 页 1.2.1. 范围表示法 如果字符组里的字符特别多的话,怎么办?可以使用范围表示法。 比如 [123456abcdefGHIJKLM],可以写成 [1-6a-fG-M]。用连字符 - 来省略和简写。 因为连字符有特殊用途,那么要匹配 "a"、"-"、"z" "1234", "12345", "12345"] 其中正则 /\d{2,5}/,表示数字连续出现 2 到 5 次。会匹配 2 位、3 位、4 位、5 位连续数字。 但是其是贪婪的,它会尽可能多的匹配。你能给我 6 个,我就要 5 个。你能给我 3 个,我就要 3 个。 反正只要在能力范围内,越多越好。 我们知道有时贪婪不是一件好事(请看文章最后一个例子)。而惰性匹配,就是尽可能少的匹配: "12345678".replace(/(?=(\d{3})+$)/g, ',') console.log(result); // => "12,345,678" 2.4.2.3. 匹配其余案例 写完正则后,要多验证几个案例,此时我们会发现问题: var result = "123456789".replace(/(?=(\d{3})+$)/g, ',') console.log(result); // =>0 码力 | 89 页 | 3.42 MB | 10 月前3Apache Pulsar,云原生时代的消息平台 - 翟佳
streamnative.io Apache Pulsar 要解决的问题 • 企业需求和数据规模 • 多租户 - 百万Topics - 低延时 - 持久化 - 跨地域复制 • 解除存储计算耦合 • 运维痛点:替换机器、服务扩容、数据 rebalance • 减少⽂件系统依赖 • 性能难保障: 持久化(fsync)、⼀致性(ack: all)、多Topic • IO不隔离:消费者读Backlog的时候会影响其他⽣产者和消费者 Apache Pulsar 特性 • 云原⽣架构: • 存储计算分离 • 分层 + 分⽚ • ⾼性能 + 强⼀致性 • ⽀持统⼀的 Queue 和 Stream 的接⼝。 • 丰富的企业级特性 • 多租户隔离 — 百万Topics — 跨地域复制 — 鉴权认证 • Pulsar 的根本不同 • Apache Pulsar 简介 • Pulsar 的⽣态和社区 • Pulsar 的根本不同0 码力 | 39 页 | 12.71 MB | 5 月前0.03基于go和flutter的实时通信/视频直播解决方案 段维伟
iOS/Android/Web/Windows/Linux/macOS/Embedded 使用flutter 开发app意味着什么? • 无需为每个平台独立维护代码 • 一次编码,多平台运行,效率最大化 • 多平台一致性体验 • 强大的社区资源 Flutter-WebRTC 插件 Flutter-WebRTC 支持那些平台 实现一对一视频通话服务 (基于 Go 开发) 源码: https://github 分布式架构 • 基于grpc over NATS mq • 使用redis 存储媒体流全局位置 • 支持业务自定义开发 • 高性能,单个ion-sfu节点 1k 并发仅需 0.5核 ION 架构 多node 架构 主要模块 • ISLB 服务发现,负载均衡,媒体信息全局存储 • Biz 业务接入模块 • SFU 节点 (用于转发webrtc 流,与biz模块配合创建视频会议系 统) •0 码力 | 38 页 | 2.22 MB | 1 年前3Kubernetes Operator 实践 - MySQL容器化
等相关领域,负责搜狗商业云 平台的设计研发工作 刘林 1. 背景介绍 2. Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 搜狗商业平台 技术体系广 服务多迭代快 搜狗产品矩阵 商业平台 信息流广告 搜索广告 品牌广告 代理商 广告主 技术体系 CRM 广告平台 物料展现 审核平台 大数据平台 基础架构 Golang C++ master 为 sts 最后一个 pod operator 执行 sts 扩缩容 判断 调用 mha 切主 否 是 pod 都正常运行? 重新调度 mha MGR 高可用简介 • 多主和单主两种工作模式 • MGR 只支持 InnoDB 引擎 • 开启 GTID,ROW 模式 binlog • 每张表必须有检测冲突的主键 • 目前最多只支持 9 个节点 • loose-group_replication_0 码力 | 42 页 | 4.77 MB | 1 年前3
共 13 条
- 1
- 2