DeepSeek从入门到精通(20250204)
CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考:0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 • 不要对通用模型“过度信任”(如直接询问复杂推理问题,需分步验证结果)。 从“下达指令”到“表达需求” 策略类型 定义与目标 适用场景 示例(推理模型适用) 优势与风险 指令驱动 直接给出明确步骤或 格式要求 简单任务、需快速执行 “用Python编写快速排序函 数,输出需包含注释。” ✅ 结果精准高效 探索性问题、需模型解 释逻辑 “为什么选择梯度下降法解 决此优化问题?请对比其他 算法。” ✅ 触发模型自解释能力 ❌ 可能偏离核心目标 任务需求与提示语策略 任务类型 适用模型 提示语侧重点 示例(有效提示) 需避免的提示策略 数学证明 推理模型 直接提问,无需分步引导 “证明勾股定理” 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考:0 码力 | 103 页 | 5.40 MB | 8 月前32024 中国开源开发者报告
阿里巴巴国际的 Macro-o1、通义 千问团队的 QwQ、上海人工智能实验室的 LLaMA-O1 和清华大学的 Llama-3.2V-11B-cot。 这些模型不仅在技术上各具特色,还通过开源策略分享了大量研究细节,为整个开源社区提供了 23 / 111 丰富的资源,在这一过程中,小模型不仅在推理能力上有了显著提升,也推动了行业整体技术水 平的进步。 结合当前人工智能产业界的“人工智 文/顾钧 “开源”是指采用符合 OSI 官方认可的软件许可证进行软件发布的行为。目前大模型的“开 源”与传统的开源定义并不相同。我所说的开源策略是指以开源发布软件为起点,用户/开发者 运营为途径的软件产品推广策略。 我的观点是,开源策略是大模型最好的竞争策略。接下来让我们从头捋一捋推导过程。 我们先看大模型赛道的整体状况: 大模型是一项相对较新的技术。尽管 OpenAI 早在 2019 年就发布了第一个重要的 局都全了。 以上,大模型赛道的元素非常丰富,各种商业化方法的排列组合都不缺,为我们的分析与推 演提供了可贵的素材。对软件商业化问题感兴趣的朋友一定要长期关注这个赛道。只有这样的对 象才能更有力地说明开源策略的重要性。 其次,我们得明确一点——大模型竞争的赛点是什么?常用的判断依据包括:技术的先进性, C 端用户基数,依赖这个软件的生态系统大小等等。其中哪个更关键一点? 技术先进是好事,但大模型领0 码力 | 111 页 | 11.44 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 定位、需求预测、推荐系统、异常检测等。 对数据进行分类、社交网络分析或时序模式挖掘,常用 于客户细分、信用评分、社交媒体营销、股价预测等。 将数据转化为统计图、热力图、网络关系图、词云、树形 图等,用于揭示数据中蕴含的模式、趋势、异常和洞见。 本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 DeepSeek R1 文件数据读取完整无缺失 数据分析全面、逻辑清晰严谨 网络爬虫任务数据爬取完整、准确 数据挖掘能够准确分类并提供建议 数据可视化任务能力有待完善 Claude 3.5 sonnet 数据读取输出逻辑性强、指标清晰 数据分析任务完成得较为简单 数据分析任务完成得较为简单 爬虫数据采集未形成明确结论 数据挖掘深度较浅 绘制出可视图表不稳定 Open AI o3 mini 数据分析高效、全面、准确 数据可视化能力突出、直接生成 网络爬虫任务爬取数据结果为空 暂不支持上传数据附件 数据挖掘深度较浅 Kimi k1.5 数据挖掘能力出色 快速读取文件数据,提取网址链接 长文本数据处理能力突出 爬虫数据采集存在代码错误问题0 码力 | 85 页 | 8.31 MB | 7 月前3清华大学 普通人如何抓住DeepSeek红利
脑右下角显示时间:3:05 PM,你手心冒汗,疯狂翻找资料,但文档光标始终停留在标题页…… 场景1:1小时内写完一个1万字的项目书 是否可用DeepSeek(深度求索)辅助处理? 可以,但需分阶段“榨干AI效率”,核心策略:框架复制+模块填充+数据嫁接。 分步解决方案: 第一阶段:5分钟——用AI暴力生成框架(目标:3000字) 场景1:1小时内写完一个1万字的项目书 第二阶段:20分钟——用AI批量填充模块(目标:6000字) 作效率和表现。 以往的解决方式: • 依赖同事的口头介绍,容易遗漏重要信 息。 • 手动查阅厚重的产品手册和内部文档, 耗时较长。 • 参加多部门的培训,但信息量大,难以 消化。 • 通过网络搜索行业信息,但信息分散, 难以整合。 场景2:新员工快速熟悉公司情况和行业情况 快速了解行业情况和市场趋势 DeepSeek可以整合行业报告、市场分析、竞争对手信 息等数据,帮助新员工快速掌握行业动态。 但家人需要你立刻回去。你 坐在工位上反复措辞,始终不敢敲开领导办公室的门。 场景4:项目中急需请假 如何开口 是否可用DeepSeek辅助处理?可以,且建议分三步使用: 1. 情绪梳理与沟通策略(用AI模拟对话) p 操作:向DeepSeek输入:“我要请假,但项目很紧急,领导可能不满,如何沟通?” p AI辅助: • 分析你的顾虑(如“领导可能认为我不负责”),提供理性视角(如“家庭突发情况≠工作态度问题”)。0 码力 | 65 页 | 4.47 MB | 7 月前3Pro Git 中文版 第2版 2.1.66
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 使用强制策略的一个例子 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 如果你正学习如何使用 Git,那么了解如何使用 GitHub 将会帮助你加入到一个巨大的社区中。不论你决定为自己的代码使用哪一个 Git 托管服务,这都很有价值。 自从上次出版以来另一个重大变革是 Git 网络传输 HTTP 协议的开发与崛起。书中的大多数例子都已经从 SSH 切换到 HTTP,因为它更简单。 在过去这几年看到 Git 从一个相对无名的版本管理系统成长为商业与开源版本管理的事实标准是令人吃惊的。我 @secondwtq @oldsharp 9 章节 译者 审校者 8.3 Git 钩子 @spacewand er @IceNature @M1seRy @secondwtq 8.4 使用强制策略的一个例子 @spacewand er @gisphm @IceNature @M1seRy 8.5 总结 @spacewand er @devbean @networm @IceNature0 码力 | 501 页 | 19.30 MB | 1 年前3Pro Git 中文版 第2版 2.1.66
客户端基本配置 Git 中的着色 外部的合并与比较工具 格式化与多余的空白字符 服务器端配置 Git 属性 二进制文件 关键字展开 导出版本库 合并策略 Git 钩子 安装一个钩子 客户端钩子 服务器端钩子 使用强制策略的一个例子 服务器端钩子 客户端钩子 总结 Git 与其他系统 作为客户端的 Git Git 与 Subversion Git 与 Mercurial 包文件 引用规范 引用规范推送 删除引用 传输协议 哑协议 智能协议 协议总结 维护与数据恢复 维护 数据恢复 移除对象 环境变量 全局行为 版本库位置 路径规则 提交 网络 比较和合并 调试 其它 总结 附录 A: 在其它环境中使用 Git 图形界面 gitk 和 git-gui GitHub for macOS and Windows macOS 和 如果你正学习如何使用 Git,那么了 解如何使用 GitHub 将会帮助你加入到一个巨大的社区中。不论你决定为自己 的代码使用哪一个 Git 托管服务,这都很有价值。 自从上次出版以来另一个重大变革是 Git 网络传输 HTTP 协议的开发与崛起。 书中的大多数例子都已经从 SSH 切换到 HTTP,因为它更简单。 在过去这几年看到 Git 从一个相对无名的版本管理系统成长为商业与开源版本 管理的事实标准是令人吃惊的。我很高兴0 码力 | 670 页 | 13.59 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
广东温氏集团食品股份有限公司 广联达科技股份有限公司 广州南天电脑系统有限公司 广州胜鸿电子科技有限公司 广州山水比德科技有限公司 华福证券有限责任公司 华融融通(北京)科技有限公司 华数传媒网络有限公司 华泰证券股份有限公司 华夏银行股份有限公司 杭州东方通信软件技术有限公司 杭州海亮优教教育科技有限公司 杭州睿胜软件有限公司 杭州数澜科技有限公司 杭州网易云音乐科技有限公司 OVERVIEW 10 PRODUCT 产品篇 网易数帆旗下云原生技术与服务品牌 PRODUCT 低代码应用开发平台 LCAP 持续交付平台 CICD 流水线 容器部署 主机部署 策略部署 开放 治理 监控 事务 管理 DevOps 多云部署 服务治理 能力扩展 中间件高可用 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 丰富的中间件及统一的管控平台,支持 全生命周期的运维操作。 高可用 支持节点、可用区级故障,灵活调度策 略,有效保障数据安全性与可用性。 故障恢复 支持 Node 级和实例级故障自动恢复, 无需人工值守。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 基于开源自主可控 基于社区开源版本,进行源码级内核优 化,性能增强,自主可控。0 码力 | 43 页 | 884.64 KB | 1 年前3Gitea v1.21.1 中文文档
您应该会被提示输入数据库用户的密码,并连接到数据库。 如果 Gitea 和您的数据库实例之间的通信是通过私有网络进行的,或者如果 Gitea 和数据库运行在同一台服务器 上,那么可以省略本节,因为 Gitea 和数据库实例之间的安全性不会受到严重威胁。但是,如果数据库实例位于公 共网络上,请使用 TLS 对数据库连接进行加密,以防止第三方拦截流量数据。 您需要两个有效的 TLS 证书,一个用于数据库实例(数据库服务器),一个用于 的设置。但是, docker-compose 的安装超出了本文档的范 围。要安装 docker-compose 本身, 请按照官方的 安装说明进行操作。 最简单的设置只需创建一个卷和一个网络,并将 gitea/gitea:latest-rootless 镜像作为服务启动。由于没有可用的 数据库,可以使用 SQLite3 来初始化一个。 创建一个名为 data 和 config docker-compose 的设置,但是 docker-compose 的安装不在本文档的范围之内。 要安装 docker-compose 本身,请遵循官方安装说明。 最简单的设置只是创建一个卷和一个网络,然后将 gitea/gitea:latest 镜像作为服务启动。由于没有可用的数据 库,因此可以使用 SQLite3 初始化数据库。创建一个类似 gitea 的目录,并将以下内容粘贴到名为0 码力 | 303 页 | 3.88 MB | 1 年前32023 中国开源开发者报告
提速降价、更多的 API 开放。 2023 年 8 月,谷歌宣布推出 AI 代码编辑器 Project IDX,一个基于浏览器的 开发环境:集成 AI、支持全栈编程语言、跨平台真机预览、一键部署,用于 构建全栈网络和多平台应用程序。 2023 年 10 月,百川智能发布 Baichuan2-192K 大模型,上下文窗口长度高 达 192K,号称是当时全球最长的上下文窗口,能够处理约 35 万个汉字。 在上下 河南联通强迫用户更换光猫 河南周口联通为了强迫用户更 换光猫,公司在后台停掉用户 的宽带账号,导致用户无法上 网,然后让工程师上门 “维修”, 谎称光猫损坏,需要花 299 元 换新。更换完后,联通再在后 台恢复用户的网络。 员工盗用公司游戏源代码 中国人民大学一名硕士毕业生涉嫌在校期间非法获取全校学生的个人信息, 并利用这些信息制作了一个给学生颜值打分的网站。 针对 “中国人民大学部分学生信息被非法获取” 的情况,海淀警方接到报警 岁,该校毕业生)涉嫌非法获取该校部分学生 个人信息等违法犯罪行为,后被海淀公安分局依法刑事拘留。 上海一游戏公司三名员工利 用职务之便,在从原公司离 职前盗取了公司开发的手游 源代码;并将该手游的源代 码提供给 了另一家网络 公 司,对方进行简单 “换皮” 之 后就开始上线经营。 创建颜值打分网站——结局很“刑” 一年私吞 260 余万元 民警随即展开工作,最终嫌疑人曹某迫于压力主动投案自首。 曹某是该公司的软件工程师,他坦白称,去年0 码力 | 87 页 | 31.99 MB | 1 年前3
共 172 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18