DeepSeek从入门到精通(20250204)
们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 细化步骤,明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 “你觉得人工智能的未来会怎样?” 强制逻辑链条(如“分三点回答”) 推理模型 需明确对话目标,避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 情感化提问(如“你害怕AI吗?”) 逻辑分析 推理模型 直接抛出复杂问题 “分析‘电车难题’中的功利主义0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 细化步骤,明确输入输出格式 “先解释快速排序原理,再写出代 码并测试示例” 模糊需求(如“写个排序代码”) 多轮对话 通用模型 自然交互,无需结构化指令 “你觉得人工智能的未来会怎样?” 强制逻辑链条(如“分三点回答”) 推理模型 需明确对话目标,避免开放发散 “从技术、伦理、经济三方面分析 AI的未来” 情感化提问(如“你害怕AI吗?”) 逻辑分析 推理模型 直接抛出复杂问题 “分析‘电车难题’中的功利主义0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
数据接口标准化:根据标准格式输出数据, 利用o3mini方便不同系统和平台之间的数据 共享,提升跨机构协作效率。 • 情感分析与数据解读:利用o3mini结合 情感分析,对数据进行深入解读,帮助市场调 研等领域理解消费者情感,优化产品和策略。 • 故事化数据呈现:借助o3mini将数据以 故事的形式呈现,增强数据的可读性和吸引力, 帮助公众理解复杂的科学和技术知识。 • 复杂数据模式识别:借助o3mini高效分 的基础, 使模型在后续的强化学习阶段能够更稳定地学习和优化。它解 决了纯强化学习训练中可能出现的可读性差和语言混杂等问题。 第一阶段:推理 导向的强化学习 基 于 冷 启 动 数 据 微 调 后 的 基 础 模 型 , 进 行 大 规 模 强 化 学 习 。 此 阶 段 引 入 语 言 一 致 性 奖 励 , 优 化 模 型 在 数 学 、 编 程 等 结 构 化 任 务 中 绝 采 样 从 R L 检 查 点 生 成 新 的 合 成 数 据 , 并 与 写 作 、 事 实 问 答 等 领 域的监督数据混合。 然 后 对 基 础 模 型 进 行 两 轮 微 调 , 进 一 步提升模型的性能。 第三阶段:全场 景强化学习 结 合 规 则 奖 励 ( 针 对 推 理 任 务 ) 和 神 经 奖 励 模 型 ( 针 对 通 用 任 务 ) , 对 模0 码力 | 85 页 | 8.31 MB | 7 月前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
生产现场动作远程控制 • 焦化现场生产安全态势 感知与预警 • 部署打滑预测分析 • 能源计划 • 炼焦煤分级调湿工艺稳 定协调控制 • 焦化皮带智能监测 • 生产现场动作远程控制 • 焦化现场生产安全态势 感知与预警 • 部署打滑预测分析 • 能源计划 • 炼焦煤分级调湿工艺稳 定协调控制 • 危险物识别 • 人员安全监测 • 高炉料面温度检测 • 高炉料面可视化监控 • 炉顶布料效果评定0 码力 | 76 页 | 5.02 MB | 5 月前3Deepseek R1 本地部署完全手册
/install.sh)" brew install llama.cpp 2. 下载并合并模型分⽚: 3. 安装Ollama: 4. 创建Modelfile: 5. 运⾏模型: 4. 性能调优与测试 GPU利⽤率低:升级⾼带宽内存(如DDR5 5600+)。 扩展交换空间: 六、注意事项与⻛险提示 1. 成本警示: 70B模型:需3张以上80G显存显卡(如RTX A6000),单卡⽤户不可⾏。0 码力 | 7 页 | 932.77 KB | 7 月前300 Deepseek官方提示词
代码生成:让模型生成一段完成特定功能的代码。 USER 请帮我用 HTML 生成一个五子棋游戏,所有代码都保存在一个 HTML 中。 7. 代码改写:对代码进行修改,来实现纠错、注释、调优等。 USER 下面这段的代码的效率很低,且没有处理边界情况。请先解释这段代码的问题与解决方法,然后进行优化: ``` def fib(n): if n <= 2: return0 码力 | 4 页 | 7.93 KB | 7 月前3DeepSeek图解10页PDF
创造 了一种高效训练,高推理能力 AI 模型的方法。 整个训练过程分为核心两阶段,第一步训练基于 DeepSeek-V3 论文中的基 础模型(而非最终版本),并经历了 SFT 和基于纯强化学习调优 + 通用性 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取 AI 知识,严禁拿此资料引流、出书、等形式的商业活动0 码力 | 11 页 | 2.64 MB | 7 月前3清华大学 普通人如何抓住DeepSeek红利
“先解释快速排序原理,再写出代 码并测试示例 ” 模糊需求(如“写个排序代码 ”) 多轮对话 通用模型 自然交互,无需结构化指令 “你觉得人工智能的未来会怎样? ” 强制逻辑链条(如“分三点回答 ”) 推理模型 需明确对话目标,避免开放发散 “从技术 、伦理 、经济三方面分析 A I的未来 ” 情感化提问(如“你害怕AI吗? ”) 逻辑分析 推理模型 直接抛出复杂问题 “分析‘0 码力 | 65 页 | 4.47 MB | 7 月前3
共 8 条
- 1