DeepSeek从入门到精通(20250204)
慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 创新的火花:如何设计出独具匠心的提示语? 抽象—具体循环法:在不同抽象层次间灵活切换 运用类比与隐喻:增强创意表达 ▪ 分解与重组:先将复杂问题分解为简单组件,再设 计其交互方式。 ▪ 互动规则设定:在提示语中定义组件互动规则。 ▪ 整体行为观察:设计机制来观察和解释从互动中涌 现的整体行为。 抽象化问题 具体化反馈 迭代优化 使用类比说明复杂概念 隐喻增强语言的表达层次 选择具备启发性的类比 定义创意领域:明确需要创新的具体领域或问题 2. 构建多元素库:收集与创意领域相关和不相关的多样化 元素 3. 设计随机抽取机制:创建一个可以随机选择元素的系统 4. 制定组合规则:设定如何将随机元素组合在一起的规则 5. 生成组合提示:创建引导AI进行随机组合的提示语 应用示例 元素库构建 随机抽取 假设要为一家咖啡连锁店设计一个创新的营销活动,可以使用RCM来激发创 意。 元素库构建:0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力 限于模式识别和优化,缺乏真正的创新能力 能够生成新的创意和解决方案,具备创新能力 人机互动能力 按照预设脚本响应,较难理解人类情感和意图 更自然地与人互动,理解复杂情感和意图 创新的火花:如何设计出独具匠心的提示语? 抽象—具体循环法:在不同抽象层次间灵活切换 运用类比与隐喻:增强创意表达 ▪ 分解与重组:先将复杂问题分解为简单组件,再设 计其交互方式。 ▪ 互动规则设定:在提示语中定义组件互动规则。 ▪ 整体行为观察:设计机制来观察和解释从互动中涌 现的整体行为。 抽象化问题 具体化反馈 迭代优化 使用类比说明复杂概念 隐喻增强语言的表达层次 选择具备启发性的类比 定义创意领域:明确需要创新的具体领域或问题 2. 构建多元素库:收集与创意领域相关和不相关的多样化 元素 3. 设计随机抽取机制:创建一个可以随机选择元素的系统 4. 制定组合规则:设定如何将随机元素组合在一起的规则 5. 生成组合提示:创建引导AI进行随机组合的提示语 应用示例 元素库构建 随机抽取 假设要为一家咖啡连锁店设计一个创新的营销活动,可以使用RCM来激发创 意。 元素库构建:0 码力 | 103 页 | 5.40 MB | 8 月前3人工智能安全治理框架 1.0
的、偏激的等有害信息内容。训练数据还面临攻击者篡改、注入错误、误导数 据的“投毒”风险,“污染”模型的概率分布,进而造成准确性、可信度下降。 (c)训练数据标注不规范风险。训练数据标注过程中,存在因标注规则 不完备、标注人员能力不够、标注错误等问题,不仅会影响模型算法准确度、 可靠性、有效性,还可能导致训练偏差、偏见歧视放大、泛化能力不足或输出 错误。 (d)数据泄露风险。人工智能研发应用过程中,因数据处理不当、非授 能消除模型算法存在的安全缺陷、歧视性倾向,提高鲁棒性。 4.1.2 数据安全风险应对 (a) 在训练数据和用户交互数据的收集、存储、使用、加工、传输、提 供、公开、删除等各环节,应遵循数据收集使用、个人信息处理的安全规则, 严格落实关于用户控制权、知情权、选择权等法律法规明确的合法权益。 (b) 加强知识产权保护,在训练数据选择、结果输出等环节防止侵犯知 识产权。 (c) 对训练数据进行严格筛选,确保不包含核生化导武器等高危领域敏 理,商用版本应 可以回退到以前的商用版本。 (g)研发者应定期开展安全评估测试,测试前明确测试目标、范围和安 全维度,构建多样化的测试数据集,涵盖各种应用场景。 (h)研发者应制定明确的测试规则和方法,包括人工测试、自动测试、 混合测试等,利用沙箱仿真等技术对模型进行充分测试和验证。 (i) 研发者应评估人工智能模型算法对外界干扰的容忍程度,以适用范 围、注意事项或使用禁忌的形式告知服务提供者和使用者。0 码力 | 20 页 | 3.79 MB | 1 月前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
重塑经济图景 解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 等带来巨大改进,降低成本和算力要求 低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43政企、创业者必读 人工智能的目标是星辰大海,是为了让人类在科技上有突破 基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型0 码力 | 76 页 | 5.02 MB | 5 月前3清华大学 普通人如何抓住DeepSeek红利
和数据。 认知:与哲学、认知科学 中的认知框架和自指性理 论相连,探讨了AI在生成 过程中如何受限于其既有 的认知结构。 循环:强调了AI生成内容 时容易陷入语义和逻辑上 的循环,无法跳出既定的 模式和规则。 边界:与康德的认识论和 复杂系统理论中的边界效 应相关,表明AI在认知和 生成过程中受限于其系统 结构和复杂度边界。 智能体知识生成边界的探索 仅仅评估模拟生成的有效性是不够的,更核心问题在于理解智能 体系和分析创新条件,探索智能体如何推动知识生成从常规化迈 向创新化。 智能体知识循环边界的研究 智能体在长时间对话中常表现出“知识循环边界”,即生成内容 重复或局限于特定模式的现象,源于训练数据、算法模型及预设 规则的限制。这一现象与逻辑学中的自指问题(如罗素悖论、哥 德尔定理)相关。 研究通过实验分析问题类型(全收敛、半收敛、非收敛)和对话 次数(50次、100次、150次)对生成内容相似性与创新性的影响,0 码力 | 65 页 | 4.47 MB | 7 月前3清华大学第二弹:DeepSeek赋能职场
目标确定性高 (结果可预期) 目标开放性高 (结果多样性) Route (路径灵活性) 线性路径 (流程标准化) 网状路径 (多路径探索) Responsiveness (响应模式) 被动适配 (按规则执行) 主动创新 (自主决策) Risk (风险特征) 低风险 (稳定可控) 高风险 (不确定性高) (限定于文本生成任务) DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比0 码力 | 35 页 | 9.78 MB | 7 月前3开源中国 2023 大模型(LLM)技术报告
GPU 跑 2 周。以每张卡 10 万人民币的价格计算,单 次训练成本就将达到 25-35 亿人民币。 10月17日,美国商务部工业和安全局(BIS)公布新的先进计算芯 片、半导体制造设备出口管制规则,限制中国购买和制造高端芯 片的能力,受管制的包括但不限于 NVIDIA A100、H100、 A800、H800、L40、L40S 以及集成这些高性能计算的 DGX/HGX 系统,并将中国 GPU0 码力 | 32 页 | 13.09 MB | 1 年前3
共 7 条
- 1