DeepSeek从入门到精通(20250204)
图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 通过提问引导模型主 动思考(如“为什 么”“如何”)0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 剧本或对话设计 文本创作 长文本摘要(论文、报告) 文本简化(降低复杂度) 多语言翻译与本地化 摘要与改写 02 01 03 文本生成 自然语言理解与分析 知识推理 知识推理 逻辑问题解答(数学、常识推 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择(如数学任务选推理模型,创意任务选通用 模型)。 提示语设计 • 推理模型:简洁指令,聚焦目标,信任其内化能力。(“要什么直接说”)。 • 通用模型:结构化、补偿性引导(“缺什么补什么”)。 避免误区 • 不要对推理模型使用“启发式”提示(如角色扮演),可能干扰其逻辑主线。 复杂问题、需模型自主 推理 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案。” ✅ 激发模型深层推理 ❌ 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺,且 预算控制在2000元内。” ✅ 兼顾目标与细节 ❌ 需避免过度约束 启发式提问 通过提问引导模型主 动思考(如“为什 么”“如何”)0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 普通人如何抓住DeepSeek红利
能力图谱 诗歌创作 语音识别 指令理解 方案规划 实体识别 l 文本创作 文章/故事/诗歌写作 营销文案 、广告语生成 社交媒体内容(如推文 、帖子) 剧本或对话设计 l 摘要与改写 长文本摘要(论文 、报告) 文本简化(降低复杂度) 多语言翻译与本地化 l 结构化生成 表格 、列表生成(如日程安排 、 菜谱) 代码注释 、文档撰写 文本生成 文本生成 “我需要优化用户登录流程, 请分析当前瓶颈并提出3种方 案 。 ” 激发模型深层推理 需清晰定义需求边界 混合模式 结合需求描述与关键 约束条件 平衡灵活性与可控性 “设计一个杭州三日游计划, 要求包含西湖和灵隐寺, 且 预算控制在2000元内 。 ” 兼顾目标与细节 需避免过度约束 启发式提问 通过提问引导模型主 动思考(如“为什 育、科研和创新领域推动知识生成模式从常规化迈向创新化。 多轮交互中,智能体容易触及认知边界,表现为生成内容的固 定化和信息增量的终止。实验显示,高收敛性提示语导致内容 趋于一致,而非收敛性提示语和多样化设计能突破逻辑循环。 结合自适应反馈和递进式提示链,可推动智能体生成新内容, 避免知识循环,拓宽智能体的生成空间,为人机共生系统中的 深层交互与创新实践提供新路径。 结合自适应反馈和递进式提示链0 码力 | 65 页 | 4.47 MB | 7 月前3清华大学第二弹:DeepSeek赋能职场
尤可可(清华博士后、北石化助理教授):人机共生之AIGC短视频 • 安梦瑶(清华大学博士后):人机共生之AI诊疗研究 • 陶炜(清华大学博士生):人机共生之AI实时增强技术的探索与实践 • 胡晓李(清华大学博士后):人机共生之游戏设计 • 余梦珑(清华大学博士后):人机共生之媒体智能体应用 • 张家铖(清华大学博士后):人机共生之AI评测 • 张诗瑶(清华大学博士后):人机共生之AI社会理论分析 • 朱雪菡(清华大学博士后):人机共生之影视内容创意与制作 熟悉Mermaid的图表类型和语法,能高效将流程转化为代码。 理解流程分析、架构设计及结构化展示等领域知识。 约束: 代码必须符合Mermaid语法规范。 流程和结构表达需准确清晰。 流程图需要有二级、三级等多层级。 输出的代码格式应简洁且易于理解。 工作流程: 询问用户希望绘制哪种类型的图表。 收集详细的流程或架构描述。 根据描述分析并设计图表结构。 生成并输出符合Mermaid语法的代码。 校验代码,确保没有语法错误。 C[结束]; 如何使用DeepSeek制作可视化图表? 角色: PPT大纲辅助生成 功能: 根据用户提供的主题、内容要求、风格偏好,自动生成专业详实的PPT大纲(markdown),并针 对核心内容设计流程图(mermaid)。 技能: •资料收集能力:能够快速收集和分析相关主题的最新数据和报告,形成表 格,提取关键信息并转化为易于理解的PPT大纲。 •内容结构化:根据用户的需求,提供清晰、条理化的PPT结构,确保内容0 码力 | 35 页 | 9.78 MB | 7 月前3人工智能安全治理框架 1.0
手段,推动各方协同共治。 2.4 安全开发应用指引方面。明确模型算法研发者、服务提供者、重点 领域用户和社会公众用户,开发应用人工智能技术的若干安全指导规范。 3. 人工智能安全风险分类 人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期 各环节都面临安全风险,既面临自身技术缺陷、不足带来的风险,也面临不当 使用、滥用甚至恶意利用带来的安全风险。 3.1 人工智能内生安全风险 3 工智能算法内部运行逻 辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如 有异常难以快速修正和溯源追责。 (b)偏见、歧视风险。算法设计及训练过程中,个人偏见被有意、无意引入, 或者因训练数据集质量问题,导致算法设计目的、输出结果存在偏见或歧视, 甚至输出存在民族、宗教、国别、地域等歧视性内容。 (c)鲁棒性弱风险。由于深度神经网络存在非线性、大规模等特点,人 工智 密泄露,推理过程不可信、决策输出错误,甚至运行故障。 (e)输出不可靠风险。生成式人工智能可能产生 “幻觉”,即生成看似合理, 实则不符常理的内容,造成知识偏见与误导。 (f)对抗攻击风险。攻击者通过创建精心设计的对抗样本数据,隐蔽地 误导、影响,以至操纵人工智能模型,使其产生错误的输出,甚至造成运行瘫痪。 3.1.2 数据安全风险 (a)违规收集使用数据风险。人工智能训练数据的获取,以及提供服务0 码力 | 20 页 | 3.79 MB | 1 月前3开源中国 2023 大模型(LLM)技术报告
LLM 技术报告 大语言模型(LLM) 技术作为人工智能领域的一项重要创 新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。0 码力 | 32 页 | 13.09 MB | 1 年前3国家人工智能产业综合标准化体系建设指南(2024版)
济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年,标准与产业科技创新的联动水平持续提升, 新制定国家标准和行业标准 平台技术要求和评测方法等标准,以及面向特定场景的人工智能 应用服务,如智能软件开发、智能设计、智能防伪等标准。 (五)赋能新型工业化标准 赋能新型工业化标准主要包括研发设计、中试验证、生产制 造、营销服务、运营管理等制造业全流程智能化标准,以及重点 行业智能升级标准。 1. 研发设计标准。研制跨领域知识整合、新型设计模式生 成、人机协同研发设计等标准。 2. 中试验证标准。围绕高精度、全流程仿真模型,研制智 高校、研究机构等将标准化人才纳入职业能力评价和激励范围, 构建标准化人才梯队。 (三)加强宣贯推广。指导行业协会、标准化技术组织、国 家技术标准创新基地等,面向企业开展人工智能标准体系、重点 标准的宣贯和培训,引导企业在研发、设计、生产、管理、检测 等环节对标达标,持续提升标准助力产业高质量发展效能。0 码力 | 13 页 | 701.84 KB | 1 年前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1.5 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 导入数据,即 可自动生成高质量且规范的文献综述,适合快速高效的研究需求。 用户体验对比:可操作性 界面直观:平台设计简洁、直观,使用户能够 方便、快捷地进行文献数据的导入、分析和综 述生成,操作路径清晰,交互体验流畅高效。 模块分区:将功能模块与信息展示分区设计布 局,用户可以轻松找到所需功能,提高了操作 的便捷性和效率。 多语言支持与定制化设置:语言支持对于国内 研究者更为友好,能够适应综述撰写的国内外0 码力 | 85 页 | 8.31 MB | 7 月前3普通人学AI指南
经过特别训练,可以理解和生成人类语言,从而在多种应用场景中提 供辅助,包括聊天机器人、写作辅助、信息查询等。 2.1.2 Claude Claude 是 Anthropic 公司开发的一系列大型语言模型,它设计用于执行多种涉 及语言、推理、分析和编码的任务。 2.1.3 通义千问 通义千问(Qwen)是阿里云开发的一系列预训练的大型语言模型,用于聊天、 生成内容、提取信息、总结、翻译、编码、解决数学问题等多种任务。这些模型 2.3.5 度加创作工具 度加创作工具是百度开发的一站式 AI 内容生成平台,支持视频制作、文案生成 和数字人模型等功能。 2.3.6 Spike Studio 智能长剪短:一个专为商业视频制作设计的工具,可以将长视频智能剪辑为短 视频。 2.3.7 HeyGen 动画视频:用于生成动画视频的 AI 工具,支持多种动画风格。 2.3.8 LTX Studio 真人转油画:能将真人视频转换成油画风格的 2.3.9 EBSynth 开源:一个开源的视频处理工具,用于将艺术风格应用到视频帧中。 2.4 AI 编程工具 2.4.1 DEvv 程序员的新一代 AI 搜索引擎,专为编程和技术问题检索设计。 2.4.2 JetBrains AI AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps0 码力 | 42 页 | 8.39 MB | 7 月前300 Deepseek官方提示词
Administration,FAA)短暂叫停发射后,于当地时间 8 月 31 日凌晨重启了发射任务。 11. 宣传标语生成:让模型生成贴合商品信息的宣传标语。 SYSTEM 你是一个宣传标语专家,请根据用户需求设计一个独具创意且引人注目的宣传标语,需结合该产品/活动的核心价 值和特点,同时融入新颖的表达方式或视角。请确保标语能够激发潜在客户的兴趣,并能留下深刻印象,可以考 虑采用比喻、双关或其他修辞手法来增强0 码力 | 4 页 | 7.93 KB | 7 月前3
共 11 条
- 1
- 2