类型类 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板（如要求分步思考、提供示例）。关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择（如数学任务选推理模型，创意任务选通用模型）。提示语设计 • 推理模型：简洁指令，聚焦目标，信任其内化能力。（“要什么直接说”）。 • 通用模型：结构化、补偿性引导（“缺什么补什么”）。避免误区 • 不要对推理模型使用“启发式”提示（如角色扮演），可能干扰其逻辑主线。 • 不要对通用模型“过度信任”（如直接询问复杂推理问题，需分步验证结果）。从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数，输出需包含注释。” ✅ 结果精准高效

0 码力 | 104 页 | 5.37 MB | 7 月前
3
清华大学 DeepSeek 从入门到精通

擅长解决结构化和定义明确的问题能够处理多维度和非结构化问题，提供创造性的解决方案伦理问题作为受控工具，几乎没有伦理问题引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类：“概率预测（快速反应）”模型和“链式推理（慢速思考）”模型。前者适合快速反馈，处理即时任务；后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合适的模型，实现最佳效果。提示语策略差异 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板（如要求分步思考、提供示例）。关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择（如数学任务选推理模型，创意任务选通用模型）。提示语设计 • 推理模型：简洁指令，聚焦目标，信任其内化能力。（“要什么直接说”）。 • 通用模型：结构化、补偿性引导（“缺什么补什么”）。避免误区 • 不要对推理模型使用“启发式”提示（如角色扮演），可能干扰其逻辑主线。 • 不要对通用模型“过度信任”（如直接询问复杂推理问题，需分步验证结果）。从“下达指令”到“表达需求” 策略类型定义与目标适用场景示例（推理模型适用）优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数，输出需包含注释。” ✅ 结果精准高效

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

知识推理 • 逻辑问题解答(数学、常识推理 ) • 因果分析(事件关联性) 自然语言理解与分析文本分类 • 文本分类 • 主题标签生成(如新闻分类) • 垃圾内容检测 Mermaid图表 · 流程图 · 时序图 · 类图 · 状态图 · 实体关系图 · 思维导图 React图表 · 折线图 · 柱状图 · 饼图 · 散点图 · 雷达图 · 组合图表 SVG矢量图场景4：无人区研究+快速出成果素数位数关系理论及其思考—— 邵宇捷各思路具体化及 Python验算人类提供已有参考案例（拉马努金数、阿姆斯特朗数等） AI提出可能思路要求AI迭代调整或人类介入提供具体设想 AI发现魔法数字的一般过程思路可用，并非刻意构造有刻意构造嫌疑方案可行输出结果及理论体系化方案不可行 Python验算无符合数字有符合数字推理过程（若强行拆解步骤，反而可能限制其能力）。 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板（如要求分步思考、提供示例）。策略类型定义与目标适用场景示例（推理模型适用）优势与风险指令驱动直接给出明确步骤或格式要求简单任务、需快速执行 “用Python编写快速排序函数，输出需包含注释。

0 码力 | 65 页 | 4.47 MB | 7 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

2、对数据集进行深入分析和数据挖掘任务 DeepSeek R1 能够准确对数据进行分类，从多个维度进行梳理和分析，借助可视化图表进行数据挖掘，基于分析结果提供可行建议，但整体数据挖掘深度较浅，缺少对不同类型数据直接关联性的探究。第一轮对话：第二轮对话：（基于初步分析结果，选择其中一部分或某个方向进行深入的数据挖掘）提示词测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因策制定、质量评估或产品验证的最终依据。数据可视化基于titanic遇难者数据分析结果绘制可视化图表任务  Open AI o3mini的数据可视化能力突出，能够直接高效地生成多种类型可视化图表，准确度高；  DeepSeek R1、Kimi k1.5均能基于分析结果提供多种可视化图表绘制方案，但都需要依靠运行 Python代码才能完成绘图任务，部分代码会出现错误 Open Markdown 表格的形式提供，表格有两列，标题为中文。第一列给出英文标题，第二列给出中文解释。以下文本为摘要：【指令后加上文章的摘要】。中-英、英-中互译指令指令：我想让你充当一名科研类的英汉翻译，我会向你提供一种语言的一些段落，你的任务是将这些段落准确地、学术性地翻译成另一种语言。翻译后不要重复原文提供的段落。您应使用人工智能工具（如自然语言处理）以及有关有效写作技巧的修辞

0 码力 | 85 页 | 8.31 MB | 7 月前
3
人工智能安全治理框架 1.0

措施。关注安全风险发展变化，快速动态精准调整治理措施，持续优化治理机制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发应用生态链，明确模型算法研发者、服务提供者、使用者等相关主体的安全责任，有机发挥政府监管、行业自律、社会监督等治理机制作用。 1.4 开放合作、共治共享。在全球范围推动人工智能安全治理国际合作，共享最佳实践，提倡建立开放性平台，通过跨学科、跨领域、跨地区、跨国界的对话和合作，推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成基于风险管理理念，本框架针对不同类型的人工智能安全风险，从技术、管理两方面提出防范应对措施。同时，目前人工智能研发应用仍在快速发展，安全风险的表现形式、影响程度、认识感知亦随之变化，防范应对措施也将相应动态调整更新，需要各方共同对治理框架持续优化完善。、- 5 - 人工智能安全治理框架漏洞等脆弱点，还可能被恶意植入后门，存在被触发和攻击利用的风险。（b）算力安全风险。人工智能训练运行所依赖的算力基础设施，涉及多源、泛在算力节点，不同类型计算资源，面临算力资源恶意消耗、算力层面风险跨边界传递等风险。（c）供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。但个别国家利用技术垄断和出口管制等单边强制措施制造发展壁垒，恶意阻断

0 码力 | 20 页 | 3.79 MB | 29 天前
3
开源中国 2023 大模型(LLM)技术报告

向量数据库是专门用于存储和检索向量数据的数据库，它可以为 LLM 提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如 Copilot 16 / 32 大模型应用现状：知名大模型在全球范围内，已经发布了多款知名大模型，这些大模型在各个领域都取得了突破性的进展。处理文本数据的 GPT-4，能同时处理和理解多种类型数据的多模态模型 DALL-E 3，以及开源大模型的代表 Lllama 2 都在短时间内获得了大量关注和用户，构成了大模型领域的「第一梯队」。讯飞星火 17 / 32 大模型应用现状：首批备案上线的中国大模型科技团队自研，面向通用AI计算的芯片核心架构昆仑芯 XPU 从AI落地的实际需求出发，按照复杂前沿的人工智能场景需求开展迭代，致力为开发者提供通用、易用、高性能的算力来源。 DCU 系列产品以 GPGPU 架构为基础，兼容通用的“类 CUDA”环境以及国际主流商业计算软件和人工智能软件，可广泛应用于大数据处理、人工智能、商业计算等应用领域。通用 GPU 高端芯片及超级算力系统提供商。拥有云边协同、训推组合的完整通用算力

0 码力 | 32 页 | 13.09 MB | 1 年前
3
普通人学AI指南

40 3 1 AI 大模型基础 1.1 AIGC AIGC 是指使用人工智能模型生成内容的技术。这些内容可以包括图像、音频、文本、视频、3D 模型等。具体来说，AIGC 技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技术处于早期阶段，最常见的产品形态是基于文本的，通过用大家有没有觉得 AI 工具太多，种类太多，老的还没用，新的就出来，头大得很！有没有这种感觉？所以，在这一章，梳理主流的 AI 工具，注意不是穷举，那些不经常用的工具，不浪费文字和耽误时间。梳理总结六大类 AI 工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT

0 码力 | 42 页 | 8.39 MB | 7 月前
3
清华大学第二弹：DeepSeek赋能职场

Objective（操作要求）字数要求、段落结构、用词风格、内容要点、输出格式… CO-STAR提示语框架新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R"，代表 "Response"，想要的回应类型。一份详细的研究报告？一个表格？ Markdown格式？ "C"代表 “Context（上下文）” 相关的背景信息，比如你自己或是你希望它完成的任务的信息。 "O"代表 “Objective aid语法的图表代码。技能: 熟悉Mermaid的图表类型和语法，能高效将流程转化为代码。理解流程分析、架构设计及结构化展示等领域知识。约束: 代码必须符合Mermaid语法规范。流程和结构表达需准确清晰。流程图需要有二级、三级等多层级。输出的代码格式应简洁且易于理解。工作流程: 询问用户希望绘制哪种类型的图表。收集详细的流程或架构描述。根据描述分析并设计图表结构。

0 码力 | 35 页 | 9.78 MB | 7 月前
3
DeepSeek图解10页PDF

通用强化学习训练过程最终偏好调整（Preference Tuning），如下图11所示。通用强化学习训练过程后，使得 R1 不仅在推理任务中表现卓越，同时在非推理任务中也表现出色。但由于其能力拓展至非推理类应用，因此在这些应用中引入了帮助性（helpfulness）和安全性（safety）奖励模型（类似于 Llama 模型），以优化与这些应用相关的提示处理能力。 DeepSeek-R1 是训练流程的终点，结合了

0 码力 | 11 页 | 2.64 MB | 7 月前
3
Deepseek R1 本地部署完全手册

DeepSeek-R1-Q4_K_M 404 GB ≥500 GB ⾼性能服务器/云GPU 下载地址： HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议硬件类型推荐配置性能表现（短⽂本⽣成）消费级设备 Mac Studio（192GB统⼀内存） 10+ token/秒⾼性能服务器 4×RTX 4090（96GB显存+384GB内存） 7-8 token/秒（混合推理）

0 码力 | 7 页 | 932.77 KB | 7 月前
3

共 10 条前往

页

分类

语言

格式