清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 用户在不同科研需求下得到充分支持。 增强版绘图功能:增强版具备绘图功能,可通过可视化 图示(如文献关键词共现图)直观展示综述内容,帮助 用户更好理解和呈现研究成果。 无数据检索:以现有真实数据库作为支撑,通过关键词 检索,自动搜集相关文献并生成综述报告,目前只支持 英文检索。 低重复率:结合现有查重机制与AI技术,在内容生成阶 段引入重复检测与优化策略,从源头上降低重复率风险, 所生成的综述普通重复率与AIGC重复率均在5%以下。 无限双语数据导入:支持中文与英文文献的导入,并且 文献数据量没有限制,能够轻松处理中文文献的系统性 梳理,以及国际文献的跨语言分析。 幻觉克服:以现有真实数据库作为支撑,借助由专家设 计撰写的提示词,精准规避AI生成中的幻觉问题。 高规范格式输出:所生成的综述文档格式规范、结构清 晰,符合学术论文标准,用户几乎无需进行二次整理。 中科院PubScholar平台0 码力 | 85 页 | 8.31 MB | 7 月前3普通人学AI指南
. . . . . 27 5.2 docker 下载 MaxKB . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.3 docker 配置 MaxKB . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.4 打开 MaxKB 网页 . . . . . . . . . . . . . . . . . . . . 32 5.5 构建第一个私人知识库 . . . . . . . . . . . . . . . . . . . . . . . . 34 5.6 MaxKB 配置本地 llama3 . . . . . . . . . . . . . . . . . . . . . . 37 5.7 创建知识库应用 . . . . . . . . . . . . . . . AI 编程开发助手,集成在 JetBrains 系列开发工具中,提升编码效率。 9 Figure 6: AI 编程工具 2.4.3 AirOps 用于生成和修改 SQL 语句的工具,旨在简化数据库操作。 2.4.4 ChatDev 面壁智能开发的 AI 智能体开发平台,支持创建和部署智能对话系统。 2.4.5 solo Mozilla 开源项目,提供零代码网站开发功能,易于使用。 20 码力 | 42 页 | 8.39 MB | 7 月前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
废钢槽编号识别 • 皮带胶结头异常检测 • 皮带跑偏检测 • 烧结皮带跑偏检测 • 皮带托辊异常检测 • 分析监测烧结工序物料 成分 • 烧结皮带智能监测 • 烧结设备运行工况检测 • 料场生产计划智能配置 • 烧结矿成分预测 • 烧结矿质量预测 • 烧结烟气 S02 排放在 线预测与控制 • 构建能源消耗预测 • 智能故障诊断 • 挡板位移检测 • 皮带划痕、 撕裂、 跑偏检测预警 • 1球团皮带智能监测 智能体应用案例:定义角色、分解流程 社区医生手工填写患者病历 并传真到斯坦福预约中心 传统人工预约流程 AI辅助预约流程 传真识别智能体 接到传真,人工查看病历 利用多模态大模型,识别传真病历, 并自动录入数据库 数字人打电话给患者,预约就诊时间 大模型查询保险知识库,自动生成理赔申请, 提交保险公司 就诊预约智能体 保险报告生成智能体 人工打电话给患者,预约就诊时间 病人到医院就诊 人工填写理赔申请,提交保险公司0 码力 | 76 页 | 5.02 MB | 5 月前3DeepSeek从入门到精通(20250204)
应对威胁。 c.解释签名式防御如何类似于抗体,能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性,都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆,使系统能够更快地应对重复出现的威胁。 (3)深入探讨启示: a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。 策略: 应用示例 �话题选择原则 • 与内容高相关性 • 活跃度适中的话题 • 避免过度竞争的热门话题 �标签使用策略 • 核心话题前置 • 相关话题补充 • 品牌话题植入 话题配置要求: 主话题:[话题名称] 相关话题:2—3个 位置要求: - 主话题在开头 - 相关话题在正文 - 品牌话题在结尾 选择标准: - 话题活跃度[范围] - 竞争度评估 - 相关性判断 设计反直觉表达 传播策略: - 话题标签选择 - 关键意见领袖互动设计 - 评论引导策略 应用示例 �内容节奏 • 发布频率:依据账号定位和粉 丝活跃度设定 • 内容分类:不同类型内容的比 例配置 • 互动时间:明确重点互动的时 间段 请帮我制定微博账号的内容排期 规划: 账号信息: - 定位:[填写账号定位] - 目标受众:[受众属性] - 当前粉丝量:[数量]0 码力 | 104 页 | 5.37 MB | 7 月前3清华大学 DeepSeek 从入门到精通
应对威胁。 c.解释签名式防御如何类似于抗体,能够快速识别和中和已知威胁。 d.比较系统隔离和清理过程与人体发烧的相似性,都是为了控制“感染”扩散。 e.讨论威胁情报数据库如何类似于免疫记忆,使系统能够更快地应对重复出现的威胁。 (3)深入探讨启示: a.分析免疫系统的适应性如何启发自适应安全系统的设计。 b.探讨免疫系统的分层防御策略如何应用于网络安全的纵深防御概念。 策略: 应用示例 �话题选择原则 • 与内容高相关性 • 活跃度适中的话题 • 避免过度竞争的热门话题 �标签使用策略 • 核心话题前置 • 相关话题补充 • 品牌话题植入 话题配置要求: 主话题:[话题名称] 相关话题:2—3个 位置要求: - 主话题在开头 - 相关话题在正文 - 品牌话题在结尾 选择标准: - 话题活跃度[范围] - 竞争度评估 - 相关性判断 设计反直觉表达 传播策略: - 话题标签选择 - 关键意见领袖互动设计 - 评论引导策略 应用示例 �内容节奏 • 发布频率:依据账号定位和粉 丝活跃度设定 • 内容分类:不同类型内容的比 例配置 • 互动时间:明确重点互动的时 间段 请帮我制定微博账号的内容排期 规划: 账号信息: - 定位:[填写账号定位] - 目标受众:[受众属性] - 当前粉丝量:[数量]0 码力 | 103 页 | 5.40 MB | 8 月前3开源中国 2023 大模型(LLM)技术报告
生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 04 向量数据库/数据库向量支持 为大模型提供高效的存储和检索能力 大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 向量数据库是专门用于存储和检索向量数据的数据库,它可以为 LLM 提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加0 码力 | 32 页 | 13.09 MB | 1 年前3Deepseek R1 本地部署完全手册
为技术团队提供完整的本地部署指南,涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅ 案及完整671B MoE模型的Ollama部署⽅法。 核⼼提示: 个⼈⽤户:不建议部署32B及以上模型,硬件成本极⾼且运维复杂。 企业⽤户:需专业团队⽀持,部署前需评估ROI(投资回报率)。 ⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表 模型参 数 Windows 配置要求 Mac 配置要求 适⽤场景 1.5B MXN系列⽀持70B模型BF16推理,显存利⽤率提升 30% 等效RTX 3090 海光 DCU 适配V3/R1模型,性能对标NVIDIA A100 等效A100(BF16) 2. 国产硬件推荐配置 模型参数 推荐⽅案 适⽤场景 1.5B 太初T100加速卡 个⼈开发者原型验证 14B 昆仑芯K200集群 企业级复杂任务推理 32B 壁彻算⼒平台+昇腾910B集群 科研计算与多模态处理 DeepSeek-R1-Q4_K_M 404 GB ≥500 GB ⾼性能服务器/云GPU 下载地址: HuggingFace模型库 Unsloth AI官⽅说明 2. 硬件配置建议 硬件类型 推荐配置 性能表现(短⽂本⽣成) 消费级设备 Mac Studio(192GB统⼀内存) 10+ token/秒 ⾼性能服务器 4×RTX 4090(96GB显存+384GB内存) 7-8 token/秒(混合推理)0 码力 | 7 页 | 932.77 KB | 7 月前3清华大学 普通人如何抓住DeepSeek红利
据列表形式 呈现。” 关键技巧: p 数据嫁接:若缺乏具体数据,直接让AI生成合理虚构值(标注“示例”规避风险): p “假设园区占地500亩,日均处理包裹量50万件,请计算自动化分拣设备的配置数量,用表格展示。” p 模板复制:对同类章节(如3.1/3.2/3.3)使用相同指令模板,仅替换关键词。 p 强制格式:要求AI输出带编号小标题、分点、表格的内容,直接粘贴后即显“专业感”。 场景1:1小时内写完一个1万字的项目书 第四阶段:10分钟——用AI优化与格式伪装 p统一话术: “将以下段落改写成政府报告风格,加入‘数字化转型’‘双碳战略’等关键词:{粘贴原文}” p生成图表: 指令:“将上文‘设备配置表’转换成LaTeX格式的三线表。”插入图表后,自动增加方案“厚度”。 p最终润色: “检查以下方案书逻辑漏洞,列出3个可能被客户质疑的点,并给出应对答案。” p关键提醒: ü 保命优先级:0 码力 | 65 页 | 4.47 MB | 7 月前3DeepSeek图解10页PDF
DeepSeek 三个比较实际的好处: • 本教程接入的是 DeepSeek 推理模型 R1,开源免费,性能强劲 • 本教程搭建方法 零成本,不需花一分钱。 • 为了照顾到大部分读者,推荐的搭建方法已将电脑配置要求降 到最低,普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama0 码力 | 11 页 | 2.64 MB | 7 月前3人工智能安全治理框架 1.0
保数据来源清晰、途径合规。建立完善的数据安全管理制度,确保数据安全性 和质量,以及合规使用,防范数据泄露、流失、扩散等风险,人工智能产品终 止下线时妥善处理用户数据。 (c)研发者应确保模型算法训练环境的安全性,包括网络安全配置和数 据加密措施等。 (d)研发者应评估模型算法潜在偏见,加强训练数据内容和质量的抽查 检测,设计有效、可靠的对齐算法,确保价值观风险、伦理风险等可控。 (e)研发者应结合目标市场适用法律要求和风险管理要求,评估人工智0 码力 | 20 页 | 3.79 MB | 29 天前3
共 10 条
- 1