积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部综合其他(36)Blender(12)人工智能(7)产品与服务(7)Krita(6)版本控制(3)KiCad(1)

语言

全部中文(简体)(34)中文(简体)(2)

格式

全部PDF文档 PDF(31)其他文档 其他(5)
 
本次搜索耗时 0.031 秒,为您找到相关结果约 36 个.
  • 全部
  • 综合其他
  • Blender
  • 人工智能
  • 产品与服务
  • Krita
  • 版本控制
  • KiCad
  • 全部
  • 中文(简体)
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • 其他文档 其他
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 DeepSeek从入门到精通(20250204)

    DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 e),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和
    0 码力 | 104 页 | 5.37 MB | 7 月前
    3
  • pdf文档 清华大学 DeepSeek 从入门到精通

    DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 e),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 能够处理多维度和非结构化问题,提供创造性的解 决方案 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 CoT链式思维的出现将大模型分为了两类:“概率预测(快速反应)”模型和“链式推理(慢速思考)”模型。 前者适合快速反馈,处理即时任务;后者通过推理解决复杂问题。了解它们的差异有助于根据任务需求选择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和
    0 码力 | 103 页 | 5.40 MB | 8 月前
    3
  • pdf文档 【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

     推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判 之三 模型越做越专  除了少数科技巨头,大多数公司都专注于做专业大模型 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  调用企业专业知识,更懂企业  将日常重复性业务流程形成Playbook,实现流程自动化  通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 之九 开源效果追赶上闭源  技术开放,吸引广大开发人员和用户使用 预训练算力前提下,大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读  预训练模型如GPT——疯狂读书,积 累知识,Scaling law撞墙  预训练模型思考深度不够  算力见顶,变成少数巨头游戏 预训练大模型 推理大模型 预训练大模型难以通往AGI之路  推理模型如R1——通过逻辑链条推导答案, 分解规划,自我反思  预训练范式像是记忆和模仿,强化学习范
    0 码力 | 76 页 | 5.02 MB | 5 月前
    3
  • pdf文档 Moonshot AI 介绍

    到⽤⼾的scaling law,只是个时间问题。 现在⾯对数据瓶颈,这⼀点尤为重要。特别是⼈类偏好数据,它⾮常有限,但没有它⼜不⾏。我觉得 这也是每⼀个AI-Native产品现在最值得思考的问题之⼀。所以,⼀个不⾜够关⼼⽤⼾的公司最终可能 也没法实现AGI。 海外独⻆兽:怎么看MoE?有⼀种说法是MoE不是真正的scaleup,只有scaleupdensemodel 做tradeoff。但是最终直接训练⼀个万亿的densemodel肯定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 的?因为刚刚你也提到了模型是⼀个⿊盒,并且其实⼈类到现在还没有弄清楚⾃⼰的⼤脑是怎么⼯作 的。 杨植麟:可解释性核⼼是个信任的问题。建⽴⼀个信任的⼼智是很重要的,对应的应⽤场景甚⾄可能 海外独⻆兽:Google和抖⾳背后的搜索和推荐有很强的⻜轮效应,算法能根据⽤⼾的⾏为实时反 馈,⽤⼾体验也能不断提升。LLM现在⽆法实时反馈⽤⼾⾏为,AI-Native产品的⻜轮效应会是什 么? 杨植麟:我深⼊思考过这个问题。AI-Native产品最终的核⼼价值是个性化交互,这是以前技术实现得 不好的,所以这个问题其实是关于个性化的⸺怎么让⽤⼾使⽤你的产品多了之后,获得⾼度个性化 的互动体验。今天对
    0 码力 | 74 页 | 1.64 MB | 1 年前
    3
  • pdf文档 清华大学 普通人如何抓住DeepSeek红利

    U I q e T 9 M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 · 柱状图 · 饼图 · 散点图 · 雷达图 · 组合图表 SVG矢量图 · 基础图形 · 图标 · 简单插图 · 流程图 · 组织架构图 常规绘图 DeepSeek的深度思考过程独树一帜 《香料三重奏》茄椒肠卷配酸奶薄荷酱 ??? 灵感地图:巴尔干半岛香料 × 地中海清新感 × 日式天妇罗手 法 ??? 结构解构: 1.青椒薄片 - 采用日式天妇罗手法炸至半透明,形成琥珀色脆网 偏误信息的引入导致讨论变得更加频繁, 意见分布更加多样化,表明确认偏见和 信息噪声对意见动态的显著影响。 50个智能体的在线社区模拟仿真 场景3:多智能体在线社区模拟 场景4:无人区研究+快速出成果 素数位数关系理论及其思考—— 邵宇捷 各思路具体化及 Python验算 人类提供已有参考案例(拉马努金数、 阿姆斯特朗数等) AI提出可能思路 要求AI迭代调整或人 类介入提供具体设想 AI发现魔法数字的一般过程
    0 码力 | 65 页 | 4.47 MB | 7 月前
    3
  • pdf文档 2024 中国开源开发者报告

    本章汇集了来自不同领域专家和开发者对开源大模型和人工 智能技术的深刻见解,不仅涵盖了技术层面的深入探讨,也 触及了社会、伦理和政策层面的广泛议题。 从对中国开源模型崛起的分析,到对开源模型持久性的思考, 再到对超级应用探寻之路的探索,每篇文章都为我们提供了 独特的视角,帮助我们理解开源大模型在 AI 技术领域的作用 和影响。 20 / 111 2024 年中国开源模型:崛起与变革 文/Tiezhen、Adina、Lu 和内存占用过大等挑战, 端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供 了宝贵经验。 推理扩展法则的潜力释放 通过推理扩展法则,模型性能可通过延长“思考时间”而进一步优化。这一技术模拟了人类 “深思熟虑”的过程,显著提升了模型在逻辑推理和复杂任务中的表现。 中国开源社区在逻辑推理领域推出了许多创新项目,包括阿里巴巴国际的 Macro-o1、通义 一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地存在大量数据可用于训练,还蕴含了人类的思维模式。 在此基础上训练得到的 LLM,自然具备被诱导出类人思考的潜力。在 COT(思维链)【4】、 TOT(思维树)【5】等技术的加持下,大模型正在学习拆解自己的“思维”,OpenAI 的 o1 就是 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。
    0 码力 | 111 页 | 11.44 MB | 8 月前
    3
  • pdf文档 DeepSeek图解10页PDF

    DeepSeek 一个问题:请帮我分析 Python 编程如何从零开始学习?,下面是它的回答,首先会有一个 think 标签,这里面嵌入的是它的思考过程,不是正式的回复: 图 5: deepseek-r1 回复之思考部分 等我们看到另一个结束标签 think 后,表明它的思考已经结束,下面一行 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震 AI,欢迎关注获取更多原创教程。资 料用心打磨且开源,是为了帮助更多人了解获取
    0 码力 | 11 页 | 2.64 MB | 7 月前
    3
  • pdf文档 清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

    推理能力专项提升:在除了利用强化学习模型结合跨领域训练提升模 型综合技能以外,还重点提升了模型在数学、代码、逻辑推理等硬核 任务上的能力。  推理过程 DeepSeek R1 在推理过程中采用“深度思考”模式,通过展示完整的 推理路径来提高模型的可解释性和可信度。 在生成答案前展示其推理过 程,让用户看到模型如何分 解问题并得出结论。包括模 型对问题的理解、问题分解、 以及逐步求解的过程。 通过展示推理路径,使得 创建一份综合报告 端到端强化学习 训练 规划执行多步 骤研究流程 实时调整策略 回溯修正错误 文本 PDF 图像 【多格式数据】 支持搜索多格式数据, 整合多模态信息,生 成带引用和思考过程 总结的报告 Text Text Text “引用” DeepResearch:智能协作,自主研究 表现:人类终极考试,准确率突破 26.6% 这项测试包括3000多个多项选择题和简答题, 输入输出格式 支持图像、PDF等多种格式输入输出 主要依赖文本输入输出 模块协作 多个模块协同工作(探索者、整合者、推理者等) 单一模型,无模块化协作 DeepResearch 探索者 整合者 思考者 表达者 技术协同:多步推理,快速输出 DeepResearch能迅速梳理海量文献, 提炼关键信息,显著提升文献综述效率。 文献综述加速 基于深度学习模型,自动生成高质量技 术报告,确保研究成果的准确传达。
    0 码力 | 85 页 | 8.31 MB | 7 月前
    3
  • pdf文档 2021 中国开源年度报告

    域即将起飞了。 从地面行走,到天空飞行,这是两个完全不同的阶段。而 2021 年, 则是起飞之前的助跑阶段。从地面到天空,意味着整个行为的模式 都会发生深刻的变化。我们原来只需要在一个二维平面思考路径与 方向,而到了天空,在三维空间里,我们多了无数选择。 虽然对于未来,对于在空中的状态,我们还无法预测和把握,但是 : 所有人都在奋力奔跑,奋勇向前。 去年的中国开源年度报告,我们总结了三个趋势,今年的报告,我 ,都是 自由的。但是,在软件吞噬世界、开源吞噬软件的今天,开源技术, 2021 中国开源年度报告 3 已经成为整个世界的基础设施之一。能力越大,责任越大。应用越广, 风险越高。我们应该如何思考与保障开源供应链安全呢?应该如何 建设更加健康的开源生态呢?在这样一种生态中,各方的责任又该 如何界定呢? 历史感 开源社已经连续第四年发布中国开源年度报告了,也举办了第六届 中国开源年会 0,允许分发完全自由、允许项目代码被 修改、允许作为开源或商业化软件再次发布,法律层面上 Apache License 约束不了这样的行为。在这 件事上,双方各执一词,引起了人们对开源项目技术归属问题的重视与思考。 图表 18 :Apache Doris 与 Doris DB 的分裂 资料来源:公开资料,云启资本 3.3.2 代码安全风险 开源组件漏洞引起的安全风险也是开源风险
    0 码力 | 132 页 | 14.24 MB | 1 年前
    3
  • pdf文档 清华大学第二弹:DeepSeek赋能职场

    邮箱注册,速度快,但感觉比Cerebras弱一些。 …… DeepSeek 三种模式对比 • 基础模型(V3):通用模型(2024.12),高效便捷,适用于绝大多数任务,“ ”任务 • 深度思考(R1):推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,“ ”任务 • 联网搜索:RAG(检索增强生成),知识库更新至 DeepSeek 两种模型对比 操作规范清晰 且对结果有明确要求 (限定于文本生成任务) DeepSeek 两种模型对比 V3 R1 DeepSeek 两种模型对比 V3 R1 如何提问?两种模型的提示语差异 • 基础模型(V3):“过程-结果”清晰(指令) • 深度思考(R1):目标清晰,结果可以模糊(推理) RTGO提示语结构 Role(角色) 定义AI的角色: 经验丰富的数据分析师 具备十年销售经验的SaaS系统商务 …… Task(任务)
    0 码力 | 35 页 | 9.78 MB | 7 月前
    3
共 36 条
  • 1
  • 2
  • 3
  • 4
前往
页
相关搜索词
DeepSeek入门精通20250204清华华大大学清华大学周鸿祎演讲我们带来创业机会360202502MoonshotAI介绍普通通人普通人如何抓住红利2024中国开源开发开发者报告图解10PDFDeepResearch科研2021年度年度报告第二赋能职场
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩