开源中国 2023 大模型(LLM)技术报告
LLM 技术报告 大语言模型(LLM) 技术作为人工智能领域的一项重要创 新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门 设计来理解、生成和回应自然语言。这些模型通过分析大量 的文本数据来学习语言的结构和用法,从而能够执行各种语 言相关任务。以 GPT 系列为代表,LLM 以其在自然语言 处理领域的卓越表现,成为推动语言理解、生成和应用的引 擎。 LLM 基础设施、应用现状,以及相关的工具和平台。 2 / 32 LLM Tech Map 向量数据库 数据库向量支持 大模型框架、微调 (Fine Tuning) 大模型训练平台与工具 基础设施 LLM Agent 备案上线的中国大模型 知名大模型 知名大模型应用 大模型 算力 工具和平台 LLMOps 大模型聚合平台 开发工具 AI 编程 插件、IDE、终端 代码生成工具 编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心,随着大规模语言数据集的可用性和计算能 力的提升,研究者们开始设计更大规模的神经网络,以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展,其预训练和微调的 方法为语言任0 码力 | 32 页 | 13.09 MB | 1 年前3202306 ⼈⼈可⽤的开源数据可视化分析⼯具
2023 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.61 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 12 ⽉
2022 年 12 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.58 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2022 年 06 ⽉
2022 年 6 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 10.32 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 04 ⽉
2023 年 04 ⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 能够快速、⾼效地 提供体验良好的数 据展现⼿段,通过 分析数据资产的质 量,助⼒企业做出 更加准确的业务策 略。 前端业务⼈员 数据管理⼈员 企业管理者 IT 建设⼈员 提供多种数据使⽤ 模式,提供更为丰 富、安全的数据管 理⼿段,有助于企 业内部进⾏更为⼴ 泛的数据整合与分 析,并由此创造数 据价值。 能够合理评估、规 范 和 洞 察 企 业 信 息,洞悉企业发展 趋 势 , 在 有 效 管 理 IT 投资和降本 投资和降本 增效的同时,挖掘 和发挥数据资产的 价值,辅助企业制 定发展决策。 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃0 码力 | 27 页 | 3.60 MB | 1 年前3DataEase 人人可⽤的开源数据可视化分析⼯具 2023 年 12 ⽉
可以帮助用户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供支持。 人 人 可 用 的 开源数据可视化分析工具 DataEase 的使命 他们都在用 DataEase 累计安装下载约 10 万次,50+ 技术支持群,广受各行各业用户的喜爱 DataEase 功能架构 数据源 DataEase 支持近 20 种常见的数据源,更多数据源支持持续增加中… 核心概念 数据集 通过 通过对表的数据进行关联与处理,用户可自由组合形成自有数据集合,供后续进行业务分析与图表制作使用 核心概念 数据大屏 支持图层管理与大屏尺寸设置 灵活在大型显示器上实时展示各种数据指标和信息,以帮助用户监测业务状况、分析趋势和做出实时决策 大屏制作 大屏展示 核心概念 仪表板 支持元素自动挤压占位,方便用户快速编辑,同时支持设置移动端布局 通常偏向于静态或定期更新,适用于日常分析与制作各项业务数据报告等 各项业务数据报告等 PC 端 移动端 核心概念 连接数据 数据准备 可视化分析 数据源 1 数据源 2 数据源 3 数据源 4 组合及处理数据 数据集 1 数据集 2 数据集 3 数据集 4 仪表板创建与管理 数据大屏创建与管理 数据图表制作 数据实时分析 数据大屏展示 收藏导出分享 DataEase 工作流程 DataEase 支持丰富的数据源连接,能够有0 码力 | 36 页 | 7.05 MB | 1 年前3DataEase 人人可用的开源数据可视化分析工具 2024 年 03 月
可以帮助用户快速分析业务数据并洞察其趋势,为企业的业 务改进与优化提供支持。 人 人 可 用 的 开源数据可视化分析工具 DataEase 的使命 他们都在用 DataEase 累计安装下载约 10 万次,50+ 技术支持群,广受各行各业用户的喜爱 DataEase 功能架构 数据源 DataEase 支持近 20 种常见的数据源,更多数据源支持持续增加中… 核心概念 数据集 通过 通过对表的数据进行关联与处理,用户可自由组合形成自有数据集合,供后续进行业务分析与图表制作使用 核心概念 数据大屏 支持图层管理与大屏尺寸设置 灵活在大型显示器上实时展示各种数据指标和信息,以帮助用户监测业务状况、分析趋势和做出实时决策 大屏制作 大屏展示 核心概念 仪表板 支持元素自动挤压占位,方便用户快速编辑,同时支持设置移动端布局 通常偏向于静态或定期更新,适用于日常分析与制作各项业务数据报告等 各项业务数据报告等 PC 端 移动端 核心概念 连接数据 数据准备 可视化分析 数据源 1 数据源 2 数据源 3 数据源 4 组合及处理数据 数据集 1 数据集 2 数据集 3 数据集 4 仪表板创建与管理 数据大屏创建与管理 数据图表制作 数据实时分析 数据大屏展示 收藏导出分享 DataEase 工作流程 DataEase 支持丰富的数据源连接,能够有0 码力 | 39 页 | 6.95 MB | 1 年前3清华大学 DeepSeek 从入门到精通
• 如何使用Deepseek? DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 全局视野 概率预测(快速反应模型,如ChatGPT 4o) 链式推理(慢速思考模型,如OpenAI o1) 性能表现 响应速度快,算力成本低 慢速思考,算力成本高 运算原理 基于概率预测,通过大量数据训练来快速预测可能 的答案 基于链式思维(Chain-of-Thought),逐步推理 问题的每个步骤来得到答案 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时做出决策 创造力0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学第二弹:DeepSeek赋能职场
Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型 基座大模型 人机协同 Chatbot •自然语言对话 Reasoner •基本的推理和问 题解决能力 Agent •代表用户执行任 务,具备自主行 动能力 Innovator • 参与发明和创造, • 致力于人机协同和人机共生领域的世界级团队,专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。 团队愿景 • 李默非(清华大学人工智能学院拟录博士生):人机共生之基座大模型研究研发 • 何静(清华博士后、北航助理教授):人机共生之快生引擎研究研发 • 尤可可(清华博士后、北石化助理教授):人机共生之AIGC短视频 • 安梦瑶(清华大学博士后):人机共生之AI诊疗研究 罗雨果(清华大学拟录博士生):人机共生之传播分析 • 章艾媛(清华大学博士生):人机共生之数据分析 • 邹开元(清华大学博士生):人机共生之文学内容创作 • 向安玲(清华博士后、中央民大助理教授):人机共生之AI数据分析领域 • 马绪峰(清华博士后、同济大学助理教授):人机共生之文化艺术创作 成员及核心研究方向 赛事 奖项 2024 “AI4S Cup LLM 挑战赛” 大模型科学文献分析赛道 一等奖 2024 Kaggl0 码力 | 35 页 | 9.78 MB | 7 月前3清华大学 普通人如何抓住DeepSeek红利
DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正 式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大 提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAl-o1正式版。 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 数据可视化 数据分析 趋势分析 多模态交互 任务执行 任务协调 工具调用 格式转换 关系抽取 语言理解 文案写作 代码注释 故事创作 通用问答 专业领域问答 因果推理 知识推理 模块填充+数据嫁接。 分步解决方案: 第一阶段:5分钟——用AI暴力生成框架(目标:3000字) 场景1:1小时内写完一个1万字的项目书 第二阶段:20分钟——用AI批量填充模块(目标:6000字) 针对每个小节单独提问,例如: “写一段‘2.1 功能分区’的内容,要求包含自动化立体仓库、AGV调度中心、冷链专区的技术参数,用数据列表形式 呈现。” 关键技巧: p 数据嫁接:若缺0 码力 | 65 页 | 4.47 MB | 7 月前3
共 196 条
- 1
- 2
- 3
- 4
- 5
- 6
- 20