2024 中国开源开发者报告
2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 同时,「民间」开源组织虽然在 关注度上不及大厂主导的项目, 但它们在某些技术细分领域中却 拥有非常强的影响力和活跃的开 发者社区。 两者的不同发展模式相互补充, 共同推动了国内开源生态的繁荣 与多样化。 最受关注开源组织指2024年获得 Star 数最多的开源组织(成员5人及以上) 8 / 111 本年度最受开发者喜爱的开源组织 最受喜爱开源组织指2024年获得 Star 数最多的开源组织(成员5人及以上) ,小模型在特定任务优化上的优势愈发突出, 预计将在金融、医疗和工业自动化等热门领域发挥引领作用,以更高效、更精准的方式满足多样 化需求,帮助人工智能在实际应用场景中落地。 开源多元化与应用细分 中国开源模型的发展不仅体现在技术突破上,还在生态建设中展现出巨大的活力。中国开源 模型从竞争激烈的“百模大战”逐步迈向多元化和深度细分,国内社区在今年发布了大量高质量 开源模型,尤其是多模态理解与生成模型:0 码力 | 111 页 | 11.44 MB | 8 月前3【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502
DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向 Scaling Law边际效应递减 人类训练数据接近枯竭 合成数据无法创造新知识 推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地 能够调用各种工具,具有行动能力 调用企业专业知识,更懂企业 将日常重复性业务流程形成Playbook,实现流程自动化 通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判 Law 大数据+大参数+大算力的 预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 模难以带来质的提升 • 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 • 通过后训练算力和推理算力,在不增加0 码力 | 76 页 | 5.02 MB | 5 月前3国家人工智能产业综合标准化体系建设指南(2024版)
1 国家人工智能产业综合标准化体系建设指南 (2024版) 为深入贯彻落实党中央、国务院关于加快发展人工智能 的部署要求,贯彻落实《国家标准化发展纲要》《全球人工 智能治理倡议》,进一步加强人工智能标准化工作系统谋划, 加快构建满足人工智能产业高质量发展和“人工智能+”高水 平赋能需求的标准体系,夯实标准对推动技术进步、促进企 业发展、引领产业升级、保障产业安全的支撑作用,更好推 进人工智能赋能新型工业化,特制定本指南。 一、产业发展现状 人工智能是引领新一轮科技革命和产业变革的基础性 和战略性技术,正成为发展新质生产力的重要引擎,加速和 实体经济深度融合,全面赋能新型工业化,深刻改变工业生 产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 彻党的二十大和二十届二中全会精神,认真落实中央经济工 作会议和全国新型工业化推进大会部署要求,完整、准确、 全面贯彻新发展理念,统筹高质量发展和高水平安全,加快 赋能新型工业化,以抢抓人工智能产业发展先机为目标,完 善人工智能标准工作顶层设计,强化全产业链标准工作协 同,统筹推进标准的研究、制定、实施和国际化,为推动我 国人工智能产业高质量发展提供坚实的技术支撑。 到 2026 年0 码力 | 13 页 | 701.84 KB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
2021 网易数帆 领先的数字化转型技术与服务提供商 网易数帆是网易集团旗下 TO B 企业服务品牌,定位于领先的数字化转型 技术与服务提供商,为客户提供创新、可靠的国产软件基础平台产品及相 应技术服务,业务覆盖云原生基础软件、数据智能全链路产品、人工智能 算法应用三大领域,旗下拥有轻舟、有数、易智三大产品线,致力于帮助 客户搭建无绑定、高兼容、自主可控的创新基础平台架构,快速应对新一 一 代信息技术下实现数字化转型的需求。 网易数帆依托网易二十余年互联网技术积累,系列软件基础平台产品和技 术方案,成熟应用于金融、零售、制造、能源、电信、物流等多个行业领 域,在技术先进性、性能优越性、产品成熟度及安全可靠性等方面得到了 各行业客户的验证。目前已服务各领域头部客户百余家,包括工商银行、 浙商银行、银监会、人保金服、深圳证券交易所、华泰证券、名创优品、 古茗、百胜集团 等诸多大中型客户。 以“开放、开源、跨云”为技术理念,网易数帆大力推动技术研究,先后取 得“工信部云计算服务能力标准首批试点单位”、“国家企业技术中心”、“信 通院云计算标准和开源推进委员会成员”、“信通院大数据技术标准推进委 员会成员”、“信创工委会成员”等机构资质。同时,网易数帆积极推动跨厂 商的数字化技术融合发展,与AWS、阿里云、百度云、华为鲲鹏云计算、 浪潮、新华三等多家企业完成技术兼容性认证。0 码力 | 43 页 | 884.64 KB | 1 年前32023年中国基础软件开源产业研究白皮书
通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开发者选择要参与的开源项目;4)开源产业联盟往往会对行业贡献 技术指标、开源规范等,引导行业专业化发展。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 开源产业链 运营: 发起者为运营者 开源技术论坛\开源社区评估机构\开源产业联盟 提供参与者交流的平台,推动开源技术发展、打造最佳实践 使用开源项目 27.8% 参与代码贡献 18.2% 参与传播开源项目 13.8% 参与文档相关贡献 10.9% 参加开源兴趣小组 8.9% 协助社区活动举办 5.5% 维护基于开源商业化项目 5.2% 开源布道者 4.5% 参与开源社区运营工作 4.4% 其他 0.9% 开源社区中,使用者比例最高,使用开源软件、发掘开源代码是大多 数开发者加入开源项目的起点,随着与社区的绑定不断加深,使用者 个人开发者以爱好为导向,企业开发者重视商业化价值 以开发者属性分类,开源开发者可分为个人开发者、企业开发者。这两种类型群体在参与开源项目的过程中,行为上有明显差异。 个人开发者多数同时也是企业中的程序开发人员,在业余时间选择开源社区丰富自身知识储备,以兴趣为导向提供代码改进建议。 企业开发者旨在实现商业收益,选取优秀开源代码,并根据自身的行业Knowhow,在其上二次开发产出定制化的行业发行版本。 来源:根0 码力 | 43 页 | 4.69 MB | 1 年前3中国开源软件产业研究报告
来源:艾瑞咨询研究院自主研究及绘制。 摘要 SMS 开源与云计算:开源软件与云计算产业既有互相促进的良性合作,也有因利益纠纷带来的冲 突和矛盾。一方面,云计算产业的大量的基础软件都是开源软件,开源生态为云计算行业的 产品创新提供了持续的动力,而云服务企业的平台也为众多开源软件提供了市场分发渠道; 另一方面,由于全球范围内普遍存在云企业托管开源软件后不回馈开源社区的情况,二者的 发展理念也存在一定矛盾。 费提供给使用者,同时要求使用者遵循一定的开源规范。开源的发起者可以是个人、企业等 各种主体,聚焦企业开源领域,企业开源与商业化并不矛盾,开源软件的“引流”作用能够 帮助企业实现周边产品的增收、市场影响力的提升以及产业生态的协同构建。 3 开源软件概念铺陈 1 开源软件与云计算的关系 2 3 开源软件基金会前瞻 5 中国的开源软件法治建设状况 4 中国的开源软件产业发展洞察 4 ——《大教堂与集市》中文版,机械工业出版社 为软件不应该成为一种私有财产,而应该被公开成为公共资源,这样做的好处在于通过让海量的用户对软件进行使用和反 馈来帮助开发者进行产品升级——这是一种只有在软件这样的产品上才能够实现的发展模式;然而,自由软件理念与企业 商业化运营背道而驰。随着计算机产业的发展,软件作为一种产品的商业价值显著提升,在当时的微软、IBM等IT龙头企 业的影响下,市场亟需一种结合了自由软件的创造力和私有软件的商业性的发展模式,1998年,“开源软件”理念在这一0 码力 | 68 页 | 3.63 MB | 1 年前3Moonshot AI 介绍
扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 2.团 和智能助⼿Kimi,⽀持20万字的输⼊。做“⻓”是因为杨植麟判断AI-Native产品的终极价值是提 供个性化的交互,⽽losslesslong-context是实现这⼀点的基础⸺模型的微调⻓期不应该存在, ⽤⼾跟模型的交互历史就是最好的个性化过程,历史上每⼀代技术都是在提升contextlength。 杨植麟⾝上的标签有天才AI科学家、连续创业者……在这次深度访谈中,他再次证明⾃⼰是个真 构,但今天其实很多架构已经不满⾜这两条 了。transformer在已知的tokenspace符合这两条,但放⼤到⼀个更通⽤的场景,也不太符合。数据 也是⼀个⽣产要素,包括整个世界的数字化,和来⾃⽤⼾的数据。 所以在很多核⼼⽣产要素中,通过改变其他的⽣产要素,可以让算⼒利⽤率变⾼。 同时,针对“登⽉”,算⼒肯定要持续增⻓。今天能看到最好的模型是10的25到26次⽅FLOPs这0 码力 | 74 页 | 1.64 MB | 1 年前3清华大学第二弹:DeepSeek赋能职场
For Culture & Art 文、图、乐、剧 Innovator For Social 智能角色交互体 Innovator For Science & Industry 行业大模型 基座大模型 人机协同 Chatbot •自然语言对话 Reasoner •基本的推理和问 题解决能力 Agent •代表用户执行任 务,具备自主行 动能力 Innovator • 参与发明和创造, 作 • 致力于人机协同和人机共生领域的世界级团队,专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。 团队愿景 • 李默非(清华大学人工智能学院拟录博士生):人机共生之基座大模型研究研发 • 何静(清华博士后、北航助理教授):人机共生之快生引擎研究研发 • 尤可可(清华博士后、北石化助理教授):人机共生之AIGC短视频 • 安梦瑶(清华大学博士后):人机共生之AI诊疗研究 强规范约束 (操作路径明确) 弱规范约束 (操作路径开放) Result (结果导向) 目标确定性高 (结果可预期) 目标开放性高 (结果多样性) Route (路径灵活性) 线性路径 (流程标准化) 网状路径 (多路径探索) Responsiveness (响应模式) 被动适配 (按规则执行) 主动创新 (自主决策) Risk (风险特征) 低风险 (稳定可控) 高风险 (不确定性高) (限定于文本生成任务)0 码力 | 35 页 | 9.78 MB | 7 月前3亿图脑图 MindMaster 产品分享 - 基于云的跨端思维导图软件
MindMaster 产品分享 基 于 云 的 跨 端 思 维 导 图 软 件 用思维导图提升办公效率成为企业趋势 学习、创作和团队发展的基本单位就是思维和想法 有序的构建思维,让知识和想法结构化 让您和您的团队赢在起跑线上,思维导图就是专门为此而生。 梳理思维,抽象信息更直观 信息可视化 激发灵感,记录创意 捕捉灵感 2 知识点结构化,学习更高效 效率学习 团队赋能,效率倍增 行政 HR 研究员 亿图脑图 MindMaster 一款基于云的跨端思维导图软件 亿图脑图MindMaster支持客户端、移动端、平板和网页版,文件可通过云端储存实现多端同步,拥 有全场景一站式思维导图解决方案,轻松创建、管理、展示、分享、协作您的作品。 用MindMaster,提升多场景效率 知识、信息、想法结构化、有序化记录和呈现 知识管理 学习笔记 团队办公 高效职场 思维梳理 课程培训 • 阅读感想 • 错题归纳 • 读书笔记 • 大纲梳理 • 灵感记录 • 经验沉淀 • 学习分享 • 逻辑引导 多端云存储 一端创作,多端同步存储和打开 团队管理 建立团队群,轻松共享管理团队文件,效率倍增 甘特图 项目活动可视化,实现高效项目管理 头脑风暴 头脑风暴模式,捕捉亮点,即时生成脑图 核心优势:一端创作,多端同步 跨端文件流转,团队聚力,提升效率!0 码力 | 15 页 | 4.01 MB | 1 年前3202306 ⼈⼈可⽤的开源数据可视化分析⼯具
⽉ ⼈⼈可⽤的开源数据可视化分析⼯具 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 可视化 原始数据 数据价值 数据孤岛 管理混乱 缺失分析 全业务场景 ⽤户⾏为管理 数据驾驶舱 数据→信息→价值 可以为企业运营 带来直接收益 数据可视化对企业的价值 能够快速、⾼效地 提供体验良好的数 能够规范数据处理 的过程、保证数据 质量、提升 IT 系 统建设效率、快速 ⽀撑业务部⻔的运 营发展需要,有效 激发 IT 建设的创 新、体现 IT 信息 的价值。 数据可视化对不同⼈员的价值 数据可视化⼯具更加强调⼈性化,功能趋于“傻⽠”式,强调易⽤、稳定、开放,协作和⾃助,关注信息数 据的整合与展示,能够通过⾃助的模式让不同的⻆⾊⼈员在合适的场景获取合适的数据,发挥数据价值。 Gartner 功能丰富 3 稳定性、性能 4 数据分析能⼒ 5 采购成本 6 服务⽀持 7 ⼚商实⼒ ⼈⼈可⽤ 企业选择数据可视化⼯具的考量 数据可视化对企业的价值 DataEase 开源项⽬介绍 DataEase 模板市场 DataEase 企业版介绍 1 2 3 4 DataEase可以帮助⽤户快速分析业务数据并洞察其趋势,为企业的业0 码力 | 27 页 | 3.61 MB | 1 年前3
共 211 条
- 1
- 2
- 3
- 4
- 5
- 6
- 22