Moonshot AI 介绍
bleDiffusion等AI模型成功 的关键组件;发明了Transformer-XL,是历史上第⼀个在词级别和字级别都全⾯超越RNN 的注意⼒语⾔模型,解决了语⾔建模上下⽂⻓度的关键问题,定义了语⾔建模的新标准;曾 与DeepMind和CMU合作研究,⾸次实现⼩样本性能逼近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 新的范式。现在Midjourney在双边效应上已经爆发了,StableDiffusion作为开源模型就尴尬在单边 太分散,只能依赖basemodel的提升。 海外独⻆兽:从招聘⻆度,你怎么定义好的⼈才? 杨植麟:我会拆成经验和学习来看。学习是⼀个通⽤的能⼒,不光是learn,还要unlearn,特别是以 前的成功经验。假设你是从0到1做了YouTube,现在做AI 杨植麟:⾄少有两个,⼀个是有⽤的,⼀个是好玩的。 信息⼊⼝可能不存在了,因为我们搜寻信息本质上是希望端到端完成⼀个任务。智能的⼊⼝以后⼤概 率会覆盖搜索引擎这类信息⼊⼝。⼈获取信息并不是终极需求,它只是⼀直被强⾏定义成⼀种需求。 有些时候我们是希望完成⼀件事,有些时候是希望学习某个东西,AGI的⼊⼝应该直接帮⽤⼾完成任 务,⽽不是帮他们获取信息。 海外独⻆兽:从今天到实现你理想中的AGI还需要多少钱?0 码力 | 74 页 | 1.64 MB | 1 年前3全球开源发展态势洞察(2023年第八期)
Azure CNI Overlay Azure CNI Overlay可以利用覆盖的网络来降低 IP地址的使用率,同时提供更好的性能和可扩 展性。借助该功能,AKS集群可以扩展至非常 大的规模,并且用户定义的私有CIDR还可以在 不同AKS集群中重复使用,从而大幅扩展了 AKS中运行的容器化应用程序可用的IP空间。 02 前沿技术 全球开源态势洞察|第十期 04 Envoy Gateway v0 添加对基于IP子网的速率限制的支持; • 支持自定义Envoy代理引导配置、Envoy代理 镜像和服务配置注释、资源和安全上下文设 置等; • 添加EDS支持(Endpoint Discovery Service)。 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件; • 允许用户为静态Pod定义Pod模板和升级模 型; • NodePort Service支持节点池隔离。 器,通过将Envoy代理部署为反向代理和负载 均衡器来实现其功能。Contour提供开箱即用 的动态配置更新机制,同时保持了轻量级的配 置文件结构。此外,Contour引入全新入口 API HTTPProxy,该API通过自定义资源定义 (CRD)来实现。其主要目标是扩展Ingress API的功能,以提供更丰富的用户体验并解决 原始设计中的局限性。 近日,Contour v1.25.0发布,版本特性更新 如下: • Con0 码力 | 22 页 | 1.99 MB | 1 年前32024 中国开源开发者报告
开发者成长的关键步骤,希望有更多人参与开源和社区共建。 25 / 111 开源模型未必更先进,但会更长久 文/顾钧 “开源”是指采用符合 OSI 官方认可的软件许可证进行软件发布的行为。目前大模型的“开 源”与传统的开源定义并不相同。我所说的开源策略是指以开源发布软件为起点,用户/开发者 运营为途径的软件产品推广策略。 我的观点是,开源策略是大模型最好的竞争策略。接下来让我们从头捋一捋推导过程。 我们先看大模型赛道的整体状况: 智能体作为学术术语由来已久,从上世纪的“符号、专家系统”【1】,到十年前风头无两的 强化学习(代表作 AlphaGo【3】),再到现在的 LLM,agent 底层技术经历了三个大的阶段。 符号系统的缺点在于过于依赖人工定义的“符号”和“逻辑”,强化学习苦于训练数据的匮 乏和“模态墙”,而 LLM 一次性解决这些问题。 人类语言就是一种高度抽象、跨模态、表达力充分的符号系统,同时它作为知识的载体,自 然地存在大量 种种事件的发生并不是坏事,这是所有技术在发展过程中接受实践检验的必经之路,通过种 种尝试和反馈,目前对于开源数据集和算法的呼声正在越来越高涨。 除了对于训练集和算法的开源之外,对于模型的“开源”定义也经受着各种议论。笔者比较 认同的观点是:开源模型不应该只把模型文件公布出来,同时应该把对应的训练集和算法进行公 开,并能够提供相应的训练流程,是所有人能够对结果进行重现。这好比我们讨论开源项目的时0 码力 | 111 页 | 11.44 MB | 8 月前3中国开源软件产业研究报告
www.iresearch.com.cn 开源:定义 开放源代码为基本内涵,还需符合修改、传播等方面的规范 软件的“源”即其源代码,“开源”的核心概念是软件的编写者将源代码(通常)免费提供给使用者。然而,软件行业内 所谓的“开源”概念还包含其他诸 可以二次开发后“商用”? “完全可以” Apache-2.0 MIT BSD 2-clause BSD 3-clause “完全不可以” 如果一种开源协 议 满 足 OSI 组 织 的定义并得到其 认可,那么这种 开源协议一定允 许商用。 “可以,但不完全可以” GPL:允许商用,但必须在出售的同时公开软件源代码,从某种意义上说这就等同于二 次开发后的产品是“自愿付费”的,或者说 LGPL:如果类库引用(链接,不修改)则可以闭源商用,否则不能够闭源商用。 EPL:没有修改过,可以直接商用;有修改过,必须在公布源代码的条件下商用,这种 情况下与GPL的发布条件类似。 • 从定义上看,所有的开源协议本质上都是允许“商用”的,之所以在实践中存在一系列开源软件商用后的侵权问题,本质上说 是由于开源许可证的“传染性”。带有“传染性”开源许可证的软件要求企业/个人在对其进行修改发布时保留原来的开源许0 码力 | 68 页 | 3.63 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
依托于数据中台体系,深度融合数据安 全、管控、治理、分析能力,增强 AI 智能 决策分析。 开放、标准化 适配多源异构数据源,兼容 Spark、 TensorFlow 等主流计算框架,支持自 定义镜像、支持模型及服务标准化。 便捷易用 模型开发、训练、调度可视化管控,内置 100+算子,支持模型一键式部署,降低 AI建模门槛。 AutoML 支持端到端 AutoML,自动化完成特征 治理、参数寻优、模型筛选流程,智能化 提升数据质量 实现任务数据零延迟、大幅减少研发 BUG 数量,并完成数据指标口径 的统一。 降低数据服务成本 可大幅度节约业务成本,提升整体研发业务价值。 保障业务数据安全 通过全链路权限管控、自定义审批流、自动风险识别、智能数据脱敏等 数据管理手段保障业务数据安全。 方案架构 统一数据标准 统一数据服务 统一数据资产管理 统一开发平台 业务前台 数据中心 统一查询服务 大数据基础设施(计算和储存平台) 服务创建 服务测试 服务发布 免编码拖拽 建模 模型/数据市场 数据源管理 专家开发环境 Jupyter交互式 建模 Jupyter模型 市场 训练服务 训练可视化 作业管理 自定义算子 服务管理 SOLUTIONS 为金融行业提供端到端数据服务能力,致力于帮助金融机构加快自身数字化进程,打造数字化金融服务,实现业务 在线、渠道开放、金融智能、生态融合、架构敏捷与数据服务化。0 码力 | 43 页 | 884.64 KB | 1 年前32020 中国开源年度报告
74亿条),相较 2019 年的 5.46 亿条增⻓约 60%。并对分析出的部分项⽬进⾏⼈⼯标注,挑选出中国的个⼈开发 者和企业组织,同时构建了科学合理的数学模型进⾏分析。 在开发者活跃度与项⽬活跃度的定义下,本次统计得到 2020 年总活跃项⽬数量约 5,373万 个,相较 2019 年的约 3,972 万 增⻓约 35.3%;2020 年 GitHub 总开发者数为 5,600多 万,总活跃开发者数量 TypeScript 的受欢迎程度急剧攀升有关。 指标名称 含义 language 项⽬开发使⽤的主要语⾔ activity 项⽬活跃度(通过加权计算得到) developer_count 在活跃度定义下参与该项⽬的开发者⼈数 issue_comment 项⽬所有 Issue 和 PR 在 2020 年获得的评论总数 open_issue 项⽬ 2020 年新增的 issue 数量 open_pull 从时间这个维度,我们看到中国开源从早期的跟随者、参与者,逐渐变成影响者和创 作者, 中国开源的⼒量正在崛起。中国开始涌现出⼤量开源项⽬的创作者,中国企业的开源 项⽬开始捐献给基⾦会孵化,中国开始定义⾃⼰的开源许可证协议(⽊兰宽松协议)并被 OSI 接受,中国开始成⽴中国的开源基⾦会(开放原⼦基⾦会),这些都是中国开源开始成熟的很 重要的标志。 刘天栋:2015 年开源社与 ASF 联合举办0 码力 | 46 页 | 4.09 MB | 1 年前32023 中国开源开发者报告
年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 的台阶,为 LLM 的广泛应用奠定了基础。再之后的 11 月份,OpenAI 再发力,GPTs 的到来,“用户自定义 ChatGPT”的能力,更是让世人领略了 OpenAI 作为 LLM 一哥的宏大叙事能力与强劲技术实力。 二、 New Bing(Bing AI)代表了微软在 LLM 领域的野心和 决心 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 使 LLM 能够更加接近于人类智能。 九、 AI 原生,目前还没有明确的定义,大致是说,不同于当前 各种应用在原本的基础上增加 AI 能力,使其智能化,但 它的智能只充当了“辅助”角色;在 AI 原生的语境下, LLM 从一开始就是应用的中枢,应用本身的架构、功能、 QQ 文件传输、QQ 空间和 QQ 邮 箱在内的多个功能无法使用。 直到 29 日早间,腾讯微信团队才回应表示,经工程师抢修,系统正在逐步 恢复。 本次事故由广州电信机房冷却系统故障导致,腾讯将它定义为公司一级事 故,并对大量相关领导做出了处罚。 4 月 12 日,工业和信息化部信息通信管理局听取腾讯公司关于 “3・29” 微 信业务异常情况汇报,要求腾讯公司进一步健全安全生产管理制度、落实网0 码力 | 87 页 | 31.99 MB | 1 年前3JumpServer ⼴受欢迎的开源堡垒机
⽤组件⾼可⽤、Kubernetes 集群部署等模式,需要额外的实施及维护费⽤。 X-Pack 增强包 组织管理 资产同步 账号备份 单点登录系统对接 账号改密 ⼯单管理 账号收集 ⾃定义 LOGO 与主题 访问控制 RADIUS ⼆次认证 短信认证 资产登录与命令复核 ⻆⾊管理 RBAC 企业级⽀持服务内容(增强级) ⽀持服务 7×24 ⼯单及电话⽀持服务,1 个⼩时0 码力 | 40 页 | 6.66 MB | 1 年前32021 中国开源年度报告
互联网公司对技术的垄断,开发者自 发地开发了可以自由使用的“自由软件”。自由软件运动的发起人,也是 GNU 操作系统开发 人及自由软件基金会创始人的 Richard Stallman 将自由软件定义为“用户可以自由地运行、复 制、分发、研究、更改和改进的软件”。在这个时期出现了首批开源许可证 GNU(通用许可证, 现在通常称为“GPL”)和 BSD 许可证。 Open source originated falls under the scope of China's Contract Law. Elastic License 2.0 (ELv2) 虽然满足源码可见,但并不符合 OSI 的开源定义,采用 ELv2 的 StarRocks 因自称开源,而引起业界非议。 Elastic License 2.0 (ELv2), although satisfying the source0 码力 | 199 页 | 9.63 MB | 1 年前32023年中国基础软件开源产业研究白皮书
提出加强保护支持产权,鼓励产 学研结合等鼓励措施 推进商用密码检测认证体系建设, 明确商用密码检测机构的资质 • 科研 • 检测 规范对采用商用密码技术提供电 子认证服务的行为和资质认定 定义需要实时进口许可、出口管 制的商用密码 鼓励公民、法人和其他组织使用 规范商用密码保护网络信息安全 督促商用密码建成协作监督机制, 推进信用体系建立 条例重点规范活动与相关监督管理 强调商用密码人才培养,鼓励行0 码力 | 43 页 | 4.69 MB | 1 年前3
共 11 条
- 1
- 2