1 藤井美娜 Python的NLP实战分享 如何实现合同风险预测模型
Python的NLP实战分享 如何实现合同风险预测模型? GVA TECH Co., Ltd 藤井美娜 自我介绍 2% |# | self-introduction • Machine Learning Engineer / Data Scientist • GVA TECH的人工智能法律服务AI-CON的多语言系统 开发负责人 inazo18 藤井美娜 目录 CONTENTS CONTENTS 1. Python NLP 入门 2. 多语言NLP攻略 3.“合同风险预测模型”实战经验分享 4. 总结 5% |### | today’s topic 1 Python NLP 入门 简单介绍自然语言处理的流程和使用corpus的EDA方法。 8% |##### | section1 NLP基础 11% |######### | section1 收集语料 前处理 施事者和受事者都会有助词标记, 可以根据助词推测句法结构。 | section2 3“合同风险预测模型” 实战经验分享 64% |################################################################## | section3 什么叫“合同风险预测”? 68% |###################################0 码力 | 36 页 | 3.95 MB | 1 年前33 Python的NLP实战分享 如何实现合同风险预测模型 藤井美娜
Python的NLP实战分享 如何实现合同风险预测模型? GVA TECH Co., Ltd 藤井美娜 自我介绍 2% |# | self-introduction • Machine Learning Engineer / Data Scientist • GVA TECH的人工智能法律服务AI-CON的多语言系统 开发负责人 inazo18 藤井美娜 目录 CONTENTS CONTENTS 1. Python NLP 入门 2. 多语言NLP攻略 3.“合同风险预测模型”实战经验分享 4. 总结 5% |### | today’s topic 1 Python NLP 入门 简单介绍自然语言处理的流程和使用corpus的EDA方法。 8% |##### | section1 NLP基础 11% |####### | section1 收集语料 前处理 分词 施事者和受事者都会有助词标记, 可以根据助词推测句法结构。 | section2 3“合同风险预测模型” 实战经验分享 64% |################################################################## | section3 什么叫“合同风险预测”? 68% |###################################0 码力 | 33 页 | 1.67 MB | 1 年前3基于静态分析的Rust内存安全缺陷检测研究
基于静态分析的Rust内存安全缺陷检测研究 报告人:徐辉 报告日期:2022.11.25 复旦大学 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 Rust语言 ❑ 系统级安全编程语言 ▪ 内存安全 ▪ 并发安全 ▪ 效率 2006年 2011年 Foundation成立 2020年 2021年 Mozilla裁员Servo团队 AWS, Huawei, Google, Microsoft, Mozilla… Rust如何保障内存安全? ❑ 内存安全问题产生的主要原因之一是指针别名导致悬空指针 ▪ 手动释放内存或调用析构函数 ▪ 函数返回时发生的自动析构或内存释放 ❑ Rust设计的目标之一是编译时检查指针别名(共享可变引用) ▪ 0x012345usize; let r = address as *const i32; } unsafe { risky(); } 调用unsafe函数 定义unsafe函数 Rust的安全哲学 ❑ Safe API无论如何被使用都不应带来未定义行为 ❑ 程序员应避免直接使用unsafe code ❑ Interior unsafe:将unsafe code封装为safe API0 码力 | 28 页 | 1.55 MB | 1 年前3Borsh 安全高效的二进制序列化
第三届中国 Rust 开发者大会 安全高效的二进制序列化 Daniel Wang @ NEAR Borsh • 运行、编码效率 • 确定性 • 跨平台兼容性 二进制序列化的问题 Binary Object Representation Serializer for Hashing • 字节级别确定性 • 执行速度快 Borsh • 轻量级 • 每一个对象与其二进制表示之间都存在一个双射映射0 码力 | 21 页 | 3.35 MB | 1 年前3邓良驹 编写更安全的Python代码
编写安全的Python代码 邓良驹 2019.10.19 思考题 if user.balance >= product.price: user.balance -= product.price ? 目录 CONTENTS 常见不安全代码 代码检查的工具 总结:如何规避风险 常见不安全代码 小心 eval 应对: 在生产环境中,任何情况下都不要使用eval。 import sys 使用较新版本的Python3。Python2中可改用raw_input。 小心类型溢出 应对: 使用较新版本的Python3,而不使用发行版OS自带的旧版Python。 捕获并处理溢出错误,可以减少风险。在重要的位置做好防御式 编程,检查好入参的类型与合法的上下限。 >>> range(100**100) Traceback (most recent call last): File "" "__main__": shellcode = pickle.dumps(ShellExp()) pickle.loads(shellcode) 应对: 绝不对不可信/未认证数据进行unpickle,使用更安全的JSON 或YAML做序列化。必须使用pickle时在沙盒环境执行。 小心 PyYAML 应对: 使用yaml.safe_load,必要时编写自定义 Loader 做更严格的检查。 对不可信来源的序列化检查后操作。 0 码力 | 18 页 | 988.40 KB | 1 年前33 Thautwarm 解放python的表达力 性能和安全性 语法和语义扩展 JIT 静态检查
解放Python的 表达力,性能和安全性 Thautwarm 目录 CONTENTS 语法和语义扩展 JIT 静态类型 语法和语义扩展 表达力的扩展, 可用性的保留,白来的午餐? 演示一小部分: 模式匹配, Quick Lambda, Pipe运算 语言决定思维模型 GNU-APL C++ Haskell 说 到 质 数 � 人 们 想 到 什 么 � 语言决定思维模型 54 -> 0.59 3.14 -> 0.93 2.00 -> 0.03 2.60 -> 0.96 如果还有时间,我们用静态类型 来写一个简单的网页生成框架 一个用起来,没有学习曲线的框架。 很安全,因为没有程序员需要付出心 智负担的工作。 THANK YOU thautwarm: - github.com/thautwarm - twshere@outlook.com0 码力 | 43 页 | 10.71 MB | 1 年前310 WEB攻击与防护技术 徐震 杨亮 《PHP语⾔程序设计》
震 信息安全国家重点实验室 提纲 一、背景概述 二、典型攻击 三、攻防原理 四、防护产品体系 1.1.技术背景 n Web成为主流的网络和应用技术 q CNCERT/CC 网络安全监测系统对流量数据进行的抽样统计 显示,Web 应用流量占整个TCP 流量的81.1% q B/S居统治地位:网上银行、电子商务、电子政务、证劵、 手机上网 3 1.2.安全威胁 1.2 2.安全威胁 n SANS年发布的全球20大安全风险排行榜上,Web应 用安全漏洞名列前茅,攻击者利用最多的漏洞是SQL 注入及跨站脚本 n 根据国家计算机网络应急技术处理协调中心(简称 CNCERT/CC)上半年的工作报告显示,网站漏洞百出, 被篡改的大陆网站数量明显上升,总数达到28367个, 比去年全年增加近16% 1.3. 相关政策、法规(1) n PCI DSS 美 配置Web应用防火墙或进行代码级应用安全加 固。 1.4. 相关政策、法规(2) n 胡锦涛总书记重要指示 q “把握信息化发展的方向、维护国家在网络空间的安全和利益成 为信息时代的重大战略课题。” n 政策文件和规划中对信息安全的要求 q 《国家信息化的战略目标(2006-2020)》指出:“建立和完善 信息安全等级保护制度,重点保护基础信息网络和关系国家安全、 经济命脉、社会稳定的重0 码力 | 114 页 | 3.65 MB | 1 年前32022年美团技术年货 合辑
才能感受到漫天星辰的光芒和温暖。 在2023年春节到来之际,我们从去年美团技术团队公众号上精选了60多 篇技术文章,整理制作成一本1300多页的电子书,作为新年礼物赠送给 大家。 这本电子书内容覆盖算法、前端、后端、数据、安全等多个技术领域, 希望能对同学们的工作和学习有所帮助。 也欢迎大家转给更多有相同兴趣、积极上进的同事和朋友们,一起切 磋,共同成长。 祝愿2023年,大家诸事顺遂,健康平安。 序 算法 业务数据治理体系化思考与实践 1233 数据治理一体化实践之体系化建模 1263 vi > 2022年美团技术年货 运维 / 安全 1277 数字化新业态下数据安全创新——Token 化 1277 Linux 中基于 eBPF 的恶意利用与检测机制 1293 如何应对开源组件风险?软件成分安全分析(SCA)能力的建设与演进 1328 算法 < 1 YOLOv6:又快又准的目标检测框架开源啦 作者:楚怡 quantize_scale_node 节点无法融合,进而导致了额外的开 销。如何解决这个问题?我们使用了一个简单的方法,就是强制使所有分支节点的 量化 scale 相同(根据经验,在同一数量级上的 scale 可以安全合并),即直接修改 QAT 网络中的 Quantizer 节点的参数。 我们整理了 YOLOv6s_repopt 中所有需要进行 scale 融合的节点(如表 7 所示), 由于 TensorRT0 码力 | 1356 页 | 45.90 MB | 1 年前3聊聊 Node.js 构建部署时我们要关心的数据
app_id / id / name / version / path / ancestor / parent_id / … 本次构建的风险依赖 ‣ 维护风险依赖数据库 ‣ 遍历拍平依赖,拿出包名与版本号 ‣ 匹配风险依赖数据库 包名 安装版本 漏洞名称 风险等级 影响版本范围 package1 1.4.5 XSS High ^1.0.0 package2 3.6.7 CSRF Medium 应用基线之依赖搜索 flatmap-stream ~0.1.0 更多应用基线 ‣ 应用的 Node.js / 框架版本(可出大盘) ‣ 直接依赖的新旧 ‣ 依赖树内的搜索 ‣ 应用的风险依赖巡检 + ?邮件通知 4 启动数据 我要关心启动时的哪些数据?以 Egg.js 为例。 最终的脱敏配置信息 Egg.js 启动时最终合并出来的 config 信息 ‣ ./run/application_config ‣ 基线健康度 ‣ 框架视角:Node.js 版本 / 框架版本等先进性内容 ‣ 依赖视角:有风险的、落后的依赖等 ‣ … ‣ 构建部署质量 ‣ 构建:成功率、时长、产物大小等 ‣ 部署启动:成功率、时长等 ‣ … ‣ 代码质量 ‣ CI 覆盖率 ‣ 代码安全扫描 ‣ 代码巡检市场 应用健康分 应⽤用稳定性 基线健康度 构建部署质量 代码质量量0 码力 | 47 页 | 5.80 MB | 1 年前3FISCO BCOS 2.9.0 中文文档
ii FISCO BCOS Documentation, 发布 v2.9.0 请根据需求选择FISCO BCOS的版本,并确认周边组件与其版本相匹配。 FISCO BCOS 是一个稳定、高效、安全的区块链底层平台,经过多家机构、多个应用,长时间在生产环 境运行的实际检验。 注解: 本技术文档适用于FISCO BCOS 2.x版本, FISCO BCOS 3.x技术文档请参考 FISCO BCOS 1 FISCO BCOS 区块链 标签:FISCO BCOS介绍 关键特性 开发工具 FISCO BCOS是由深圳市金融区块链发展促进会(以下简称“金链盟”)开源工作组牵头研发的金融级、 国产安全可控的区块链底层平台。作为最早开源的国产联盟链底层平台之一,FISCO BCOS于2017年面 向全球开源。 开源六周年至今,FISCO BCOS开源社区在技术创新、应用产业以及开源生态均取得了非凡成绩。 BCOS以联盟链的实际需求为出发点,兼顾性能、安全、可运维性、易用性、可扩展性, 支持多种SDK,并提供了可视化的中间件工具,大幅缩短建链、开发、部署应用的时间。此外,FISCO BCOS通过信通院可信区块链评测功能、性能两项评测,单链TPS可达两万。 1.1 关键特性 1.2 架构 FISCO BCOS 在2.0中,创新性提出“一体两翼多引擎”架构,实现系统吞吐能力的横向扩展,大幅提升性 能,在安全性、可运维性、易用性、可扩展性上,均具备行业领先优势。0 码力 | 1489 页 | 107.09 MB | 1 年前3
共 387 条
- 1
- 2
- 3
- 4
- 5
- 6
- 39