图像 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

普通人学AI指南

. . . . . . . . . . . . 7 2.1.3 通义千问 . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 图像 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2.1 物体擦除 IOPaint . . . . . . . . . . . 40 3 1 AI 大模型基础 1.1 AIGC AIGC 是指使用人工智能模型生成内容的技术。这些内容可以包括图像、音频、文本、视频、3D 模型等。具体来说，AIGC 技术可以生成如下类型的内容： • 图像：如照片、原创艺术作品 • 音频：如视频游戏中的配音、音乐 • 文本：如代码、广告文案、小说 • 3D 模型：如角色、场景目前，AIGC 技力的智能系统。 1.3 大模型大模型通常指的是大规模的人工智能模型，这类模型通过训练大量的数据来获得广泛的知识和能力。这些模型通常具有庞大的参数数量，能够处理复杂的任务，如自然语言理解、图像识别、语音识别等。闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其高效的学习能力和强大的通用性而受到关注。开源大模型以 Meta 的 Llama 系列，2024

0 码力 | 42 页 | 8.39 MB | 7 月前
3
2024 中国开源开发者报告

的产品信息、开发过程信息，从而更全面地理解和解决问题。目前排在 SWE-bench verified 前 4 位都使用了 Claude-3.5-Sonnet，而它是多模态的、具备处理文本和视觉信息的能力，使其能够理解和修复包含图像或其他视觉元素的 GitHub 问题。和工具集成的框架：可以支持智能体在处理复杂任务时进行更好的任务管理和执行，并促进不同 AI 模型和工具之间的协作。例如 Composio SWE-Kit 是计算机视觉领域最著名的开源数据集之一，包含数百万张带有标签的图像。它为图像分类、物体检测等任务提供了丰富的数据资源，使得模型能够在视觉理解方面取得突破。它由普林斯顿大学的计算机科学家李飞飞（Fei-Fei Li）及其团队在 2009 年创建。 ImageNet 包含超过 1400 万张图像，这些图像分为超过 2 万个类别，每个类别都与 WordNet 中的一个词条对应。每个类别的图像数量从数百到数千不等。ImageNet 今我们看到的种类繁多的视觉大模型（VLMs）开启了新的篇章。 COCO（Common Objects in Context）：COCO 数据集由微软于 2014 年发布，涵盖 51 / 111 了数十万张日常生活中的图像，并附有详细的标注信息。虽然 COCO 对比 ImageNet 具有更少的类别,但每一个类别拥有更多的实例，假定这能帮助复杂模型提高物体定位的准确率。它的设计初衷适用于具有上下文信息的图片中

0 码力 | 111 页 | 11.44 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

角色扮演型提示语：要求AI扮演特定角色，模拟特定场景。 4. 创意型提示语：引导AI进行创意写作或内容生成。 5. 分析型提示语：要求AI对给定信息进行分析和推理。 6. 多模态提示语：结合文本、图像等多种形式的输入。表1-1-1提示语的本质特征特征描述示例沟通桥梁连接人类意图和AI理解 “将以下内容翻译为法语：Hello, world” 上下文提供者为AI提供必要的背景信息成一个全面的分析报告。 2. 请根据[主题]创建一个包含图像和数据可视化的报告，详细描述可视化方法。 3. 请设计一个融合文本、图像、音频或视频元素的多媒体内容，增强内容的丰富性。 4. 请设计一个互动数据展示方案，使读者可以与数据进行互动，并详细描述设计步骤。 5. 请将不同媒体形式的内容进行联动展示，例如将文字内容与图像和数据可视化结合起来。 6. 请选用合适的数据可视化（7）定位声明：综合以上要素，创作一个简洁有力的定位声明。这个声明应清晰传达品牌是什么、为谁服务、提供什么独特价值。（8）视觉识别：提出2—3个能直观体现品牌定位的视觉元素建议（如标志、色彩、图像风格等）。评估标准： - 清晰度：定位是否易于理解和记忆 - 独特性：是否明显区别于竞争对手 - 相关性：是否与目标受众的需求和期望高度相关 - 可信度：是否基于品牌的实际优势和能力 - 持续性：是否具有长期发展潜力

0 码力 | 104 页 | 5.37 MB | 7 月前
3
清华大学 DeepSeek 从入门到精通

角色扮演型提示语：要求AI扮演特定角色，模拟特定场景。 4. 创意型提示语：引导AI进行创意写作或内容生成。 5. 分析型提示语：要求AI对给定信息进行分析和推理。 6. 多模态提示语：结合文本、图像等多种形式的输入。表1-1-1提示语的本质特征特征描述示例沟通桥梁连接人类意图和AI理解 “将以下内容翻译为法语：Hello, world” 上下文提供者为AI提供必要的背景信息成一个全面的分析报告。 2. 请根据[主题]创建一个包含图像和数据可视化的报告，详细描述可视化方法。 3. 请设计一个融合文本、图像、音频或视频元素的多媒体内容，增强内容的丰富性。 4. 请设计一个互动数据展示方案，使读者可以与数据进行互动，并详细描述设计步骤。 5. 请将不同媒体形式的内容进行联动展示，例如将文字内容与图像和数据可视化结合起来。 6. 请选用合适的数据可视化（7）定位声明：综合以上要素，创作一个简洁有力的定位声明。这个声明应清晰传达品牌是什么、为谁服务、提供什么独特价值。（8）视觉识别：提出2—3个能直观体现品牌定位的视觉元素建议（如标志、色彩、图像风格等）。评估标准： - 清晰度：定位是否易于理解和记忆 - 独特性：是否明显区别于竞争对手 - 相关性：是否与目标受众的需求和期望高度相关 - 可信度：是否基于品牌的实际优势和能力 - 持续性：是否具有长期发展潜力

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和高吞吐量，适合实时应用。  轻量化设计：模型结构优化，思维链，显著提高复杂任务的推理准确性，其长链推理能力在数学、编程和自然语言推理等任务中表现出色。 • 多模态任务处理：DeepSeek R1 在多模态任务中表现出色，能够处理复杂场景下的逻辑、公式识别及自然图像等问题，显示出其在多模态任务中的广泛应用潜力。训练方法：数据冷启，阶段递进 DeepSeek R1 采用了冷启动数据和多阶段训练的策略，以进一步提升模型的推理能力和可读性。  冷启动数据 1.多步骤自主研究 2.端到端强化学习 3.深度信息整合输入提示文本、图像、 PDF 解释、推理调整优化查找、分析综合数百个在线资源以研究分析师的水平创建一份综合报告端到端强化学习训练规划执行多步骤研究流程实时调整策略回溯修正错误文本 PDF 图像【多格式数据】支持搜索多格式数据，整合多模态信息，生成带引用和思考过程总结的报告

0 码力 | 85 页 | 8.31 MB | 7 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

国外：GPT-4等效智能在过去18个月内价格下降240倍  国内：大模型「亏本」卖，可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判之七多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时，规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力未来产业创意能力赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、原料无人天车吊装控制 • 生产现场运输状态监控 • 现场路线智能调度 • 智能化能源调度 • 料场智能调度 • 燃料水分视觉分析 • 多角度废钢图像采集 • 废钢智能定级 • 杂质识别 & 扣杂 • 废钢槽编号识别 • 多角度废钢图像采集 • 废钢智能定级 • 杂质识别 & 扣杂 • 废钢槽编号识别 • 皮带胶结头异常检测 • 皮带跑偏检测 • 烧结皮带跑偏检测 • 皮带托辊异常检测

0 码力 | 76 页 | 5.02 MB | 5 月前
3
清华大学普通人如何抓住DeepSeek红利

通用问答专业领域问答因果推理知识推理问答系统逻辑推理自然语言处理文本生成与创作建议生成风险评估辅助决策概念关联知识整合交互能力情感分析文本分类图像理解跨模态转换专业建议任务分解情感回应上下文理解对话能力多轮对话数学运算逻辑分析能力图谱诗歌创作语音识别指令理解方案规划实体识别 l 文本创作特定场景。 4. 创意型提示语：引导AI进行创意写作或内容生成。 5. 分析型提示语：要求AI对给定信息进行分析和推理。 6. 多模态提示语：结合文本、图像等多种形式的输入。提示语类型提示语的本质提示语的类型

0 码力 | 65 页 | 4.47 MB | 7 月前
3
Python 标准库参考指南 3.7.13

颜色系统间的转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1263 23.7 imghdr --- 推测图像类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1263 23.8 sndhdr --- 弱引用的主要用途是实现保存大对象的高速缓存或映射，但又不希望大对象仅仅因为它出现在高速缓存或映射中而保持存活。例如，如果您有许多大型二进制图像对象，则可能希望将名称与每个对象关联起来。如果您使用 Python 字典将名称映射到图像，或将图像映射到名称，则图像对象将保持活动状态，因为它们在字典中显示为值或键。 weakref 模块提供的WeakKeyDictionary 和WeakValueDictionary 和WeakValueDictionary 类可以替代 Python 字典，使用弱引用来构造映射，这些映射不会仅仅因为它们出现在映射对象中而使对象保持存活。例如，如果一个图像对象是WeakValueDictionary 中的值，那么当对该图像对象的剩余引用是弱映射对象所持有的弱引用时，垃圾回收可以回收该对象并将其在弱映射对象中相应的条目删除。 WeakKeyDictionary 和WeakValueDictionary

0 码力 | 1961 页 | 9.14 MB | 9 月前
3
Python 标准库参考指南 3.7.13

颜色系统间的转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1192 23.7 imghdr --- 推测图像类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1192 23.8 sndhdr --- 推测声音文件的类型弱引用的主要用途是实现保存大对象的高速缓存或映射，但又不希望大对象仅仅因为它出现在高速缓存或映射中而保持存活。例如，如果您有许多大型二进制图像对象，则可能希望将名称与每个对象关联起来。如果您使用 Python 字典将名称映射到图像，或将图像映射到名称，则图像对象将保持活动状态，因为它们在字典中显示为值或键。weakref 模块提供的WeakKeyDictionary 和WeakValueDictionary 和WeakValueDictionary 类可以替代 Python 字典，使用弱引用来构造映射，这些映射不会仅仅因为它们出现在映射对象中而使对象保持存活。例如，如果一个图像对象是WeakValueDictionary 中的值，那么当对该图像对象的剩余引用是弱映射对象所持有的弱引用时，垃圾回收可以回收该对象并将其在弱映射对象中相应的条目删除。 WeakKeyDictionary 和WeakValueDictionary

0 码力 | 1846 页 | 9.09 MB | 9 月前
3
Python 标准库参考指南 3.8.20

颜色系统间的转换 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1331 22.7 imghdr --- 推测图像类型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1331 22.8 sndhdr --- 弱引用的一个主要用途是实现一个存储大型对象的缓存或映射，但又不希望该大型对象仅因为它只出现在这个缓存或映射中而保持存活。例如，如果你有许多大型二进制图像对象，你可能希望为每个对象关联一个名称。如果你使用 Python 字典来将名称映射到图像，或将图像映射到名称，那么图像对象将因为它们在字典中作为值或键而保持存活。 weakref 模块提供的WeakKeyDictionary 和WeakValueDictionary 和WeakValueDictionary 类可以替代 Python 字典，它们使用弱引用来构造映射，这种映射不会仅因为对象出现在映射中而使对象保持存活。例如，如果一个图像对象是WeakValueDictionary 中的值，那么当对该图像对象的剩余引用是弱映射对象所持有的弱引用时，垃圾回收器将回收该对象，并删除弱映射对象中相应的条目。 WeakKeyDictionary 和WeakValueDictionary 在它们

0 码力 | 2052 页 | 9.74 MB | 9 月前
3

共 33 条前往

页

分类

语言

格式