Scrapy 2.7 Documentation
1.67 MB
401 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
文档介绍了Scrapy 2.7.1版本的新功能、错误修复、弃用通知以及安装建议。新增功能包括支持Google Cloud Storage到Feed exports、引入FEED_EXPORT_BATCH_ITEM_COUNT设置以批量输出项目项,移到Item loaders到外部库以便独立使用和版本控制。错误修复涉及 TLS 兼容性和 XPath selectors。文档还推荐在Windows上使用Anaconda进行安装。 | ||
AI总结 | ||
《Scrapy 2.7 Documentation》主要包含Scrapy框架的功能、安装指南、版本更新说明以及框架架构等内容。以下是核心内容的总结:
### 1. **版本更新说明**
- **Scrapy 2.7.1**(2022-11-02):
- **新功能**:放宽了代理认证头部限制,恢复对scrapy-zyte-smartproxy的兼容性。
- **错误修复**:修复了多个问题,包括使用`-O/--overwrite-output`和`-t/--output-format`选项时的冲突,替换了deprecated asyncio APIs,并修复了Scrapy内部使用的deprecated APIs。
- **文档更新**:升级了contributor covenant至v2.1,修复了拼写错误。
- **Scrapy 2.3.0**(2020-08-04):
- **新功能**:支持Google Cloud Storage作为反馈存储后端,引入`FEED_EXPORT_BATCH_ITEM_COUNT`设置以分批次输出项目。
- **弃用**:移除了`scrapy.linkextractors`中的多个类,建议使用`LinkExtractor`代替。
- **Scrapy 1.3.3**(2017-03-10):
- 错误修复:恢复了缺失依赖时的导入错误NameValuePair默认设置。
- **Scrapy 1.3.2**(2017-02-13):
- 错误修复:修复了请求类序列化问题、tutorial中选择器的一致性及Twisted 17+中的TLS兼容性。
- **Scrapy 1.3.1**(2017-02-08):
- **新功能**:支持布尔设置的字符串值、`response.xpath()`的XPath变量和命名空间声明、Python 3.6支持。
- **测试**:开始在PyPy上运行测试,但仍未完全支持。
### 2. **安装指南**
- **支持的Python版本**:要求Python 3.7+,支持CPython和PyPy(部分测试仍失败,PyPy尚未正式支持)。
- **安装方式**:
- 使用Anaconda/Miniconda的conda-forge渠道安装,推荐在Windows上使用。
- 或通过PyPI使用pip安装,建议在专用虚拟环境中安装。
### 3. **架构概述**
- Scrapy架构包括组件如调度器、下载器、蜘蛛、项目管道等,数据流从调度器开始,通过下载器、蜘蛛、项目管道,最终存储结果。
- 架构图清晰展示了组件交互和数据流向,还提供了详细说明,帮助用户理解Scrapy的运行机制。
### 4. **文档清理与质量保障**
- **文档清理**:涉及多个问题,优化了代码的类型提示、测试覆盖率、错误修复、格式化字符串使用及超类调用等,保持代码现代化。
### 5. **贡献与版本控制**
- 鼓励用户为Scrapy项目贡献力量,详细说明了贡献指南。
- 解释了Scrapy的版本命名规则及API的稳定性,帮助用户理解版本更新策略和兼容性。
### 6. **常用设置**
- **ITEM_PIPELINES_BASE**:默认启用的管道,用户项目中不应修改,应改用ITEM_PIPELINES。
- **JOBDIR**:爬虫状态保存目录,用于暂停/恢复爬虫。
- **日志设置**:包括启用日志、编码、日志文件名、日志格式等,帮助用户配置日志记录。
### 7. **命令行工具**
- **scrapy settings**:获取Scrapy设置值,显示项目或默认值。
- **runspider**:运行独立的蜘蛛文件,无需创建项目。
- **version**:查看Scrapy版本和依赖信息,适合生成错误报告。
- **bench**:运行快速基准测试,评估性能。
---
以上为《Scrapy 2.7 Documentation》的核心内容总结,涵盖了主要功能更新、安装指南、架构概述及常用设置和工具的信息。 |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
394 页请下载阅读 -
文档评分