feat: 配置Python环境与依赖,优化数据解析及修复选择器
- 指定项目使用Python 3.10运行环境。
- 新增Scrapy、Playwright等依赖并配置华为云PyPI镜像源。
- 启用Playwright中间件并禁用默认文件和图片存储配置。
- 增强数据提取功能,支持通过CSS、XPath和正则表达式前缀动态选择解析方法并添加格式校验。
- 修复数据解析配置中的CSS选择器语法以正确提取链接和标题。
Signed-off-by: xdicac xdicac226@163.com
版权所有:中国计算机学会技术支持:开源发展技术委员会
京ICP备13000930号-9
京公网安备 11010802032778号
scraper