feat: 配置Python环境与依赖,优化数据解析及修复选择器 指定项目使用Python 3.10运行环境。 新增Scrapy、Playwright等依赖并配置华为云PyPI镜像源。 启用Playwright中间件并禁用默认文件和图片存储配置。 增强数据提取功能,支持通过CSS、XPath和正则表达式前缀动态选择解析方法并添加格式校验。 修复数据解析配置中的CSS选择器语法以正确提取链接和标题。 Signed-off-by: xdicac xdicac226@163.com
feat: 配置Python环境与依赖,优化数据解析及修复选择器
Signed-off-by: xdicac xdicac226@163.com
通过toml动态配置爬虫
scraper