对于使用「微信读书」的用户来说,虽然平台的阅读体验出色,但始终存在一个限制——已购书籍只能在应用内部阅读,无法导出成可编辑或可注释的格式。这对希望做深入笔记、标注或二次整理内容的读者而言,成为一个不小的障碍。Wereadscan 的出现正是为了补足这一缺口。它是一款开源的爬虫脚本工具,能够扫描用户在微信读书中已购买的书籍,并将其转换成本地 PDF 或 HTML 格式文件,方便在第三方应用中编辑、归档与学习。
网站地址:https://algebra-fun.github.io/WeReadScan
Wereadscan是什么?
Wereadscan 是一个用于「微信读书」内容抓取与转换的开源爬虫项目。
它通过自动化脚本(基于 Selenium 驱动)模拟登录与页面解析,批量获取用户已购图书内容,并将这些章节数据导出为可离线查看的 PDF 或 HTML 文档。
该工具源自开发者为满足个人学习需求所编写的辅助脚本,核心目标是让阅读者更自由地处理自己的阅读内容,而非突破版权限制或分享未授权资源。
核心功能
Wereadscan 聚焦于微信读书已购内容的提取与格式转换,整个流程简洁高效,适合具备一定编程基础的用户使用。
- 已购书籍扫描——自动识别并抓取用户微信读书账户下的所有已购书籍列表。
- 章节内容提取——解析页面中的 #preRenderContent 元素,完整获取正文内容。
- PDF/HTML 输出——支持两种导出格式,可选择高保真排版或轻量化文本。
- 批量处理——一次性扫描多本书籍,提高整理效率。
- WeReadScan-HTML 模式——整合 weread-scraper 的优化逻辑,提升内容抓取速度。
- 本地离线阅读——导出的 PDF 可在任何阅读器中打开,HTML 格式便于二次编辑。
- 兼容 Selenium 自动化——通过浏览器驱动实现精准内容渲染与解析。
- 学习与备份用途——为用户保留学习笔记与私人资料,避免云端丢失。
使用场景
Wereadscan 适用于需要在微信读书外管理或分析阅读内容的用户。尤其是学术研究者、笔记爱好者和数字阅读重度用户,可借助此工具实现更高效的内容整理。
| 人群/角色 | 场景描述 | 推荐指数 |
|---|---|---|
| 学生与研究者 | 导出学术类图书进行批注与引用 | ★★★★★ |
| 数字笔记用户 | 将阅读内容导入 Notion/Obsidian 进行知识整理 | ★★★★★ |
| 开发者 | 学习爬虫与自动化脚本逻辑 | ★★★★☆ |
| 读书爱好者 | 备份已购书籍的离线副本 | ★★★★☆ |
| 版权合规使用者 | 研究微信读书页面结构与API机制 | ★★★☆☆ |
操作指南
由于 Wereadscan 属于技术型工具,用户在运行前需具备基础的 Python 与 Selenium 环境知识。以下为基本操作流程:
- 在 GitHub 上获取 Wereadscan 项目源码。
- 安装必要依赖:包括 Python、Selenium 及浏览器驱动(如 ChromeDriver)。
- 运行脚本前,在配置文件中输入微信读书账户的 cookies 信息。
- 执行主程序命令,启动自动化扫描流程。
- 系统将登录微信读书网页版并抓取所有已购书籍信息。
- 程序自动提取章节 HTML 内容并生成对应文件。
- 在输出目录中选择「导出为 PDF」或「HTML」格式。
- (提示)首次运行时建议仅测试单本书,确认格式与路径设置无误后再批量导出。
支持平台
Wereadscan 为 Python 项目,可在多种系统环境下运行,兼容性良好:
- Windows / macOS / Linux:安装 Python 3.8+ 即可执行。
- 浏览器支持:需配合 Chrome 或 Edge 浏览器驱动使用。
- 终端环境:支持命令行运行,可集成至 VSCode 或 Jupyter Notebook。
- 输出格式:PDF、HTML 两种,适配任意阅读器与文本编辑工具。
产品定价
Wereadscan 为开源项目,完全 免费 使用。
用户可自由下载源码并在本地运行,无需付费或注册。
(项目遵循非商业许可协议,仅允许个人学习和研究使用,不得进行内容传播或商业化操作。)
常见问题
Q1:Wereadscan 会泄露账户信息吗?
A1:不会。脚本仅在本地环境使用 cookies 模拟登录,不会上传任何数据。用户应确保配置文件保存在私有目录中。
Q2:是否可以下载所有微信读书内容?
A2:不可以。该工具仅支持导出已购买或已解锁的书籍,不支持抓取未授权内容。
Q3:需要编程基础吗?
A3:建议具备基础 Python 操作知识(如安装依赖、运行脚本等),熟悉命令行环境会更方便使用。
Q4:导出的内容能否在手机阅读?
A4:可以。生成的 PDF 或 HTML 文件可传输至手机或平板,用任意阅读器打开。
Q5:是否违反微信读书的使用条款?
A5:若仅限个人学习、备份用途且不传播文件,一般不构成违规。禁止任何形式的内容公开分享或商业再利用。
跳跳兔小结
Wereadscan 是一款兼具技术探索与实用价值的开源工具,它帮助用户弥补微信读书“只读不导出”的局限。
对于喜欢做深度笔记、需要本地资料归档或研究书籍结构的用户来说,这个项目提供了灵活的解决方案。
不过,使用者应严格遵守版权规则,仅限个人学习用途,避免涉及任何传播或商业行为。
如果你希望掌控自己的阅读数据,并在多平台之间自由处理内容,Wereadscan 将是一个值得尝试的技术型工具。
