在中文语音输入和文本处理场景中,兼顾高精度识别、隐私保护和大模型智能优化一直是用户关注的重点。蛐蛐(QuQu)是一款开源免费的桌面端工具,提供本地中文语音识别和大模型文本处理能力。与 Wispr Flow 相比,蛐蛐完全本地运行,优先适配国内大模型生态,支持开发者和办公用户高效完成语音转写、文本优化和智能重写。
蛐蛐(QuQu)是什么?
蛐蛐(QuQu)是一款针对中文用户的开源语音工作流工具,集 FunASR 本地语音识别与大模型智能优化于一体。它不仅提供高精度中文口语转写,还支持自动过滤口头禅、自我更正表达修正,并能将文本生成邮件、代码或其他结构化内容。工具兼容 OpenAI API,同时优先适配国产模型,如通义千问、Kimi 等,保障响应速度、成本和合规性。
网站地址:https://github.com/yan5xu/ququ
核心功能
蛐蛐面向中文用户、开发者及办公人士,提供以下功能:
- 一键唤醒 —— 全局快捷键 F2,快速启动语音输入。
- 实时识别 —— 本地 FunASR Paraformer 引擎高精度中文语音转写。
- 智能优化 —— 连接大模型自动润色、纠错、总结或重写为邮件、文档或代码片段。
- “ASR + LLM”两段式引擎 —— 先语音识别,再大模型优化,自动处理口头禅和自我更正表达。
- 格式化编程术语 —— 支持 camelCase、snake_case 等术语识别与输出,适合开发场景。
- 自定义 AI 指令 —— 根据当前应用情境(写代码、回邮件)自动调整文本输出。
- 无缝粘贴 —— 转写完成后自动粘贴到光标位置,减少手动操作。
- 本地计算与隐私保护 —— 所有语音数据在本地设备处理,不上传云端。
使用场景
蛐蛐适合不同用户在多种场景下使用:
| 人群/角色 | 场景描述 | 推荐指数 |
|---|---|---|
| 中文用户 | 日常语音转文字、邮件或文档处理 | ★★★★★ |
| 开发者 | 语音生成代码片段,识别 camelCase 与 snake_case 术语 | ★★★★★ |
| 企业办公人员 | 语音快速撰写邮件或会议纪要 | ★★★★★ |
| 内容创作者 | 语音输入文稿并智能润色 | ★★★★☆ |
| AI 开发者 | 调试国产模型与 OpenAI API 接口,构建自定义工作流 | ★★★★★ |
操作指南
新手可在 3 分钟内快速上手蛐蛐:
- 下载并安装蛐蛐(QuQu)桌面应用。
- 配置本地 FunASR 引擎或选择大模型接口(如通义千问、OpenAI API)。
- 按 F2 全局快捷键唤醒语音输入。
- 开始说话,系统实时识别并生成文本。
- 文本自动通过大模型优化、纠错或重写。
- 输出结果自动粘贴到光标位置,直接使用。
- 可自定义 AI 指令,按场景优化文本格式与风格。
支持平台
蛐蛐支持多种桌面设备:
- Windows / macOS / Linux —— 桌面端全平台支持。
- 本地计算 —— 所有语音识别和处理在本地完成,无需云端。
- 大模型兼容 —— 支持国产模型与 OpenAI API,可自由配置。
产品定价
蛐蛐(QuQu)完全 免费 开源,无订阅或付费限制,用户可自由使用和定制工作流。
常见问题
Q1:蛐蛐是否安全?
A1:语音数据在本地处理,不上传云端,保证隐私安全。
Q2:是否需要订阅或付费?
A2:完全免费开源,无任何订阅或隐藏费用。
Q3:支持哪些大模型?
A3:优先适配国产模型(如通义千问、Kimi),也兼容 OpenAI API。
Q4:是否支持开发者场景?
A4:支持编程术语识别、自定义指令和多场景文本输出,非常适合开发者使用。
Q5:可在移动端使用吗?
A5:蛐蛐为桌面端应用,目前不提供移动端版本,但可在多平台桌面系统运行。
跳跳兔小结
蛐蛐(QuQu)是一款面向中文用户的开源语音输入与文本处理工具,集本地 FunASR 识别与大模型智能优化于一体。它适合日常办公、开发者、内容创作者及企业用户使用,支持语音转写、文本润色、代码生成及自定义 AI 指令。与 Wispr Flow 相比,蛐蛐免费、隐私保护更好,并优先适配国内大模型生态,适合希望高效、安全处理中文语音的用户。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...