中文本地语音输入与文本处理工具：蛐蛐（QuQu）

在中文语音输入和文本处理场景中，兼顾高精度识别、隐私保护和大模型智能优化一直是用户关注的重点。蛐蛐（QuQu）是一款开源免费的桌面端工具，提供本地中文语音识别和大模型文本处理能力。与 Wispr Flow 相比，蛐蛐完全本地运行，优先适配国内大模型生态，支持开发者和办公用户高效完成语音转写、文本优化和智能重写。

蛐蛐（QuQu）是什么？

蛐蛐（QuQu）是一款针对中文用户的开源语音工作流工具，集 FunASR 本地语音识别与大模型智能优化于一体。它不仅提供高精度中文口语转写，还支持自动过滤口头禅、自我更正表达修正，并能将文本生成邮件、代码或其他结构化内容。工具兼容 OpenAI API，同时优先适配国产模型，如通义千问、Kimi 等，保障响应速度、成本和合规性。

网站地址：https://github.com/yan5xu/ququ

核心功能

蛐蛐面向中文用户、开发者及办公人士，提供以下功能：

一键唤醒 —— 全局快捷键 F2，快速启动语音输入。
实时识别 —— 本地 FunASR Paraformer 引擎高精度中文语音转写。
智能优化 —— 连接大模型自动润色、纠错、总结或重写为邮件、文档或代码片段。
“ASR + LLM”两段式引擎 —— 先语音识别，再大模型优化，自动处理口头禅和自我更正表达。
格式化编程术语 —— 支持 camelCase、snake_case 等术语识别与输出，适合开发场景。
自定义 AI 指令 —— 根据当前应用情境（写代码、回邮件）自动调整文本输出。
无缝粘贴 —— 转写完成后自动粘贴到光标位置，减少手动操作。
本地计算与隐私保护 —— 所有语音数据在本地设备处理，不上传云端。

使用场景

蛐蛐适合不同用户在多种场景下使用：

人群/角色	场景描述	推荐指数
中文用户	日常语音转文字、邮件或文档处理	★★★★★
开发者	语音生成代码片段，识别 camelCase 与 snake_case 术语	★★★★★
企业办公人员	语音快速撰写邮件或会议纪要	★★★★★
内容创作者	语音输入文稿并智能润色	★★★★☆
AI 开发者	调试国产模型与 OpenAI API 接口，构建自定义工作流	★★★★★

操作指南

新手可在 3 分钟内快速上手蛐蛐：

下载并安装蛐蛐（QuQu）桌面应用。
配置本地 FunASR 引擎或选择大模型接口（如通义千问、OpenAI API）。
按 F2 全局快捷键唤醒语音输入。
开始说话，系统实时识别并生成文本。
文本自动通过大模型优化、纠错或重写。
输出结果自动粘贴到光标位置，直接使用。
可自定义 AI 指令，按场景优化文本格式与风格。

支持平台

蛐蛐支持多种桌面设备：

Windows / macOS / Linux —— 桌面端全平台支持。
本地计算 —— 所有语音识别和处理在本地完成，无需云端。
大模型兼容 —— 支持国产模型与 OpenAI API，可自由配置。

产品定价

蛐蛐（QuQu）完全免费开源，无订阅或付费限制，用户可自由使用和定制工作流。

常见问题

Q1：蛐蛐是否安全？
A1：语音数据在本地处理，不上传云端，保证隐私安全。

Q2：是否需要订阅或付费？
A2：完全免费开源，无任何订阅或隐藏费用。

Q3：支持哪些大模型？
A3：优先适配国产模型（如通义千问、Kimi），也兼容 OpenAI API。

Q4：是否支持开发者场景？
A4：支持编程术语识别、自定义指令和多场景文本输出，非常适合开发者使用。

Q5：可在移动端使用吗？
A5：蛐蛐为桌面端应用，目前不提供移动端版本，但可在多平台桌面系统运行。

跳跳兔小结

蛐蛐（QuQu）是一款面向中文用户的开源语音输入与文本处理工具，集本地 FunASR 识别与大模型智能优化于一体。它适合日常办公、开发者、内容创作者及企业用户使用，支持语音转写、文本润色、代码生成及自定义 AI 指令。与 Wispr Flow 相比，蛐蛐免费、隐私保护更好，并优先适配国内大模型生态，适合希望高效、安全处理中文语音的用户。