中文本地语音输入与文本处理工具:蛐蛐(QuQu)

有趣网站17小时前发布 THE CODER
2 0 0

在中文语音输入和文本处理场景中,兼顾高精度识别、隐私保护和大模型智能优化一直是用户关注的重点。蛐蛐(QuQu)是一款开源免费的桌面端工具,提供本地中文语音识别和大模型文本处理能力。与 Wispr Flow 相比,蛐蛐完全本地运行,优先适配国内大模型生态,支持开发者和办公用户高效完成语音转写、文本优化和智能重写。

蛐蛐(QuQu)是什么?

蛐蛐(QuQu)是一款针对中文用户的开源语音工作流工具,集 FunASR 本地语音识别与大模型智能优化于一体。它不仅提供高精度中文口语转写,还支持自动过滤口头禅、自我更正表达修正,并能将文本生成邮件、代码或其他结构化内容。工具兼容 OpenAI API,同时优先适配国产模型,如通义千问、Kimi 等,保障响应速度、成本和合规性。

网站地址:https://github.com/yan5xu/ququ

中文本地语音输入与文本处理工具:蛐蛐(QuQu)

核心功能

蛐蛐面向中文用户、开发者及办公人士,提供以下功能:

  • 一键唤醒 —— 全局快捷键 F2,快速启动语音输入。
  • 实时识别 —— 本地 FunASR Paraformer 引擎高精度中文语音转写。
  • 智能优化 —— 连接大模型自动润色、纠错、总结或重写为邮件、文档或代码片段。
  • “ASR + LLM”两段式引擎 —— 先语音识别,再大模型优化,自动处理口头禅和自我更正表达。
  • 格式化编程术语 —— 支持 camelCase、snake_case 等术语识别与输出,适合开发场景。
  • 自定义 AI 指令 —— 根据当前应用情境(写代码、回邮件)自动调整文本输出。
  • 无缝粘贴 —— 转写完成后自动粘贴到光标位置,减少手动操作。
  • 本地计算与隐私保护 —— 所有语音数据在本地设备处理,不上传云端。

使用场景

蛐蛐适合不同用户在多种场景下使用:

人群/角色 场景描述 推荐指数
中文用户 日常语音转文字、邮件或文档处理 ★★★★★
开发者 语音生成代码片段,识别 camelCase 与 snake_case 术语 ★★★★★
企业办公人员 语音快速撰写邮件或会议纪要 ★★★★★
内容创作者 语音输入文稿并智能润色 ★★★★☆
AI 开发者 调试国产模型与 OpenAI API 接口,构建自定义工作流 ★★★★★

操作指南

新手可在 3 分钟内快速上手蛐蛐:

  1. 下载并安装蛐蛐(QuQu)桌面应用。
  2. 配置本地 FunASR 引擎或选择大模型接口(如通义千问、OpenAI API)。
  3. 按 F2 全局快捷键唤醒语音输入。
  4. 开始说话,系统实时识别并生成文本。
  5. 文本自动通过大模型优化、纠错或重写。
  6. 输出结果自动粘贴到光标位置,直接使用。
  7. 可自定义 AI 指令,按场景优化文本格式与风格。

支持平台

蛐蛐支持多种桌面设备:

  • Windows / macOS / Linux —— 桌面端全平台支持。
  • 本地计算 —— 所有语音识别和处理在本地完成,无需云端。
  • 大模型兼容 —— 支持国产模型与 OpenAI API,可自由配置。

产品定价

蛐蛐(QuQu)完全 免费 开源,无订阅或付费限制,用户可自由使用和定制工作流。

常见问题

Q1:蛐蛐是否安全?
A1:语音数据在本地处理,不上传云端,保证隐私安全。

Q2:是否需要订阅或付费?
A2:完全免费开源,无任何订阅或隐藏费用。

Q3:支持哪些大模型?
A3:优先适配国产模型(如通义千问、Kimi),也兼容 OpenAI API。

Q4:是否支持开发者场景?
A4:支持编程术语识别、自定义指令和多场景文本输出,非常适合开发者使用。

Q5:可在移动端使用吗?
A5:蛐蛐为桌面端应用,目前不提供移动端版本,但可在多平台桌面系统运行。

跳跳兔小结

蛐蛐(QuQu)是一款面向中文用户的开源语音输入与文本处理工具,集本地 FunASR 识别与大模型智能优化于一体。它适合日常办公、开发者、内容创作者及企业用户使用,支持语音转写、文本润色、代码生成及自定义 AI 指令。与 Wispr Flow 相比,蛐蛐免费、隐私保护更好,并优先适配国内大模型生态,适合希望高效、安全处理中文语音的用户。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...