开发者 Matt Hartman 近日发布了一款名为 Ghost Pepper 的 macOS 应用,旨在为用户提供完全本地化的语音转文字体验。该应用通过按住 Control 键触发录音,释放后即可自动完成转录并粘贴至任意文本框。
与市面上许多依赖云端 API 的语音输入工具不同,Ghost Pepper 的所有处理流程均在设备本地完成。该应用利用 Apple Silicon 芯片的算力,确保用户数据不会离开计算机。
本地化模型与智能优化
Ghost Pepper 的核心技术由 WhisperKit 提供语音识别支撑,并结合基于 LLM.swift 的本地大语言模型进行语音清洗。这种“智能清理”功能可以自动移除口语中的填充词并处理自我修正,从而提高输出文本的质量。
根据项目文档,该应用默认使用 Whisper small.en 模型和 Qwen 3.5 0.8B 模型,以平衡响应速度与准确度。用户还可以根据需求选择更大的模型,例如 Parakeet v3 多语言模型,或通过调整清理提示词来定制输出风格。
该应用以菜单栏工具的形式运行,不占用 Dock 图标,并支持开机自启。在隐私保护方面,开发者承诺软件不会将转录内容写入磁盘,所有调试日志仅存在于内存中,应用关闭后即消失。
目前,Ghost Pepper 已在 GitHub 开源,遵循 MIT 协议。该应用要求 macOS 14.0 及以上版本,且必须运行在 Apple Silicon 芯片的 Mac 设备上。由于需要模拟键盘输入和录音权限,安装时用户需手动授予相应的辅助功能与麦克风权限。
针对企业级环境,IT 管理员可以通过 MDM 配置文件预先批准权限,确保在受管设备上正常部署。Hartman 在项目介绍中表示,Ghost Pepper 提供了一套免费的本地化替代方案,挑战了目前市场上融资数千万美元的商业语音转写产品。