xiaomi-mimo-tts使用小米 MiMo TTS (mimo-v2-tts) 生成语音。 支持多种音色、风格控制、情感标签和方言。 需要 MIMO_API_KEY。
Install via ClawdBot CLI:
clawdbot install jazzqi/xiaomi-mimo-ttsGrade Fair — based on market validation, documentation quality, package completeness, maintenance status, and authenticity signals.
Sends data to undocumented external endpoint (potential exfiltration)
POST → https://api.xiaomimimo.com/v1/chat/completionsCalls external URL not in known-safe list
https://platform.xiaomimimo.com/AI Analysis
The skill sends user-provided text to an undocumented external API endpoint (xiaomimimo.com) for processing. While this is consistent with the skill's stated TTS purpose, the external service is not a known, vetted provider, and data handling practices are unclear, creating privacy and data control risks.
Audited Apr 17, 2026 · audit v1.0
Generated May 6, 2026
利用MiMo TTS的多情感与方言能力,为电子书或故事平台自动生成带有角色情感的有声内容。AI根据文本内容自动选择悲伤、温柔或方言风格,快速制作高质量音频,无需人工录音。
在客服机器人中集成MiMo TTS,根据用户情绪与场景动态调整语音风格:紧急情况用紧张语速安抚,好消息用开心语调反馈。结合方言支持可服务不同地区用户,提升交互自然度。
为语言学习应用提供多方言、多语速的发音示范。学习者可对比普通话与东北话、四川话等方言的差异,或通过慢速、清晰发音练习听力和口语。
内容创作者使用MiMo TTS为短视频、播客或游戏角色配音,快速生成搞笑方言段子、温柔独白或紧张旁白,降低配音成本,提高内容产出效率。
为视障人士或阅读困难群体提供可将文字转换为带情感语音的辅助阅读工具。支持多种情感标签,使朗读更具表现力,增强理解与沉浸感。
基于云的TTS服务,按API调用次数或生成音频时长收费。用户通过REST API集成,适合中小企业和开发者,按需付费,无需维护基础设施。
将TTS引擎作为SDK嵌入智能家居、机器人或车载系统等硬件设备,按设备数量收取一次性许可费。适合需要离线运行或低延迟的场景。
建立有声内容市集,用户按月付费订阅,可以无限生成特定风格的有声内容(如儿童故事、方言笑话)。平台提供预制风格模板和内容管理系统。
💬 Integration Tip
设置MIMO_API_KEY环境变量,直接调用scripts/mimo-tts.sh传入文本即可快速体验;高级定制可参考smart/目录中的智能版本实现自动风格选择。
Scored May 6, 2026
Local speech-to-text with the Whisper CLI (no API key).
ElevenLabs text-to-speech with mac-style say UX.
Transcribe audio via OpenAI Audio Transcriptions API (Whisper).
Text-to-speech conversion using node-edge-tts npm package for generating audio from text. Supports multiple voices, languages, speed adjustment, pitch control, and subtitle generation. Use when: (1) User requests audio/voice output with the "tts" trigger or keyword. (2) Content needs to be spoken rather than read (multitasking, accessibility, driving, cooking). (3) User wants a specific voice, speed, pitch, or format for TTS output.
Local text-to-speech via sherpa-onnx (offline, no cloud)
Start voice calls via the OpenClaw voice-call plugin.