iflytek-asr使用科大讯飞 API 将音频/视频转换为文字。支持本地音频文件转录、YouTube 视频下载并转文字。适用于会议记录、视频字幕、语音笔记等场景。当用户需要语音转文字、音频转录、YouTube 视频转文字时触发。
Install via ClawdBot CLI:
clawdbot install harven-droid/iflytek-asrGrade Fair — based on market validation, documentation quality, package completeness, maintenance status, and authenticity signals.
Calls external URL not in known-safe list
https://www.xfyun.cnAudited Apr 16, 2026 · audit v1.0
Generated Mar 20, 2026
转录企业会议或培训的音频文件,自动生成带标点的文字记录,适用于存档、分享或后续分析。支持长达5小时的音频,适合全天的研讨会或大型会议。
为YouTube视频或其他本地视频文件自动生成中文字幕,提升内容可访问性和用户体验。支持多种音频格式,适合内容创作者和媒体公司。
将个人或团队的语音笔记转换为结构化文本,便于整理和检索。利用中文方言识别功能,适应不同地区的用户需求。
转录客服通话录音,用于质量监控、培训或情感分析。高准确率和自动标点有助于快速提取关键信息。
转录研究访谈或田野调查的音频,生成精确的文字稿用于定性分析。支持大文件处理,适合长时间访谈场景。
提供基于讯飞API的云端转录服务,按使用量或订阅计划收费。可针对企业客户提供定制化套餐,如高优先级处理或批量折扣。
将技能集成到视频编辑软件、CRM系统或会议平台中,作为增值功能销售。通过API调用分成或一次性集成费用盈利。
为企业或教育机构提供私有化部署的转录解决方案,包括定制界面和品牌。收取一次性开发费和年度维护费。
💬 Integration Tip
确保正确设置环境变量并安装依赖,优先测试小文件以验证API连接。
Scored Apr 19, 2026
Local speech-to-text with the Whisper CLI (no API key).
ElevenLabs text-to-speech with mac-style say UX.
Transcribe audio via OpenAI Audio Transcriptions API (Whisper).
Any-to-any AI sub-agent — research, images, video, audio, music, podcasts, avatars, voice cloning, documents, spreadsheets, dashboards, 3D models, diagrams,...
Speak responses aloud on macOS using the built-in `say` command when user input indicates Voice Wake/voice recognition (for example, messages starting with "User talked via voice recognition on <device>").
High-quality voice synthesis with 18 personas, 32 languages, sound effects, batch processing, and voice design using ElevenLabs API.