最終更新:2025-02-05 (水) 15:06:08 (2d)
Module LLM/音声合成
Top / Module LLM / 音声合成
現状
- SummerTTS: SummerTTSが英語と中国語の対応のみなので日本語対応してないぽい
- MeloTTS: 現状モデルが英語・中国語のみ(llm-melotts-zh-cn)だけど日本語とかも作業中っぽい
Module LLM/モデル
Arduino (M5Module-LLM)から呼べるもの
SummerTTS
- 英語・中国語
- M5ModuleLLM/サンプル/TTS
MeloTTS
- 英語・中国語 (同じモデル:llm-melotts-zh-cn)
The Chinese speaker supports mixed Chinese and English.
- M5ModuleLLM/サンプル/VoiceAssistant
StackFlowのみ
- 今のところなし
デモ
melotts.axera
- 多言語対応中
--language", "-l", type=str, choices=["ZH", "ZH_MIX_EN", "JP", "EN", 'KR', "ES", "SP","FR"], required=False, default="ZH_MIX_EN"
openvoice.axera
- 元のOpenVoice V2では英語、スペイン語、フランス語、中国語、日本語、韓国語がネイティブにサポート
その他 (CPU動作など)
VOICEVOX CORE
- 一言しゃべるのに1分くらいかかる模様
https://x.com/washishi/status/1881309469814202821
VALL-E X
- 「こんにちは。今日はいい天気ですね。」で14分かかるらしい
https://x.com/mongonta555/status/1881338099072213264
Open JTalk
Open JTalk/StackFlow連携
AquesTalk ESP32
観測地点
https://github.com/m5stack/StackFlow/commits/dev/
https://github.com/m5stack/M5Module-LLM/commits/dev/
https://github.com/orgs/AXERA-TECH/repositories
https://github.com/ml-inory?tab=repositories