検索

クイックアクセス

チラ裏

おなかすいた族！

リンク

人気の50件

最終更新:2025-01-26 (日) 09:00:34 (173d)

音声対話システム
Moshi
Top / Moshi

a speech-text foundation model for real time dialogue

https://arxiv.org/abs/2410.00037 https://github.com/kyutai-labs/moshi

推論スタック

pip
PyTorch moshi
MLX moshi_mlx
Rust

関連

J-Moshi
Mimi

SpeechTokenizer?
SemantiCodec?
SoundStream?
EnCodec?
WavLM