It sounds like Cerebras would be perfect for models with Mamba architecture, as ...

		cubefox 26 days ago \| parent \| context \| favorite \| on: Cerebras launches Qwen3-235B, achieving 1.5k token... It sounds like Cerebras would be perfect for models with Mamba architecture, as those don't need a large KV cache for long contexts.