Register

This site is a private, non-commercial website. As such, you're welcome here as long as you were invited. If you would like an invite, reach out to Cliff Spark

Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference

Thread starter benchmarkist
Start date Nov 19, 2024

B

benchmarkist

Nov 19, 2024

#1

Article URL: Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference - Cerebras

Comments URL: Llama 3.1 405B now runs at 969 tokens/s on Cerebras Inference | Hacker News

Points: 415

# Comments: 133

Continue reading...

Share:

Facebook X Bluesky LinkedIn Reddit Pinterest Tumblr WhatsApp Email Link

Cliff here, wishing you well!

Top