LocalLLaMA@poweruser.forumEnglish · 1 year ago

NVidia H200 achieves nearly 12,000 tokens/sec on Llama2-13B with TensorRT-LLM

1

NVidia H200 achieves nearly 12,000 tokens/sec on Llama2-13B with TensorRT-LLM

LocalLLaMA@poweruser.forumEnglish · 1 year ago

Chat

Wrong_User_LoggedB
link
fedilink
English
arrow-up
1·
1 year ago
my waifu would be super happy if she could speak to me faster