伙伴营销赋能大讲堂,小型技术沙龙筹备实战宝典,解锁销量增长新武器
预约直播
产品
< 返回主菜单
产品中心
产品

交换机

交换机所有产品
< 返回产品
交换机主页
交换机

无线

无线所有产品
< 返回产品
无线主页
无线

云桌面

云桌面产品方案中心
< 返回产品
云桌面主页
云桌面

安全

安全所有产品
< 返回产品
安全主页
安全
行业
< 返回主菜单
行业中心
行业

算力评测

提供测试脚本对算力单元、整机、计算柜进行PCI带宽及压力、功耗、推理、及训练测试等,帮助客户评估实际运行过程的运行成本,从而选择性价比更高的硬件配置。

项目咨询
算力评测

评测内容

性能评测
在推理和训练过程中,评测每秒处理的 tokens 及生成延迟
吞吐性能
TTFT首Token延迟
TPOT单个Token生成延迟
QPs每秒处理请求数
吞吐性能

*高吞吐量意味着更高效的计算能力,每秒可以生成的tokens数量多少

TTFT首Token延迟

*用户感受到的从发出请求到第1个token输出的延迟

TPOT单个Token生成延迟

*生成阶段单个 token 的生成时间,体现了单个用户感受到的生成速度

QPs每秒处理请求数

*每秒可同时处理的请求

基准测试

基准测试

使用基准测试数据集(如MMLU、GPQA、HumanEval、GSM-8K、MATH、BBH、CEval)评估LLM在NLP任务、常识推理、数学推理等任务中的性能及精度,指导模型改进及优化。
资源利用

资源利用

评估显存和主存的使用情况,确保模型在推理和训练过程中不会超出资源限制。
扩展性

扩展性

测试在多 GPU 或分布式环境下的性能扩展能力,评估系统在增加计算资源时性能的提升情况。
功耗

功耗

静态或实际运行过程的功耗,评估对服务器的显卡插槽的供电要求。

评测资源

使用VLLM、Deepspeed等开源工具对各类算力单元、整机、计算柜进行大语言模型(LLM)推理、训练测试。使用llm-evaluation-harness工具对大型语言模型(LLM)进行基准测试

返回顶部

收起
请选择服务项目
关闭咨询页
售前咨询 售前咨询
售前咨询
售后服务 售后服务
售后服务
意见反馈 意见反馈
意见反馈
更多联系方式
是否找到您想要的内容?
您遇到了什么问题?
找不到想要的信息
筛选功能不好用
加载速度太慢
页面体验差
提交
您是否找到了与产品相关的文档
筛选功能是否帮助您更快找到所需的文档?
有帮助
一般
没有帮助
没用过
请问您遇到了什么问题?
需要填写的内容太多
有些信息不懂怎么填
页面有问题/错误
其他
确定
这些客户案例是否对您有帮助?
非常有帮助
比较有帮助
没有帮助
请您对这个客户案例进行评价
兴趣度
相关性
可信度
确定
感谢您的反馈!
感谢您的反馈!