设计、网站、推广
始于2004年
当前位置:首页 > 行业动态

阿里魔搭社区开源推理引擎 DashInfer

发表日期:2024-5-24 作者来源:派谷网络 浏览次数:0

ModelScope 推出了预训练大语言模型(LLM)推理引擎 DashInfer,支持 C++ 和 Python 语言接口,可在多种 CPU 架构上高效推理大模型。

DashInfer 采用 C++ Runtime 编写,支持连续批处理和多 NUMA 推理,能充分利用服务器级 CPU 的算力,为推理14B 及以下的 LLM 模型提供更多硬件选择。该引擎已开源,提供轻量级架构,高精度实现,优化的计算 Kernel,以及行业标准 LLM 推理技术。DashInfer 支持主流 LLM 开源模型和 PTQ 量化技术。

此外,引擎还提供多语言 API 接口,支持多种硬件和数据类型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等数据类型。关于模型支持,DashInfer 可以加载和序列化模型,执行推理过程,并采用 DLPack 格式的 tensor 与外部框架交互。在单 NUMA 架构下,推理引擎使用多线程和线程池进行调度;而在多 NUMA 架构下,引擎采用多进程 client-server 架构,实现 tensor parallel 的模型推理。

性能测试结果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能够有效提升大模型推理效率。

代码开源地址:

https://github.com/modelscope/dash-infer

推理体验地址:

https://www.modelscope.cn/studios/modelscope/DashInfer-Demo
本文章系本站编辑转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!

相关网站设计案例

相关推荐新闻

外贸网站建设对企业有什...

外贸网站建设对企业的作用主要体现在拓展市场、提升品牌形象、降...

日期:2025-5-15

做一个企业网站需要花多...

做一个企业网站的费用因多种因素而异,主要包括以下几个方面:域...

日期:2025-5-15

营销型企业网站建设的核...

营销型企业网站建设的核心是围绕“营销目标”整合流量获取、转化...

日期:2025-5-15

网站策划对于网站项目建...

网站策划对于网站项目建设至关重要,它是项目成功的基础和核心导...

日期:2025-5-15

网站在制作过程中需要注...

网站制作是一个系统性工程,需要从规划、设计、开发到上线运营全...

日期:2025-5-15

网站建设解决方案
专业网站建设网站设计方案 网站维护解决方案 企业门户网站集约化解决方案 营销型网站解决方案 养老院行业网站建设解决方案 医院诊所网站建设解决方案 手机数码行业网站建设方案 外贸公司网站建设解决方案 金融网站建设解决方案 行业协会类网站建设解决方案