<汇港通讯> 阿里云发布通义家族首个端到端全模态大模型Qwen2.5-Omni-7B。
该模型专为全模态感知设计,可处理文本、图像、音频、视频等多模态输入,并实时生成文本与自然语言应答,为在手机、笔记本电脑等终端设备部署多模态AI设立新标准。
尽管仅采用了轻量级的7B参数,Qwen2.5-Omni-7B仍展现出卓越的性能与强大的多模态能力,成为开发高效能、高性价比、且具使用价值的AI智能体的理想基座模型,在智能语音应用领域尤其具有前景。例如,透过即时语音导航协助视障者安全辨识周边环境,分析视频中的食材按步骤提供烹饪指导,及打造真正理解客户需求的智能客服对话体验。
该模型现已在Hugging Face与GitHub上开源,并可透过Qwen Chat及阿里云开源社区ModelScope获取。目前,阿里云已开源超过200个生成式AI模型。 (LF)
新闻来源 (不包括新闻图片): 汇港资讯