阿里云携手模思智能构建一站式多模态数据处理平台

2026-01-30 15:19 来源:朝闻天下   阅读量:6272   会员投稿

模思智能简介

上海模思智能科技有限公司(MOSI Intelligence)成立于2024年11月,是国内深度情境智能领航者,依托深厚的学术积淀与卓越的工程落地能力,致力于构建下一代全感官人机交互体系。公司由复旦大学知名教授邱锡鹏担任首席科学家,以复旦大学自然语言处理实验室(FudanNLP)的MOSS团队为核心组建。

模思智能专注于端到端语音大模型与多模态智能体研发,其核心产品MOSS-Speech率先实现“真·语音到语音”交互,跳过文本中转瓶颈,能够原生捕捉并生成语调、情绪与笑声,为内容创作、数字人及具身智能提供更自然、更具温度的交互底座。

阿里云 MaxCompute 云原生 AI 数据平台:赋能 AI 数据处理工作流加速

在人工智能技术快速迭代的今天,多模态数据处理已成为大模型训练与应用开发的核心挑战。图像、视频、音频等非结构化数据的爆发式增长,对数据处理平台的算力类型、弹性、计算引擎数据处理能力及多模态数据统一管理能力提出了更高的要求。

阿里云与模思智能达成深度合作,基于阿里云 MaxCompute 构建云原生一站式多模态数据处理平台,同时通过 MaxCompute 自研分布式 AI 计算引擎 MaxFrame 实现对多模态数据高效开发、处理,为大模型研发、创新提供了坚实的数据基座。

业务挑战

随着模思业务规模扩大,面临本地IDC在存储、算力与网络上的扩展瓶颈,难以支撑高并发、大规模音视频处理 Pipeline,同时自建平台耗费大量人力,制约了其核心 AI业务的创新、发展。

● 本地IDC架构性能瓶颈

随着模思业务规模的扩大和模型训练对数据量、处理时效性的要求提升,原有IDC基础设施在计算弹性、存储容量、I/O性能、网络带宽等方面已无法满足高并发、大规模音视频等多模态数据的处理需求。

此外,多模态数据预处理流程复杂,涉及视频切帧、语音识别、音频文字提取等多种操作,面对海量多模态数据清洗、处理等计算密集型任务,传统 IDC 自建方案出现性能瓶颈、频繁任务失败等问题,作业稳定性、性能难以保障。

● 异构资源调度复杂度高

多模态数据处理 Pipeline 需同时调度数千卡与数万核算力资源,传统调度系统难以实现跨模态任务(如音频转写、视频抽帧、特征提取等)对异构计算资源的精细化、高效率分配与协同。

● 非结构化数据管理困难

音视频等非结构化数据缺乏统一的元数据管理体系,导致数据不可见、难检索、生命周期难追踪,影响数据资产的高效利用与治理 。

● 缺乏统一任务管理与可视化支持

原有数据处理流程依赖单机 Python 程序完成开发、调试与生产任务,缺少可视化任务开发、管理、调度和运维能力,多参数迭代效果评估困难,开发效率低下。

● 开发与运维人力投入受限

基于自建数据预处理框架、集群需投入大量人力进行开发与维护,业务团队难以专注于核心AI业务创新。

解决方案

阿里云为模思智能打造了基于MaxCompute MaxFrame的一体化多模态数据处理方案,构建从可视化作业开发、数据管理及多模态数据处理的完整闭环。

● 高效、稳定的分布式多模态数据处理

· 依托 MaxCompute 自研分布式 AI 计算引擎 MaxFrame,实现对音视频数据进行标准化、切分、语音识别等高效处理。 MaxFrame 支持通过 Rebalance 实现数据切分、并发控制,从而在内存与吞吐之间取得平衡,放大性能收益。

· 分布式 AI 计算引擎 MaxFrame 支持在一个作业 Pipeline 中同时调度异构计算资源,将各类多模态数据处理算子合理分配至不同的异构计算资源中执行,充分、合理利用算力资源优势。

● 统一数据管理与元数据采集

· 基于阿里云对象存储 OSS 进行原始音视频数据统一存储,通过高速内网直连为 MaxCompute 提供了超高带宽及 IO性能。针对多模态小文件,OSS提供了极高的QPS解决了在高并发下的延迟抖动问题,保障算力充分利用。

· 通过 MaxCompute 提供的 Object Table 表类型,实现对 OSS 上存储的多模态图片、视频等非结构化数据的元数据自动采集与统一纳管,支持结构化与非结构化数据集的目录化管理,便于数据的检索与调用。

● 开箱即用的开发体验

· 通过 Dataworks 实现多模态数据处理任务Pipeline的编排、调度、运维,一站式管理任务。处理完毕后沉淀的AI资产,通过数据地图对外统一展示、搜索、权限申请、查看数据血缘,完成AI数据资产的管理。

· MaxFrame 作为 MaxCompute 自研分布式 AI 计算引擎,提供开箱即用的分布式、多模态数据处理能力,内置任务调度、作业容错与自运维能力,大幅降低开发维护成本,使业务团队能聚焦于核心AI创新。

· MaxFrame 与 DataWorks Notebook 深度集成,提供可视化开发、调度、管理平台,支持灵活的 Python 开发生态与开发环境,无需复杂环境配置即可快速启动多模态数据处理任务,显著降低作业开发门槛。

业务价值

合作实施后,模思智能在数据处理流程多个维度实现显著突破。计算资源利用效率大幅提升,通过 MaxCompute "包月固定资源 + 按需弹性资源"的组合模式,高峰期可快速扩展至 数万核 计算资源,计算资源利用率提升 30% 以上。多模态数据处理效率实现质的飞跃,基于 MaxFrame 构建的分布式处理架构替代原有自建方案,音视频预处理,性能提升 100%,整体数据处理 Pipeline 耗时大幅缩短,批量推理任务借助弹性GPU异构资源实现高效执行。平台运维复杂度显著降低,全托管云原生PaaS能力使团队无需投入大量人力进行底层基础设施维护,运维资源投入减少 50%,得以更专注于核心AI业务创新。

总结与展望

阿里云与模思智能的成功合作,验证了基于 MaxCompute 构建云原生多模态数据处理平台的可行性与技术优势。该方案有效解决了大模型时代多模态数据处理的资源弹性、性能瓶颈与统一管理等核心挑战,为AI应用研发提供了高效、可靠的数据基础设施。未来,双方将继续深化在多模态数据处理、大模型数据预处理等前沿场景的联合创新,推动 Data + AI 技术在更广泛行业的规模化应用,助力企业加速AI价值释放。

 

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

热门

一键全自动换电——泰州市首家蔚来第三代换电站在兴化戴南上线
一键全自动换电——泰州市首家蔚来第三代换电站

一辆新能源汽车稳稳地停到蔚来充换电一体站的停车平台上,汽车下部的换电装置自动开启,卸下用完电的电池,换上充足电的...更多>

喜报!中诚信托荣获深交所优秀债券投资交易机构奖项
喜报!中诚信托荣获深交所优秀债券投资交易机构

2月27日,深圳证券交易所组织召开2022年度债券监管发展业务座谈会,并表彰在服务国家重点战略、推进债券市场高质...更多>

人民银行:指导银行将个人信贷延期还款政策落到实处
人民银行:指导银行将个人信贷延期还款政策落到

2022年第一季度金融统计数据新闻发布会现场。人民网黄盛摄人民网北京4月14日电(黄盛)今日,中国人民银行(以下...更多>

发放消费券、举办消费节、推动线上线下消费融合,近期一批促消费措施密集推出—— 为消费升温积聚合力
发放消费券、举办消费节、推动线上线下消费融合

4月20日是海南离岛免税政策落地实施11周年。11年来,海南离岛免税销售金额和购物人数不断攀升,离岛免税购物已成...更多>

线上线下加速融合,新型业态惠民便民—— 商业新模式激发消费新活力
线上线下加速融合,新型业态惠民便民—— 商业

在上海街头,一家集合了艺术展览、画材、图书、生活家居、艺术衍生品、服装零售等多种业态内容的超级百货集合体验店,吸...更多>

聚焦

京东方A:第一季度净利润43.89亿元同比下滑16.57%
2026武汉国际交易技术科技峰会:聚焦趋势、
2026年1月24日,由ForextopEXPO主办,汇商琅...更多>
传承中医智慧,助力银龄健康—陈金恩被推选为2
近日,中国人口文化促进会慢病防治援助工作委员会、中国药文化研...更多>
中外企业冀加深与西部陆海新通道合作
“我们愿意为西部陆海新通道提供最密集的班轮。”万海航运股份有...更多>
大国品牌,年轻力量:ANNWA安华正式入选央
1月28日,ANNWA安华与《大国品牌》战略合作授牌仪式在北...更多>
敦煌文化惠民绘就幸福生活新图景
“十四五”以来,敦煌市围绕全民艺术普及、非遗活态传承、文旅深...更多>
金融活水破解“技术信用”密码农行“科捷贷”助
日前,江苏申隆锌业有限公司携多款锌基产品与高端锌基涂料技术解...更多>
锚定高端化与可持续,箭牌瓷砖入选央视《大国品
2026年1月28日,箭牌瓷砖与央视《大国品牌》战略合作授牌...更多>
天猫U先试用:以“试用人生”锚定用户情感共鸣
2026年初,天猫U先试用,以一场完全以用户视角展开的年终总...更多>
中国市场潜力巨大挪威棕色奶酪正式获准入华
挪威农业和食品部国务秘书汉娜-贝里特·布瑞克7日在沪宣布,挪...更多>
天猫U先试用:以“试用人生”重构用户连接,多
在体验经济成为消费主流、用户注意力愈发碎片化的当下,品牌如何...更多>