于是我问道:“那如果按照你们公司的数据基础和业务场景,只需要十分之一甚至更少的投入,你愿意做大模型吗?”
如果只关注基础模型厂商和卖“铲子”的英伟达的发布会,会觉得大模型立马就可以将企业用户“带飞”。事实上,很多企业在应用大模型时,还有大量的困惑与难题。
比如以为需要大算力、大投入,要么望而却步,要么盲目囤了很多卡/服务器,却发现基座模型与业务融合的过程漫长且复杂,涉及大量试错、调优等工作,后续训练、推理、部署等环节的算力资源消耗与浪费情况,是容易被忽略的隐藏问题。
这有点像我们要去一个地形复杂、风景优美的陌生城市旅游,提前按照攻略买好了各种机酒门票,但实际行程却总被意外情况拖慢,无法高效地推进,导致很多资源都被浪费掉了。
企业做大模型也是如此。大模型开发,涉及一个相当漫长且复杂的产业链,每个环节对于企业用户来说,都有相对陌生的地方,难以将稀缺昂贵的算力发挥出最大价值。
怎么实现呢?脑极体曾报道过,相比单纯售卖AI服务和API的商业模式,开箱即用的大模型一体机,能够缩短部署周期、深度结合场景、降低落地门槛,是更符合当下国内大模型产业现状的一种选择,解决企业在AI落地过程中的最后一公里问题。
最近,我们关注到潞晨科技也推出了训推一体机,在集成高性能硬件的基础上,还集成了Colossal-AI加速框架,支持多种微调fine-tune方式,帮助企业更轻松地实现AI技术的深度融合和业务创新。
我想,如果开篇中那位CIO更早认识了这款产品,肯定不会因软硬件成本而对大模型望而却步,可以放心大胆地踏上AI创新之旅。
本文就以潞晨训推一体机为例,聊聊一体机如何将远方未知的大模型技术,变成企业身边的AI风景,又如何打磨好“一条龙式”的一站式AI解决方案。
提到互联网,我们会想到电商、直播、手机游戏、社交媒体等丰富多彩的应用,而不是光纤、网关、路由器这些底层设施。但观察今天的企业,提到大模型,第一时间想到的依然是算卡、API、tokens这些词,而不是适配业务的AI应用。尽管企业迫切希望运用大模型来加速业务创新,但在实际操作中却可能面临各种各样的问题。
大模型训练、推理、部署的一系列环节,都是“散装”的,不成体系。企业想用业务数据做专属大模型,得一山一水地跋涉,不仅效率低,还会在选型、适配、兼容、迭代等各个阶段反复折腾,走很多弯路,吃不少闷亏。
举个例子,今天,高端AI算力依然是中小微企业难以搞定的珍稀资源,好不容易搞来了算卡,一个模型在TensorFlowPyTorch上跑一次好几天,验证一次好几天,发现问题迭代调试,流程再来一遍,眼看着友商已经用上了AI,只能干着急。这种进度,显然是追求竞争效率和创新速度的企业所难以接受的。
所以目前这个阶段,大量企业都不希望“散装”乱折腾,大模型致用,需要一条龙解决方案,即软硬件紧耦合的大模型一体机。
目前,有许多国内头部AI厂商和ICT服务商都推出大模型一体机。为什么我们会关注到潞晨科技的训推一体机呢?
做大模型,跟旅游一样,最扫兴的情况就是目的地还没到,队友已经走不动了。大模型训练中,因硬件性能不足、联接故障而中断,会带来时间成本和机会成本的损失。
目前,NVIDIA GPU是AI芯片 “一哥”,在AI训练领域一家独大,几乎无敌手。潞晨训推一体机,采用英伟达H20作为底层硬件,每台一体机配有8张H20卡,每卡有高达96GB的显存,在单台设备上即可完成 32B Qwen1.5 模型的全参数微调,更可支持单卡 34B Yi1.5模型的推理。
H20采用Hopper架构,卡间互联速度达到了惊人的900GB/s,整机配备4个400GB/s的IB网口,无论是多卡互联还是多机互联,都有极高的效率。这对于需要大规模并行计算和协同工作的AI任务尤为重要,可以减少等待时间,提高开发效率。
与硬件适配度更高的框架,协同更高效,可以带来更高的训练推理效率。比如,潞晨科技就为这套硬件量身定做了极致优化的训推加速方案。使用Colossal-AI优化,在8卡规模下的上机实测中,平均每卡算力相较原生速度提升21%,大幅度提高效率。微调Qwen 7B的大模型,仅需半天,即可完成1B数据的学习与迭代。
企业可以减少人力和物力的投入,“轻装上阵”踏上业务创新之旅,探索代表未来的智能世界。
算力作为动力,而模型算法才是业务价值和竞争力的创造者。企业探索AI,既要选择先进的基础模型,来确保高效、准确的预测和决策能力,又要将模型与业务深度结合,确保开发出来的AI产品能够满足业务逻辑和需求,为企业带来真正的商业价值。
,例如LLaMA3、Mixtral、Qwen等,方便企业用户调用,快速体验到不同开源模型的能力。同时,借助潞晨训推框架的优化,上述模型在一体机上的训练推理效率,会比原生硬件更高。
潞晨训推一体机搭载的训推软件Colossal LLM Studio,配备了直观易用的UI界面,让非技术背景的用户也能轻松操作,通过低代码、可视化的方式进行模型训练微调,企业不再需要付费外包,一个软件就相当于一支大模型训练团队。
通过潞晨训推一体机,企业用户用到潞晨科技推出的Colossal Reader,一款专为提升文档理解效率而设计的AI智能助手。一方面,经过精细调整和优化的 RAG 流程,具备长文本能力,支持深度解析复杂文档,如财务报表和法律文件,帮助用户迅速掌握关键信息,实现高效办公。同时,基于一体机的私有化部署既保证了长期使用的稳定,又保障了企业内部文档等的数据安全。
Sora开启了文生视频的新阶段,展现出AIGC在影视制作、游戏开发和广告创意等方面的诸多可能。企业想在业务中引入类Sora能力,
潞晨科技团队倾力打造的文生视频大模型Open-Sora,自3月19日登上GitHub Trending榜,受到大量开发者关注,星数持续增长,热度仅次于Grok-1。其中LambdaLabs团队基于Open-Sora模型进行微调打造了一个具有独特艺术风格的乐高动画世界,展现了潞晨科技的技术领先性和实力。而这一优秀模型,潞晨训推一体机的用户可以直接在本地部署,基于高配硬件,结合企业的应用场景,将文生视频能力落地在自身业务中。
从模型层、平台层、应用层,潞晨训推一体机完整的AI软件体系支持,让企业不必有“FOMO(害怕错过)情绪”,快速上手大模型及应用。简单易用的软件风景,为企业探索大模型营造了难得的松弛感。
有人会问,数据预处理、特征工程、模型训练、部署与监控等一系列复杂的工程化任务,带来了大量挑战,企业是不是要构建一支既懂技术又懂业务的团队?如果吸引不到这样的人才怎么办?
让企业聚焦在业务创新上,需要相应的运维服务及售后服务,免除客户的后顾之忧。
我们知道,任何一个产业和企业都有自己的独特性,即使拥有强大的通用性AI软硬件,也容易施展不开手脚。让大模型与行业特征、企业周期、业务场景相结合,是最难的一道关卡,也是潞晨科技希望通过服务加持助力企业消除与技术的隔阂。
独行快、众行远,去陌生的技术领域探索未知的景色,这个过程中,企业和潞晨科技的携手,让AI风景可以长长久久地绵延下去。
算力不折腾,简单用,放心用,轻松用,潞晨训推一体机改变了大模型开发的“散装”流程,用“训推一条龙”,推动大模型深入企业业务,加速落地。
企业能够在一个平台上完成从模型训练到部署的全过程,无需在多个系统或工具之间切换,大大提高了工作效率。
大模型,可以看做企业智能的“消费升级”,有望带来更高的智慧水平。训推一体机,提高算效,让大模型变得物美价廉。总体来看,企业智能的质价比正在提高,成为新的竞争力。
训推一体机降低了大模型应用门槛,意味着更多行业和企业,尤其是缺乏自建智算中心能力的中小企业和传统行业,可以在低门槛、轻成本的前提下,快速进入智能阶段,提高AI的渗透率和广覆盖。
作为企业智能的“一条龙导游”,潞晨训推一体机,让大模型从大厂实验室和论坛峰会的神坛中走下来,进入企业触手可及的范围之内,变成水、电、网络一样的必需品和常规消费品。
撬动企业智能的庞大市场,潞晨训推一体机正在兑现大模型的真正利好。欲知详情,可移步潞晨科技公众号。