百度智能云一见视觉大模型平台全新升级！

百度智能云一见视觉大模型平台全新升级！

2024-12-26 02:52

过去，95%的视觉类需求没有被满足，随着大模型时代的到来，技术的突破引发了需求的激增，基于视觉智能的管理数字化将迎来爆点。9月26日，在2024百度云智大会上，百度智能云一见视觉大模型平台v4.5重磅发布，让专业级视觉AI应用落地平民化！

百度智能云一见视觉大模型平台是百度智能云在工业行业深耕了七年的拳头产品，这款产品的使命是“让专业级视觉AI应用落地平民化”。过去在工业视觉领域做小模型时，想要把小模型做到专业级水准，投入是非常大的，需要专业算法工程师设计算法方案，大量时间获取数据，并做大量的标注，通过多轮迭代，直到具备适应现场的泛化能力。比如在PCB质检场景要做到1‱的漏检，在人员跳河安全监测场景要做到没有漏报并能跟救援系统联动。由于这类专业级视觉模型的生产成本过高，大部分场景ROI算不过来，导致95%的视觉类需求没有被真正满足。

大模型时代这个局面正在发生根本性改变，视觉智能领域正在迎来ChatGPT时刻，以下面三个场景为例：

安全生产场景，例如矿山行业从无监控不作业，到视频AI反三违，实现安全管理数字化；餐饮连锁门店，例如海底捞通过无死角的视频AI分析，对全国1300家门店的员工服务规范进行打分，从而形成对所有门店经理的量化排名与考核；工厂车间，例如仁宝集团的装配产线，通过视频AI分析，判断员工是否按SOP要求完成每一道工序。这些需求现在都可以基于百度智能云一见视觉大模型平台快速满足，正因为视觉大模型泛化能力的突破，过去小模型时代没有被激活的95%碎片化需求，正迎来一个爆点。

大模型时代，基于视觉的管理数字化即将到来，未来的大型集团企业一定会建设自己的视觉智能基座，这个基座应该如何建设呢？这里有一个巨大的误区是上来就建设专属大模型（L1），不仅在算力、数据获取和标注成本上投入巨大，且效果未必好，更何况现在的视觉大模型和多模态大模型还没进入『智商稳定』的阶段。合理的路径是先基于通用大模型（L0）找到合适场景，把业务闭环和数据飞轮构建起来，基于L0微调出一个场景增强大模型（L2），来验证业务价值是不是能达到，同时把场景化的数据沉淀到平台中。

同时，这么做能否带来企业效益的提升和成本的降低。当模型智能化提升，再基于行业知识进行蒸馏和裁剪，训练出效价比10倍提升的L1。在这种模式下，第一阶段的投入成本不到原来直接上L1的1/3，第二阶段L1的规模化应用的成本也降低到原来的1/10。这正是百度智能云一见视觉大模型平台过去反复实践，探索出的一条经济可行路径。

总结一下，视觉大模型/多模态大模型在集团企业落地的合理路径，可分成两个阶段，第一个阶段试点建设，基于L0微调一个L2，把数据飞轮跑通，把整套的业务闭环构建起来，数据沉淀到平台；第二个阶段把账算清楚了，训练高效价比的专属L1大模型，再做规模化应用。

自2017年在第一届百度云智大会上携手首钢发布首个工业质检案例以来，百度智能云一见视觉大模型平台持续深耕视觉智能，探索与工业应用的融合，并不断拓展至安全生产等多个关键领域，积累了丰富的行业案例与经验。从小模型时代的标准算子沉淀、MLOps工具链，到大模型时代的云边复判，多模态大模型冷启动，大模型样本数据挖掘和智能标注，逐步实现模型生产和端到端应用效果调优的自动化，一步步成长为大模型时代的CV aPaaS平台，aPaaS的起点是a，也就是有厚度的应用闭环。

当前，百度智能云一见视觉大模型平台在多模态大模型领域取得了重大进展，并推出了全新的百度智能云一见视觉大模型平台v4.5。

百度智能云一见视觉大模型平台具备7大核心优势：

优势一：

多模态大模型对模型生产边际成本的显著降低

以矿山行业为例，矿区内，驾驶员出车前需按照“一分钟安全确认”要求，检查车辆的制动系统、发动机，转向系统、灯光、轮胎等主要部件，严禁车辆带病作业，像这些一系列的检查，如果过去要做小模型，高级别的算法工程师也需要55人天，才能做出落地可用的生产级的效果。但是用了多模态大模型以后，大概两天就能达标。

优势二：

端到端视觉AI应用效果调优自动化

从平台产生预警，集控中心人员做预警处置，处置以后这些数据自动回流到平台，再通过图像挖掘检索出大量疑似样本数据，然后用大模型做智能标注，再用平台内置的场景化产线去做训练完成效果调优，最后一键更新AI技能，并在对应绑定的摄像头设备上生效，全流程在百度智能云一见视觉大模型平台里面一站式完成，这就是端到端视觉AI效果调优自动化。

优势三：

零代码AI技能编排，灵活适配现场需求

过去用通用的机器学习平台去做视觉模型，通常遇到的问题是生产出来的模型跟业务往往是脱节的。比如安全管理场景有安全操作规程，工厂的工序识别有工艺流程，那么如何让AI模型与业务场景及流程有效的结合呢？这些都可以通过百度智能云一见视觉大模型平台内置的技能编排去零代码实现，非技术能力通过拖拉拽即可满足现场的管理需求。

优势四：

丰富的行业模型库和算法产线，支持第三方模型纳管和迭代

百度智能云一见视觉大模型平台汇集了百度智能云深耕行业过程中积累的大量模型、算子及场景化模型产线，在不具备专业级算法工程师的情况下，基于百度智能云一见视觉大模型平台也能训练出来和百度原厂效果一样的视觉模型，第三方供应商生产的模型只需按照百度智能云一见视觉大模型平台的标准把产线内置进来，就能够具备模型调优的能力。

优势五：

云边协同、统一管控，拥有大量央国企最佳实践

当前很多央国企都在做集控平台，实现本部统一管控，各个场站侧进行边缘推理和分析。那如何让数据有效的回流到本部去调优模型，且一次调优各个场站都能复用呢？通过百度智能云一见视觉大模型平台云边架构，资产数据包括模型都能够沉淀到本部统一管理，而且支持海量并发，这些能力都是过去百度智能云一见视觉大模型平台通过大量的标杆客户实践打磨出来的。例如在龙源电力，接入5万多路视频监控，涉及到250多个风电场的实时AI分析与统一管控。

优势六：

软硬一体、高效价比

通过与度目硬件融合，百度智能云一见视觉大模型平台发布了视频AI一体机、AI盒子、AI相机等软硬一体产品，支持灵活部署，做了大量的全栈性能优化。

优势七：

智能助手——度安安

度安安能够结合AI识别结果和行业知识进行分析研判，给出处置建议，从智能识别到辅助决策。

一见+伙伴，长期陪伴，共同成长

我们诚挚欢迎在矿山、电力、油气、化工、水务、钢铁、连锁等重点行业的合作伙伴，与百度智能云一起共建长期共赢的合作模式。百度智能云一见将为伙伴提供一对一的深度赋能和长期陪伴，与伙伴相互成就、共同成长！

技术进步的真正意义在于普惠大众，百度智能云一见视觉大模型平台自诞生之日起，便承载着“让专业级视觉AI应用落地平民化”的崇高使命。作为这一伟大征程的坚定践行者，百度智能云一见视觉大模型平台将以不屈不挠的决心和矢志不渝的信念，继续深耕细作，不断突破技术壁垒，为更广泛的行业客户与合作伙伴带来前所未有的便捷与高效，让每一个梦想照进现实，让每一份创新惠及社会！

百度沈抖：产业活力，智能跃迁