
AI 大模型在自己的平台上部署和运行模型v6.9.0 新增 AI 大模型能力面向企业和团队的大模型私有化部署场景支持把模型部署在自己的集群和资源中并通过 OpenAI 兼容接口接入业务系统。启用 AI 大模型插件后“工作空间”左侧导航会出现“AI 大模型”入口下面包含模型仓库、模型实例、API 密钥和模型监控四个模块。模型准备与部署在“模型仓库”中选择需要部署的模型目前支持“内置模型”平台预置一批常用模型、“ModelScope”从模型社区拉取、“HTTP 地址 / 本地路径 / 文件上传”使用自有模型文件几种来源。模型状态变为“已下载”后进入部署配置。文本大模型默认使用 vLLM 引擎GPU 部署需选择 GPU 型号、数量和目标节点也支持 CPU 部署适合做轻量验证。vLLM 的量化方式、显存利用率、最大上下文长度、额外启动参数等都可以在页面上配置建议首次部署先使用默认配置完成验证。当前 GPU 资源识别和分配以 NVIDIA GPU 为主启用前请确认集群环境。模型实例管理部署完成后进入“模型实例”模块管理已部署的模型实例可查看实例状态、节点分布、运行详情和日志对实例执行启动、停止、删除操作对运行中的实例发起在线对话验证模型响应实例异常时结合运行详情和日志判断是模型加载、启动参数、资源不足还是服务响应方面的问题。API 密钥与 OpenAI 兼容调用在“API 密钥”模块创建密钥页面提供 OpenAI 兼容的接入示例包括 base URL、curl 示例和 Python OpenAI SDK 示例。业务系统在原有 OpenAI 调用链路基础上替换 base URL 和 API key 即可接入。请求中按模型名称调用平台会查找对应的运行中实例。模型监控“模型监控”模块包含“服务层面”在线服务数、健康服务数、运行实例数、请求数、失败数、平均响应时间和“GPU 层面”GPU 总览、节点汇总、设备列表、单卡趋势、实例与设备的占用关系两个层面。虚拟机能力增强本次版本对虚拟机能力进行了一轮增强主要更新包括“qcow2 镜像直接部署”支持将其他虚拟化工具如 VMware、KVM 等导出的 qcow2 镜像直接部署到 Rainbond便于已有虚拟机资产迁移“规格热更新”运行中的虚拟机支持热扩容 CPU 或内存注意 CPU 和内存不能在同一次操作中同时热更新、仅支持扩容不支持缩容GPU 直通和 USB 透传虚拟机暂不支持热更新不满足条件时平台会自动转为重启生效“多虚拟机应用级编排”支持把多个虚拟机和其他组件按应用方式统一编排在拓扑图中查看依赖关系并保留连接信息、端口、存储等应用级配置“整套应用模板交付”编排好的虚拟机应用可以发布成 Rainbond 应用模板连同虚拟机系统数据一起打包导出 rainbond - app 安装包后可在新环境导入恢复发布前需先创建快照并关闭虚拟机携带虚拟机类型的模板快照不支持回滚升级“Windows 驱动盘挂载”在组件存储视图中支持挂载 VirtIO 驱动盘用于解决 Windows 安装阶段识别不到磁盘或网卡的问题“监控与配置统一”组件视图中支持查看虚拟机的 CPU、内存、网络流量、磁盘读写流量与 IOPS、文件系统使用量等指标CPU、内存、磁盘、网络、GPU 直通、USB 透传等运行配置统一在组件视图中管理。当前虚拟机仅支持 amd64 架构arm64 暂不支持。其他变更新增功能新增 AI 大模型私有化部署能力支持模型部署、实例管理、OpenAI 兼容调用和模型与 GPU 监控虚拟机支持 qcow2 镜像直接部署、规格热更新CPU、内存运行态扩容、多虚拟机应用级编排、整套应用模板交付连同系统数据一起打包、Windows VirtIO 驱动盘挂载虚拟机组件视图支持监控指标查看与运行配置统一管理。Bug 修复修复 RainAgent 偶发断联、消息发送失败的问题新增兜底机制和静默重试修复 RainAgent 接口密钥不修改时无法保存其他配置的问题修复 opencode 使用 RainSkills 时 MCP 第二天过期的问题优化 AI 助手更新提示信息优化删除组件、端口、存储等操作的错误提示和引导优化 RainAgent 错误信息的展示与稳定性优化 RainAgent 操作组件时的识别准确率修复 ROI 一些问题修复快照/模板导入导出伸缩规则不生效修复 UI 滚动条问题修复对接 Harbor 无法展示更多的项目修复 dockercompose 在 ARM 环境下无法构建修复 Helm 默认安装无法选择节点。平台升级在线环境平台管理 - 企业设置 - 升级执行一键升级。离线环境请阅读离线升级文档。