Gluten内存管理深度剖析：如何实现JVM与原生代码的高效数据共享

发布时间：2026/6/27 20:56:38

Gluten内存管理深度剖析如何实现JVM与原生代码的高效数据共享【免费下载链接】GlutenThis repository is a mirror repository for the integration between the OmniRuntime system and Gluten.项目地址: https://gitcode.com/openeuler/Gluten前往项目官网免费下载https://ar.openeuler.org/ar/Gluten作为openEuler生态中的重要组件其核心价值在于实现JVM与原生代码间的高效数据共享通过创新的内存管理机制突破传统数据处理的性能瓶颈。本文将深入解析Gluten如何通过内存池设计、零拷贝技术和智能分配策略构建JVM与原生代码间的高效数据通道。一、Gluten内存管理的核心挑战与设计理念在大数据处理场景中JVM与原生代码间的数据交换往往成为性能瓶颈。传统方案中数据需要在堆内存与原生内存间频繁拷贝不仅消耗CPU资源还会引发严重的内存碎片化问题。Gluten的设计理念是**控制流在JVM数据流在原生**通过精细化的内存管理实现数据零拷贝传输。Gluten的内存管理架构主要解决三个关键问题如何避免JVM与原生代码间的数据拷贝如何协调JVM垃圾回收与原生内存分配如何在有限内存资源下实现高效的数据处理二、内存池架构VeloxMemoryManager的设计与实现Gluten采用分层内存池架构通过VeloxMemoryManager实现对原生内存的统一管理。该组件位于cpp/velox/memory/VeloxMemoryManager.h核心设计包括class VeloxMemoryManager final : public MemoryManager { public: std::shared_ptrfacebook::velox::memory::MemoryPool getAggregateMemoryPool() const; std::shared_ptrfacebook::velox::memory::MemoryPool getLeafMemoryPool() const; arrow::MemoryPool* getArrowMemoryPool() override; const MemoryUsageStats collectMemoryUsageStats() const override; const int64_t shrink(int64_t size) override; // ... private: std::unique_ptrMemoryAllocator listenableAlloc_; std::unique_ptrAllocationListener listener_; std::unique_ptrarrow::MemoryPool arrowPool_; std::unique_ptrfacebook::velox::memory::MemoryManager veloxMemoryManager_; // ... };这一设计实现了多级内存池的协同工作Arrow内存池负责Arrow格式数据的内存分配Velox内存池管理Velox引擎的计算内存监听式分配器跟踪内存使用情况实现动态调整内存使用监控与动态调整Gluten通过AllocationListener机制实现内存使用的实时监控。当内存使用达到预设阈值时系统会触发shrink操作释放闲置内存确保内存资源的高效利用。这一机制在cpp/velox/memory/VeloxMemoryManager.h中定义通过collectMemoryUsageStats()方法收集内存使用统计信息。三、零拷贝数据共享VeloxColumnarBatch的实现Gluten通过VeloxColumnarBatch实现JVM与原生代码间的零拷贝数据共享该组件位于cpp/velox/memory/VeloxColumnarBatch.h。核心设计如下class VeloxColumnarBatch final : public ColumnarBatch { public: VeloxColumnarBatch(facebook::velox::RowVectorPtr rowVector) : ColumnarBatch(rowVector-childrenSize(), rowVector-size()), rowVector_(rowVector) {} std::shared_ptrArrowSchema exportArrowSchema() override; std::shared_ptrArrowArray exportArrowArray() override; // ... private: facebook::velox::RowVectorPtr rowVector_ nullptr; // ... };通过VeloxColumnarBatchGluten实现了数据格式转换在Velox RowVector与Arrow格式间高效转换零拷贝导出通过exportArrowArray()方法直接暴露原生内存数据给JVM内存安全管理通过智能指针确保内存资源的安全释放四、内存使用分析从统计数据看Gluten的优化效果Gluten提供了详细的内存使用分析工具帮助开发者了解内存分配情况。下图展示了典型查询的内存使用分布从图中可以看出Gluten的内存分配主要集中在StdMemoryAllocator标准内存分配器VeloxMemoryAllocatorVelox专用内存分配器MallocAllocator基础内存分配这一分布表明Gluten成功将大部分内存分配控制在原生代码层减少了JVM堆内存的压力从而避免了频繁的垃圾回收。五、内存优化策略从源码看Gluten的智能管理Gluten实现了多种内存优化策略确保在有限资源下实现高效数据处理。以StreamingAggregatingStep为例位于cpp-ch/local-engine/Operator/StreamingAggregatingStep.cpp当内存使用达到阈值时系统会触发数据溢出spill操作auto memory_soft_limit DB::CurrentThread::getGroup()-memory_tracker.getSoftLimit(); auto max_mem_used static_castsize_t(memory_soft_limit * max_allowed_memory_usage_ratio); if (current_mem_used per_key_memory_usage * current_result_rows max_mem_used) { // 触发数据溢出 LOG_INFO(Memory is overflow. current_mem_used: {}, max_mem_used: {}, ReadableSize(current_mem_used), ReadableSize(max_mem_used)); // ... }这一机制确保单个操作不会耗尽所有内存资源提高了系统的稳定性和并发处理能力。六、总结Gluten内存管理的核心价值Gluten通过创新的内存管理机制成功解决了JVM与原生代码间数据共享的性能瓶颈。其核心优势包括零拷贝数据传输通过VeloxColumnarBatch实现数据在JVM与原生代码间的直接访问精细化内存控制多级内存池架构实现内存资源的高效分配与回收智能溢出策略动态监控内存使用在资源紧张时自动触发数据溢出全面监控工具提供详细的内存使用统计帮助开发者优化内存配置Gluten的内存管理设计为大数据处理提供了高效、稳定的基础特别适合于需要处理海量数据的场景。通过将数据处理逻辑下沉到原生代码层同时保持JVM的控制流优势Gluten实现了性能与灵活性的完美平衡。要深入了解Gluten的内存管理实现建议参考以下源码文件内存池管理cpp/velox/memory/VeloxMemoryManager.h数据共享机制cpp/velox/memory/VeloxColumnarBatch.h内存分配策略cpp-ch/local-engine/Operator/StreamingAggregatingStep.cpp【免费下载链接】GlutenThis repository is a mirror repository for the integration between the OmniRuntime system and Gluten.项目地址: https://gitcode.com/openeuler/Gluten创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

资讯详情

Gluten内存管理深度剖析：如何实现JVM与原生代码的高效数据共享

相关新闻

5分钟上手UBTurbo：从安装到实现首次内存迁移的完整教程

企业AI落地，直连还是上平台？ - 微元算力(weytoken)

witty-diagnosis-agent硬件层诊断全攻略：CPU、内存、磁盘、GPU、NPU故障定位终极指南

外景 基于Unity 3D实现的宝塔 结构 场景

Halcon关于对比度限制自适应直方图（CLAHE）的实现

VSC++缺少MFC界面

AI-SOC重构安全运营体系，将催生五大新型安全运营岗位

Spring AI 概述

如何实现萤石 ERTC 标准开发者服务端？

N_m3u8DL-RE：从零开始掌握流媒体下载的终极指南

139、飞控中的气压计选型：MS5611、BMP280

专业级Iwara视频下载工具深度解析：3大核心特性与架构设计实战指南

ComfyUI ControlNet Aux插件：解决模型下载失败的终极指南

轻量级多模态智能体实战：本地部署Qwen-VL图文理解与报告生成

手撕CNN：从卷积计算到工程落地的全链路解析

外景基于Unity 3D实现的宝塔结构场景