DiffBrush 模型:支持任意英文文本与 496 种 IAM 数据集手写风格;面向气候科学与 ESG 研究,全球气候与能源转型数据集发布

发布时间:2026/6/26 6:41:09
DiffBrush 模型:支持任意英文文本与 496 种 IAM 数据集手写风格;面向气候科学与 ESG 研究,全球气候与能源转型数据集发布 公共资源速递This Weekly Snapshots 4 个公共数据集* MAKIEVAL 多语言文化知识评估数据集* Verbatim Spans 查询条件证据提取数据集* AI Impact on Jobs and Layoff Risk AI 就业影响数据集* Global Climate Energy Transition 2000-2026 全球气候能源数据集5 个公共教程* DiffBrush手写文本行生成* DVD基于生成先验的确定性视频深度估计* TADA-1b : 带文本-声学双重对齐的文本转语音系统* NuExtract3多模态文档理解与结构化信息抽取模型* AutoFigure基于 LLM 的学术论文插图自动生成系统访问官网立即使用openbayes.com公共数据集1. MAKIEVAL 多语言文化知识评估数据集该数据集包含 7 个大语言模型在 13 种语言、19 个国家/地区、6 个文化领域下生成的文本及其自动抽取的文化实体与 Wikidata 对齐结果。* 在线使用https://go.openbayes.com/IDtQQ2.Verbatim Spans 查询条件证据提取数据集该数据集包含 174,383 行训练数据与 20,174 行验证数据覆盖自然语言处理论文、多领域问答以及代码与工具输出三大类型语料。* 在线使用https://go.openbayes.com/Y8FSn3.AI Impact on Jobs and Layoff Risk AI 就业影响数据集该数据集包含 20,000 条合成员工记录覆盖数据分析师、机器学习工程师、HR、学生等多个行业与职位类别通过个人背景、职业属性、岗位特性以及人工智能使用程度四类变量来预测员工的裁员风险。* 在线使用https://go.openbayes.com/1OrOC4.Global Climate Energy Transition 2000-2026 全球气候能源数据集该数据集是面向气候变化、能源转型与碳减排研究的全球气候与能源转型数据集旨在系统刻画全球气候变化与能源转型过程可广泛应用于气候科学、ESG 研究、能源经济学、碳市场分析、政策评估以及机器学习预测等多个领域。* 在线使用https://go.openbayes.com/jFAAe公共教程1. DiffBrush手写文本行生成DiffBrush 由华南理工大学和新加坡国立大学等机构于 2025 年发布。它利用扩散模型生成逼真的灰度手写文本行图像。该模型创新之处在于利用 Stable Diffusion VAEUNet 架构支持任意英文文本输入包含来自 IAM 数据集的 496 种手写风格输出 1024×64 的灰度图像。* 在线运行https://go.openbayes.com/tl23D项目示例2.DVD基于生成先验的确定性视频深度估计DVDDeterministic Video Depth Estimation是由香港科技大学广州 团队于 2026 年 3 月提出的首个确定性视频深度估计框架通过将预训练的视频扩散模型Wan2.1改造为单次前向传播的深度回归器在保持生成模型强大语义先验的同时彻底消除了随机性带来的几何幻觉问题。* 在线运行https://go.openbayes.com/186ht项目示例3.TADA-1b : 带文本-声学双重对齐的文本转语音系统TADA-1b 是由 HumeAI 团队于 2026 年 2 月发布的统一语音语言模型面向语音合成、语音克隆、多语言配音等场景的音频生成任务。该模型基于 Llama 3.2-1B 底座构建主打轻量化、高速稳定的音频生成能力专门面向英文语音合成、零样本语音克隆、长文本旁白配音、语音续写等音频生成任务。* 在线运行https://go.openbayes.com/9dhX4项目示例4.NuExtract3多模态文档理解与结构化信息抽取模型NuExtract3 由 NuMind 发布于 2026 年 6 月是一个面向文档理解的 4B 参数多模态视觉语言模型。它将结构化信息抽取与文档图像转 Markdown 两类能力统一到同一个模型中可用于扫描件、票据、表单、发票、合同和表格等文档的字段抽取、OCR 后处理、RAG 数据清洗和文档归档。* 在线运行https://go.openbayes.com/M5vIx项目示例5.AutoFigure基于 LLM 的学术论文插图自动生成系统AutoFigure 是西湖大学 ResearAI 团队开发的智能学术插图生成系统。该系统利用大型语言模型通过迭代优化机制从文本描述或研究论文中自动生成达到出版标准的高质量科学插图支持 SVG 矢量图和 mxGraph XML完全兼容 draw.io两种输出格式。* 在线运行https://go.openbayes.com/TqbNj项目示例