在 3D 内容创作中,传统建模流程往往耗时且技术门槛高。设计师需要掌握复杂的建模软件,才能从概念草图或参考图片中构建出可用的三维模型。而 Trellis 的出现,为这一难题带来了全新的解决思路。作为微软推出的开源项目,Trellis 利用先进的 AI 模型结构,将普通的图片或文本提示转化为高质量 3D 模型,显著降低了三维创作的门槛,让更多人能够轻松进入虚拟空间创作领域。
Trellis 是什么?
Trellis 是微软开源发布的一款图片到 3D 模型生成模型(Image-to-3D Generation Model)。该模型以统一的结构化潜在表示(SLAT, Structured Latent Representation)为核心,通过整流流变换器(Rectified Flow Transformer)实现多模态输入与 3D 输出的高效映射。
Trellis 能够根据用户输入的图像或文字描述,自动生成高保真、细节丰富的三维模型,并支持多种输出格式(如辐射场、3D 高斯表示与网格模型)。在预训练阶段,Trellis 使用了规模达 20 亿参数的模型架构,展现出优异的几何结构还原与纹理细节生成能力。
网站地址:https://microsoft.github.io/TRELLIS
核心功能
Trellis 的设计理念是“让 AI 生成的 3D 模型具备真实感与可编辑性”。它面向 3D 艺术家、游戏开发者、XR 创作者以及科研人员,为他们提供一个自动化的高质量 3D 建模解决方案。
主要功能包括:
- 图片到 3D 生成—— 从单张图像快速生成高保真三维模型,适用于参考建模与概念设计。
 - 文本到 3D 生成—— 输入自然语言提示(prompt),即可生成符合语义描述的 3D 资产。
 - 多格式输出—— 支持导出辐射场(NeRF)、3D 高斯点云及传统网格(Mesh)格式,便于在不同引擎中使用。
 - 几何与纹理重建—— 同时生成细腻的几何结构与表面纹理,实现逼真的空间细节。
 - 本地编辑支持—— 生成模型可直接导入本地 3D 编辑软件进行修改与渲染。
 - 开源架构—— 完全开源,开发者可查看源代码、复现训练流程或扩展新功能。
 - 高兼容性—— 输出结果可直接应用于 Unreal Engine、Unity、Blender 等主流工具。
 - 灵活控制—— 用户可在生成前调整分辨率、输出格式与风格细节,实现定制化创作。
 
使用场景
Trellis 不仅面向专业 3D 设计师,也为独立开发者和 AI 创作者提供了强大的支持。以下列举典型应用场景及推荐指数:
| 人群/角色 | 场景描述 | 推荐指数 | 
|---|---|---|
| 3D 艺术家 | 根据参考图片生成概念模型,辅助创作 | ★★★★★ | 
| 游戏开发者 | 批量生成游戏资产与道具模型 | ★★★★☆ | 
| XR/AR 设计师 | 构建虚拟场景中的物体模型 | ★★★★☆ | 
| AI 创作研究者 | 研究图像-3D 表征与生成算法 | ★★★★★ | 
| 教育/科研人员 | 用于教学与 3D 建模自动化实验 | ★★★★☆ | 
操作指南
Trellis 的安装与使用对于有基础的开发者来说较为直接,整个流程通常可在几分钟内完成。以下为快速上手步骤:
- 前往 GitHub 仓库下载项目源码。
 - 使用「git clone」命令克隆代码,并进入目录。
 - 安装依赖库(如 PyTorch、Transformers、Open3D 等)。
 - 准备输入数据——上传图片或输入文本提示。
 - 运行主生成脚本「generate_3d.py」,指定参数(输入类型与输出格式)。
 - 等待模型生成,输出文件将保存为 .ply、.obj 或 .glb 格式。
 - 在「Blender」或「Unity」中导入模型进行查看与渲染。
 - (注意)建议使用支持 CUDA 的 GPU 环境以加速生成过程。
 
支持平台
Trellis 基于 Python 与 PyTorch 框架开发,可在 Windows、macOS 与 Linux 平台运行。
模型兼容 CUDA 与 DirectML 环境,能够在 NVIDIA GPU 上实现显著的性能提升。由于项目完全开源,用户还可在云端部署(如 Azure、Google Colab、Lambda Labs)进行快速实验。生成的 3D 模型可无缝导入 Unity、Unreal Engine、Blender 等主流引擎进行后期加工。
产品定价
Trellis 是 完全免费 的开源项目,由微软研究院维护。用户可直接访问其 GitHub 仓库下载模型权重与代码,无需任何授权费用或 API 订阅。
对于需要大规模应用的企业或团队,可基于 Trellis 框架进行二次开发,模型的训练与推理代码均开放使用。
常见问题
Q1:Trellis 生成的 3D 模型精度如何?
Trellis 在几何重建与纹理生成方面表现优异,尤其在细节和深度感上优于许多公开模型,但结果仍依赖输入图像质量与提示文本的精确度。
Q2:是否可以在无 GPU 的环境运行?
理论上可以在 CPU 环境运行,但生成速度会明显变慢,建议使用配备 CUDA 的显卡进行推理。
Q3:支持哪些输出格式?
当前版本支持辐射场(.radiance)、3D 高斯点云(.gaussian)以及网格格式(.obj/.glb),适合不同渲染管线。
Q4:能否在商业项目中使用?
Trellis 以开源许可发布,可在遵守相关许可证条款(MIT License 或 Apache 2.0)的前提下用于商业项目。
Q5:是否支持多视图输入?
未来版本计划增加多视图融合能力,目前主要支持单图像输入。
跳跳兔小结
Trellis 的推出让 3D 内容创作变得更智能、更高效。它整合了最新的生成式 AI 技术,既能从图像中捕捉空间结构,也能从文本中生成富有创意的三维对象。对于游戏开发者、数字艺术家和科研人员而言,Trellis 不仅是一个工具,更是探索图像与三维世界连接方式的新范式。
不过,目前版本仍主要面向具备一定技术背景的用户,普通设计师若无深度学习经验,可能需要依赖社区提供的图形界面或 Colab 模板使用。整体而言,Trellis 是一个兼具研究价值与实用潜力的 3D 生成模型,为未来的视觉内容创作打开了更多可能。
                
                
                
                