openai发布point-凯发k8国际版官网

新闻 2022-12-21 15:37:59 阅读(...)

是 elon musk 创立的人工智能初创公司,支持流行的 文本到图像生成器,周二宣布发布其最新的图片制作机器 point-e,它可以直接从文本提示生成 3d 点云。现有系统(如 google 的 dreamfusion)通常需要数小时和 gpu 来生成图像,而 只需要一个 gpu 和一两分钟。

abstract smokey wave vector background. nano dynamic flow with 3d particles

3d 建模用于各种行业和应用程序。现代电影大片、视频游戏、vr 和 ar 的 cgi 效果、nasa 的月球陨石坑测绘任务、google 的遗址保护项目以及 meta 的 metaverse 愿景都取决于 3d 建模功能。然而,创建逼真的 3d 图像仍然是一个耗费资源和时间的过程,尽管 nvidia 致力于自动化对象生成和 epic game 的 realitycapture 移动应用程序,它允许任何拥有 ios 手机的人将现实世界的对象扫描为 3d 图像。

文本到图像系统,如 openai 的 dall-e 2 和 craiyon、deepai、prisma lab 的 lensa 或 huggingface 的 stable diffusion,近年来迅速流行、臭名昭著和声名狼藉。text-to-3d 是该研究的一个分支。与类似系统不同,point-e“利用大量(文本、图像)对语料库,使其能够遵循多样化和复杂的提示,而我们的图像到 3d 模型是在较小的(图像、3d)数据集上训练的对,”由 alex nichol 领导的 openai 研究团队在 point·e 中写道:从复杂提示生成 3d 点云的系统, 上周发布。“为了根据文本提示生成 3d 对象,我们首先使用文本到图像模型对图像进行采样,然后根据采样图像对 3d 对象进行采样。这两个步骤都可以在几秒钟内完成,并且不需要昂贵的优化程序。”

如果您要输入文本提示,比如“一只猫在吃墨西哥卷饼”,point-e 将首先生成该吃墨西哥卷饼的猫的合成视图 3d 渲染。然后,它将通过一系列扩散模型运行生成的图像,以创建初始图像的 3d、rgb 点云——首先生成粗略的 1,024 点云模型,然后生成更精细的 4,096 点云模型。“在实践中,我们假设图像包含来自文本的相关信息,并且没有明确地限制文本上的点云,”研究团队指出。

这些扩散模型分别在“数百万”个 3d 模型上进行训练,所有模型都转换为标准化格式。“虽然我们的方法在这种评估中的表现比最先进的技术差,”该团队承认,“它在一小部分时间内产生了样本。” 如果您想亲自尝试一下,openai 已在 github 上发布了该项目的开源代码。

0个人收藏 收藏

评论交流

请「」后参与评论
  1. 加载中..

相关推荐

  • 3d建模是生成任何对象或图像的三维 (3d) 数字表示的过程。3d建模改变了人们看待产品设计项目的方式。3d建模使人们对最终产品的视觉感知有所增强。
    qa
  • obj是一种3d格式的文件,可以直接用写字板打开进行查看和编辑修改,obj文件是wavefront公司为它的一套基于工作站的3d建模和动画软件"advanced visualizer"开发的一种文件格式,这种格式同样也以通过maya读写。
  • 通过3d深感摄像头,在手机上多用于人脸识别和体感控制。通过3d深感摄像头,手机可以为用户进行人脸3d建模,并以此作为数据秘钥来实现安全验证,通过3d建模,手机能够在拍照、体验游戏时捕捉用户动态信息,以此实现各种拍照、游戏交互。
  • sketchup是一套面向建筑师、城市规划专家、制片人、游戏开发者以及相关专业人员的3d建模程序。比其他三维cad程序更直观,灵活以及易于使用。 基于便于使用的理念,它拥有一个非常简单的界面。
  • 3d打印软件提供从建模到雕刻到定制的许多不同功能,从建模到渲染,再到用户概念和展示。常用的软件有:3d slash、tinkercad、freecad、sketchup;netfabb、repetier等。
  • 3d打印的程序本质上是2d(二维)打印,只不过需要在2d打印的基础上一遍又一遍地打印、一层又一层地叠加,直至一件3d产品最终成型。而采用3d打印需要先进行建模和切片,最后传送给3d打印机完成打印工作。
网站地图