科技巨头过去常常发表论文以增强其行业影响力,但现在他们不再公开技术细节。
在我看来,AI 3D 最终的杀手尚未到来,那就是文生视频技术。
当今 AI 产品有许多的局限性:幻觉,过时的信息,领域知识的缺乏,机密数据的处理等等。 这一年来,有一个技术在硅谷引起了越来越多的关注。
训练的过程更像在丛林里寻宝,指南针是顶尖的人才,算力是铲子,要从一条一条的分岔路中不断试错和纠正,找到算法和数据的最优组合。
如果输入的 3D 模型形状是对称的,那么生成纹理的纹理也得对称。这些用非 AI 可以很容易完成的操作,生成式 AI 却束手无策。
近年来,ViT 似乎成为主流视觉架构的模型,不过 UNet 仍然在 diffusion 模型领域占据主导地位。
回到顶端