来源:南开大学 发布时间:2024/3/28 21:19:30 选择字号: 小 中 大 . . 让Sora提速10多倍,南开团队开源MDTv2 . . ? 南开新闻网讯(记者?高雨桐)2024年伊始,Open?AI(美国开放人工智能研究中心)公司发布首个AI(人工智能)文字生成视频大模型Sora,通过计算机视觉技术模拟现实世界的动态变化,可以一次生成60秒流畅逼真的视频,被视为继ChatGPT之后人工智能技术的又一重大突破。但从实测Sora的一些“翻车”视频中可以看出,AI仍然存在着无法快速、准确“理解”物理世界的困难。 近日,南开大学、南开国际先进研究院(深圳福田)教授程明明团队一项国际联合研究成果MDT(Masked?Diffusion?Transformer),相比Sora核心组件DiT(Difffusion?Transfomer)训练速度提升10倍以上,再次刷新SoTA(最佳)图像生成质量和学习速度,实现了ImageNet?benchmark(大型图像分类数据集性能...