dall-e 真是大杀器 https://openai.com/blog/dall-e/。 它用的生成模型是 VQ-VAE-2 :https://arxiv.org/pdf/1906.00446.pdf
2
4
请
登录后发表观点
-
https://github.com/openai/DALL-E 官方代码已出
-
牛逼了,openai发文章不到两个月就有第三方的复现,高手在民间啊!
-
确切的说是算法是 clip 论文链接在这 https://cdn.openai.com/papers/Learning_Transferable_Visual_Models_From_Natural_Language_Supervision.pdf 和gpt-3相似 又参考了vq-vae-2.... 第三方实现 在这里 https://github.com/lucidrains/DALLE-pytorch
-
是GPT-3的120亿参数版本,经过训练,使用文本-图像对的数据集,从文本描述生成图像。