欢迎访问 生活随笔!

凯发k8官方网

当前位置: 凯发k8官方网 > 人工智能 > pytorch >内容正文

pytorch

drive数据集-凯发k8官方网

发布时间:2025/1/21 pytorch 43 豆豆
凯发k8官方网 收集整理的这篇文章主要介绍了 drive数据集_英伟达的最强人脸gan开源了,它吃的高清数据集也开源了 小编觉得挺不错的,现在分享给大家,帮大家做个参考.
栗子 假装发自 凹非寺
量子位 出品 | 公众号 qbitai

你大概还没忘记,英伟达去年年底推出的gan,它合成的人脸甚至骗得过肉眼。

如今,它终于有了自己的名字,叫stylegan。顾名思义,gan的生成器,是借用风格迁移的思路重新发明的,能在粗糙、中度、精细三个层面调节图像生成。

更重要的是,你现在也能自己养一只这样的gan了:

官方实现的代码开源了,提供了许多预训练好的模型,自然也支持自己训练模型。

另外,flicker人像照片的高清数据集 (ffhq) 也开源了,包含70,000张高清人脸。

官方实现

首先,送上来自英伟达的友情提示:

这个实现可以用linux跑,也可以用windows跑,但墙裂推荐大家用linux跑,为性能和兼容性着想。

除此之外,必需品还有python 3.6,和tensorflow 1.10以上 (支持gpu) 。

预训练模型

这里,用pretrained_example.py举个简易的栗子。执行的时候,脚本会从google drive下载一个预训练的stylegan生成器,然后用它来生成图像:

1

预训练的生成器有三种食用方法:

一是gs.run()快速模式,这里的输入和输出都是numpy阵列:

1

二是用gs.get_output_for()把生成器整合到一个更大的tensorflow表达式里面:

1

三是查找gs.components.mapping和gs.components.synthesis,访问生成器的各个子网络。与gs相似,这鞋子网络也表示为dnnlib.tflib.network的独立示例。

1

自己训练模型

如果不满足于预训练的模型,想自己训练模型,就要先:

一、处理好数据集

把数据集储存为多重分辨率的tfrecords,训练和评估脚本都是在这上面跑:

1

数据集表示为一个目录,里面的每张图像都有多种不同的分辨率,用于高效的streaming。每个分辨率都有一个自己的*.tfrecords文件。数据有标注的话,也是用一个分开的文件来储存的。

二、训练吧

官方提供的训练过程分四步:

1. 编辑train.py,通过取消注释或者修改某些行,来指定数据集和训练配置;
2. 用train.py来运行训练脚本;
3. 结果会写在一个新目录里,叫results/-;
4. 训练直至完成,几天时间可能是要的。

(最好有一台英伟达高端gpu,至少11gb的dram,再开始训练。有很多台的话,当然更好。)

至于训练好的模型该怎样评估,大家可以去项目页自行观察。

高清无码数据集

和官方代码实现一起发布的,就是flickr高清人脸数据集 (ffhq) 了。

那些几可乱真的人脸,就是stylegan吃了这个数据集,才生成的。

数据集里包含7万张1024 x 1024高清人像。英伟达说,这些照片在年龄、种族、以及图片背景上,都有很强的多样性。

并且,眼镜、墨镜、帽子这些元素,也是应有尽有。

团队说,图像是直接从flickr上面扒下来,自动对齐自动裁剪而成。并且,数据集里收录的图片都有使用许可,无须担心。

还不去试试

有大胆想法的同学们,可以去试试了。毕竟,不是只有生成人脸这一种功能,猫片,汽车,房间……

你还想生成一些什么?

代码实现传送门:https://github.com/nvlabs/stylegan

ffhq数据集传送门:https://github.com/nvlabs/ffhq-dataset

论文传送门:https://arxiv.org/abs/1812.04948

— 完 —

量子位 · qbitai

վ'ᴗ' ի 追踪ai技术和产品新动态

戳右上角「 关注」获取最新资讯↗↗

如果喜欢,请分享or点赞吧~比心❤

总结

以上是凯发k8官方网为你收集整理的drive数据集_英伟达的最强人脸gan开源了,它吃的高清数据集也开源了的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得凯发k8官方网网站内容还不错,欢迎将凯发k8官方网推荐给好友。

  • 上一篇:
  • 下一篇:
网站地图