5分钟用GANs生成CryptoPunks风格图像
2021年,NFT数字艺术品和数字藏品迅速出圈,在这场浪潮中,2017年成立的“加密朋克”(CryptoPunks)项目因其收藏者的知名度和不断刷新的成交价,升值成为最具价值的收藏品之一,更成为了先锋投资者和艺术收藏者身份的象征。
多个NFT数字艺术品项目的成功,也将AI生成数字艺术品推至台前。在这场“出圈浪潮”中,很多艺术家选择用AI技术作为图像创造的工具,最终再将艺术品铸造为NFT,使用AI技术进行NFT数字艺术品创作的可能性被充分发掘。与艺术生成有关的AL/ML工作专注于艺术风格的创造,很多团队和个人也关注到艺术品,通过生成对抗网络(GANs)“批量”生成特定风格的作品。
最近有一个名为“CryptoPunks GAN”的项目发布在Github上,用于生成 CryptoPunks 的简单 SN-GAN,项目地址: https://github.com/teddykoker/cryptopunks-gan 。这个项目用Python完成,我们通过矩池云 www.matpool.com 对其进行了复现。矩池云提供面向元宇宙的解决方案,创作者可以使用平台轻松训练和部署其AI模型,加速元宇宙中的如NLP虚拟人、图像内容生成等环节的过程。本次用机器学习生成CryptoPunks项目的复现,上手过程非常简单,不需要任何安装和调试,打开界面就能在云端就感受到生成艺术的创作过程。
一、分析项目依赖,租用机器
1.1 分析项目依赖环境
首先通过开源项目的requirements.txt文件,我们知道该项目主要需要Pytorch1.10.2和CUDA11.3环境,另外还需要pandas、Pillow等第三方包,如果将其在本地安装我们还是需要花一定的时间的,不过我们不需要这些复杂的步骤。
我们进入 矩池云 ,如果你还没有注册过账号,可以先注册一个账号,新注册用户关注并绑定 矩池云 微信公众号可获赠5元体验金,体验金在租用机器时直接抵扣(等会就可以用)。
1.2 在矩池云租用合适的机器
在矩池云的主机市场,我们可以选择需要使用到的机器,这里我们就选最便宜的NVIDIA Tesla K80(经过测试,可以使用代码模型和训练)。
点击租用按钮后,我们可以对机器进行配置:
- 1 选择基础镜像,我们直接搜索 Pytorch1.10
- 2 发现有相关镜像,并且其他依赖如CUDA11.3也符合要求,点击选择即可
- 3 选择好镜像后,我们可以进行其他配置,如:VNC功能开启、公钥设置、高级选项中的自定义端口等(首次尝试也可以先忽略这些功能)
设置好机器基本环境,我们点击下单即可。(如上所述,如果你是新用户,绑定 矩池云 微信公众号后获得的体验金可以在释放机器时直接抵扣费用)
二、下载代码、数据及模型
租用好机器后,我们选择最简单的使用方法,直接点击租用界面的JupyterLab连接,即可快速使用服务器。
进入JupyterLab页面后,我们先点击
Terminal
进入终端,并输入下面指令。
cd /mnt
mkdir MyCode && cd MyCode
git clone https://hub.fastgit.xyz/teddykoker/cryptopunks-gan.git
我们只需把上方代码复制粘贴即可,当出现 Checking out files: 100% 即代表下载开源项目CryptoPunks-GAN项目成功,可以进入到下一步。
我们可以了解一下刚才输入这段代码的含义,它代表着
-
先进入
/mnt
目录(矩池云网盘挂载目录) -
新建一个文件夹
MyCode
并进入文件夹(用于存放项目文件) -
git clone下载开源项目
cryptopunks-gan
三、使用模型和训练
3.1 使用预训练模型测试
我们进入到
cryptopunks-gan
项目目录。具体方式为,找到名为 mnt 的文件夹
进入到MyCode,再进入到cryptopunks-gan
然后点击左上角
+
新建一个Launcher,点击Notebook中的
myconda
。即可新建一个jupyter notebook文件。
我们可以先使用预训练好的模型来测试使用,测试使用代码官方已经给我们提供好了。
可以直接复制以下所有代码,或者像我一样一段一段运行
import torch
from torchvision.utils import save_image
from train import Generator
model = Generator()
model.load_state_dict(torch.load("models/net_g_epoch_999.pth"))
z = torch.randn(64, 100, 1, 1)
punks = model(z)
save_image(punks, "punks.png", normalize=True)
运行按钮如下
运行成功后会在项目目录下生成一个
punks.png
文件。
我们可以直接点击查看预训练结果
3.2 训练模型
按照教程,除了使用预训练模型,我们还可以对模型进行训练,训练代码在项目目录的
train.py
文件中。
我们重新回到JupyterLab的Terminal中
输入下面指令(首先进入项目目录,然后运行train.py):
cd /mnt/MyCode/cryptopunks-gan
python train.py
这个过程比较漫长,预计1个小时左右,训练完成后默认会在项目目录中生成一个
out
目录,里面会存放训练好的权重文件和样本图片文件。最终完成训练的图片是序号最大的那张,在这个案例中即编号为999的文件。
此时回到“我的网盘”,即可看到 out 文件夹,刚才的训练过程和结果图片都在其中。
在训练使用过程中你还可以查看机器监控,看机器的GPU、内存等使用情况。
3.3 释放机器
当你的代码都跑完,不需要使用机器时,可以选择释放机器。
在机器租用页面,你可以看到
释放机器
按钮,在
更多
按钮中你还可以看到
保存环境
功能。
如果你在基础环境中还安装了一些其他包,并且想在下次使用的时候想继续使用,你可以选择保存环境,保存的环境会存放在你的网盘中。
如果不需要保存环境,直接点击
释放机器
即可。
以下一部分为epoch训练后生成的图片:
训练最终的完成图如下
四、关于GANs
Ian Goodfellow等人在2014年的一篇论文中首次提出生成对抗网络(GANs),它的实现方式是通过同时使用生成模型和判别模型,两个模型相互竞争,从而训练出图片。这一过程可以这样简单解释,生成模型的作用类似于一个人不断地创造假的《蒙娜丽莎》,他要在创造过程中不断提升其和真画的相似度,判别模型则类似于鉴别师,他负责鉴别和确认假画。两个人相互竞争,双方提升各自的创造方法和鉴别方法,直到假画达到与真画难以区分的程度。
在CrypoPunks GAN项目中所用到的算法是SN-GAN,即Spectral Normalization for Generative Adversarial Network,训练过程更稳定,更容易收敛,文献内容可参考 https://arxiv.org/abs/1802.05957 。
五大催化剂,以太坊今年将迎翻身?
以太坊今年饱受质疑之苦,生态乏力,相较于上周期的 DeFi 与 NFT 繁荣,本轮创新则表现平平,综合反应则体现在了币价,那么 2025 年将会是以太坊的翻身之年吗?
一位Web3创业者的年终总结和新年展望:从草莽到普世、从混沌到秩序、从萧条到泡沫、从保守到变革
作者:@Web3_Mario摘要:非常感谢大家这一年来的支持,抱歉笔者的年终总结来的晚了一些,处理事情耽搁了时间,当然也想了很久应该从哪些角度来为大家梳理这一年来的感悟,最后觉得还是以一个还在一线奋...
Solv Protocol Drama:解析 BTCFi 2025 年第一场重大争议
2025年初,围绕SolvProtocol的争议爆发,因用户指控未兑现回报,事件升级后引发了对透明度的广泛讨论,特别是关于TVL和链上数据的真实性。