多模态代码运行踩坑
在跑GitHub上MISA代码的时候遇到了不少问题。这里记录一下踩过的坑。
python虚拟环境问题
在跑别人的代码的时候,环境中的包的版本一定要严格一致,不然就会出现各种各样奇怪的bug。。。
最开始按照READEME.md中的教程安装python包的时候,因为出了问题,最后有几个包没装上,后来就直接用pip install安装了,没有确定版本,结果代码就直接跑不出来。
1 | RuntimeError:'lengths' argument should be a 1D CPU int64 tensor, but got 1D cuda:0 Long tensor |
爆内存问题解决
主要问题应该是模型太大,需要加载的东西太多,所以最后炸了。
1 | RuntimeError: CUDA out of memory. Tried to allocate 32.00 MiB (GPU 0; 10.76 GiB total capacity; 7.91 GiB already allocated; 45.12 MiB free; 1020.08 MiB cached) |
解决方法就是减小训练的batchsize。
评论
