热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CVPR之老照片修复

  周末闲来无事,随手整理电脑里的照片,望着一张物是人非的老相片,勾起了斑驳的回忆。忽尔转念一想,何不PS下,但PhotoShop有些大且不免费自己懒得装,于是,转向免费的图像复原

    周末闲来无事,随手整理电脑里的照片,望着一张物是人非的老相片,勾起了斑驳的回忆。忽尔转念一想,何不 PS 下,但 PhotoShop 有些大且不免费自己懒得装,于是,转向免费的图像复原软件。

    网上搜来找去,却一直没寻到合适的,最后查到 CVPR 2020 的一篇 Oral 论文,看到有的博客已经详细介绍过了,恰好作者也开放了源码,于是,一时兴起,拍脑门决定,就拿这个来复原老相片吧。

    结果,忙活了半个晚上 (主要是用手机热点,时间浪费在了下载速度上) 加一个上午 (踩了很多第三方库安装、python 向低版本重装的坑),终于成功复原图像,遂写下此博文,以免后来者重复踩坑 ... ...

 


1  CVPR 会议

    CVPR 全称 IEEE Conference on Computer Vsion and Pattern Recongniton,是计算机视觉的三大顶会之一 (另两个是 ICCV 和 ECCV),由 IEEE 每年举办一次

    2021年,按照 Google Scholar Metrics 排名,CVPR 已经挤掉了《柳叶刀》,成为全球影响力排名第四的顶级期刊会议,排在前面的有 《Nature》和《Science》

     

 


 2  Oral 论文

    2020年的 CVPR 会议中,有效投稿 6656 篇论文,1470 篇被录用,接收率约 22%,其中 335 篇选中 Oral,比率约 5%

    这篇《Bringing Old Photos Back to Life》属于 Oral 论文,含金量可见一斑,论文链接:https://arxiv.org/pdf/2004.09484.pdf

    论文的内容不再赘述,请读者自行阅读,摘录论文实现的效果图,如下:

       

    源码作者已经开放,GitHub 链接:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

 


3  实践步骤

3.1  测试环境

    Win 64 中使用 PoweShell 终端,已安装 Python 3.9.9,安装过程中勾选下图 pip 选项:

      

    可在 PowerShell 中输入 py --version,查看安装的 Python 版本 


3.2  源码和模型


3.2.1  源码    

    如有 git 可用 git clone 命令,如下

git clone https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life.git 

    也可直接下载链接中的 Source code:https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases

      

    如果下载速度较慢的话,可先点击下载,然后复制链接到迅雷下载,能显著提高下载速度


3.2.2  模型

    1)  下载 face_landmark 预训练模型,解压后放在 Face_Detection 目录下

cd Face_Detection/
wget http://dlib.net/files/shape_predictor_68_face_landmarks.dat.bz2
bzip2 -d shape_predictor_68_face_landmarks.dat.bz2
cd ../

    2)  下载 face_checkpoints 模型,解压后置于 Face_Enhancement 目录下

cd Face_Enhancement/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/face_checkpoints.zip
unzip face_checkpoints.zip
cd ../  

    3)  下载 global_checkpoints 模型,解压后置于 Global 目录下

cd Global/
wget https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life/releases/download/v1.0/global_checkpoints.zip
unzip global_checkpoints.zip
cd ../

    2) 和 3) 也可以通过 3.2.1 中的链接下载,解压后分别置于对应目录中


3.2.3  sync_batchnorm

    下载 Synchronized-BatchNorm-PyTorch,将子文件夹 sync_batchnorm,拷贝到 Face_Enhancement/models/networks/ 目录下

cd Face_Enhancement/models/networks/
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../../

    相同的 sync_batchnorm 文件夹,再拷贝到 Global/detection_models/ 目录下

cd Global/detection_models
git clone https://github.com/vacancy/Synchronized-BatchNorm-PyTorch # no need doing git clone once again
cp -rf Synchronized-BatchNorm-PyTorch/sync_batchnorm .
cd ../../ 

3.3  依赖库


3.3.1  第三方库

    可直接使用 pip 和 requirements.txt,一键下载全部依赖库

pip install -r requirements.txt

 requirements.txt 中的所有依赖库如下:其中,torch, torchvision 和 dlib 稍稍复杂,可放在后面单独安装

torch
torchvision

dlib
scikit-image
easydict
PyYAML
dominate>=2.3.1
dill
tensorboardX
scipy
opencv-python
einops
PySimpleGUI

3.3.2  Torch 和 Torchvision  

    Torch, Torchvision 和 Python,三者版本是有一定的对应关系,需要单独安装,关系图参考:https://github.com/pytorch/vision

      

    第一种方法,用 pip install torch==1.8.1 和 pip install torchvision==0.9.2 进行安装,但在 PowerShell 中,有时会因网络不稳定导致安装不成功

    第二种方法,提前下载好对应的 .whl 版本,下载链接:https://download.pytorch.org/whl/torch_stable.html,然后,分别执行如下命令    

pip install torch-1.8.1+cpu-cp39-cp39-win_amd64.whl
pip install torchvision-0.9.1+cpu-cp39-cp39-win_amd64.whl

    安装成功后,可用如下命令查看版本    

import torch
print(torch.__version__)

    查看到的版本是 torch 1.8.1+cpu 和 torchvision 0.9.1+cpu


3.3.3  dlib

    直接使用 pip install dib,安装并不成功,建议先下载 .whl 文件,再通过 pip 来安装,下载链接:https://github.com/sachadee/Dlib    

pip install dlib-19.22.99-cp39-cp39-win_amd64.whl

3.4  执行效果

    此处使用普通电脑测试,没有 GPU,所以 "--GPU" 设为 “-1”

    1)  对于带有划痕的照片,加选项 “--with_scratch” 

    2)  对于高分辨率的照片,加选项 "--HR"

py run.py --input_folder ./test_images/old/ --output_folder ./output/ --GPU -1

    翻拍的老相片,复原前后对比如下:尤其放大相片后,人脸的对比效果非常明显

        

     


 4  其它方法

    阅读一篇好的论文,显然比在网上搜索更加有效,从文末的效果对比可知,主流的图像复原方法有:DIP, CyleGAN, Sequential, Pix2Pix 和 Operation-wise Attention 等,也算是一个额外的收获吧。

      

 


参考资料

    Bringing Old Photos Back to Life

    照片修复-使用Bringing-Old-Photos-Back-to-Life

   



推荐阅读
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • Go Cobra命令行工具入门教程
    本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中,如Kubernetes、Hugo和Github CLI等。通过使用Cobra,我们可以快速创建命令行工具,适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文介绍了三种方法来实现在Win7系统中显示桌面的快捷方式,包括使用任务栏快速启动栏、运行命令和自己创建快捷方式的方法。具体操作步骤详细说明,并提供了保存图标的路径,方便以后使用。 ... [详细]
  • FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]
  • 本文介绍了Linux Shell中括号和整数扩展的使用方法,包括命令组、命令替换、初始化数组以及算术表达式和逻辑判断的相关内容。括号中的命令将会在新开的子shell中顺序执行,括号中的变量不能被脚本余下的部分使用。命令替换可以用于将命令的标准输出作为另一个命令的输入。括号中的运算符和表达式符合C语言运算规则,可以用在整数扩展中进行算术计算和逻辑判断。 ... [详细]
  • MyBatis多表查询与动态SQL使用
    本文介绍了MyBatis多表查询与动态SQL的使用方法,包括一对一查询和一对多查询。同时还介绍了动态SQL的使用,包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]
author-avatar
印度神油两性a
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有