科技行者业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

2019年4月30日 科技行者
  • 分享文章到微信

    扫一扫
    分享文章到微信

  • 关注官方公众号-科技行者

    扫一扫
    关注官方公众号
    科技行者

利用业余时间,来自马萨诸塞州的一对夫妇编写出一套系统,据称其能够在高达90%的准确率从图片中识别出伦勃朗的画作。

来源:科技行者 2019年4月30日

关键字:人工智能

一种新的AI算法,可能有望解决以往一直难以攻克的图像识别与分析问题——特别是那些由于AI训练数据集太小,或者个别样本图像太大/分辨率过高而导致AI算法无法处理的场景。这种新算法已经能够检测出伦勃朗这位著名艺术家的画作,同时准确发现伪造品。更重要的是,这一算法的创作者亦在积极寻求其它潜在发展方向,希望能够找到利用小规模数据集实现AI神经网络功能训练的可行途径。

 业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

利用业余时间,来自马萨诸塞州的一对夫妇编写出一套系统,据称其能够在高达90%的准确率从图片中识别出伦勃朗的画作。

根据采访,这两位AI研究人员在算法构建当中借用到热力学与信息论中的一大重要概念——熵,旨在利用AI系统成功找出伪造的艺术品。

在煮沸的水以及黑洞等物理系统当中,熵这一概念指的是特定体积之内所包含的紊乱度量。而在图像文件当中,熵则被定义为文件中所包含的有用/非冗余信息量。

马萨诸塞州弗雷明汉市IEEE成员兼业余AI程序员(以及全职专利律师)Steven Frank表示,“熵用于衡量信号中信息的多样性水平。其基本思路在于,如果一条消息的全部内容都是「1」,那么其中就完全不存在熵,因为内容并没有任何多样性可言。但如果消息的内容是一条完全随机的序列,则代表其中包含极高的熵值与高度多样性……这同时意味着,我们无法对其进行压缩或者使用比消息更小的任何bit对其进行描述。”

因此,对单一图像的熵进行评级,就意味着确定图像当中包含怎样的数字多样性评分——即图像的单调性或算法(低熵评分)与随机性及不可预测性(高熵评分)之间的关系。可以肯定的是,这种作法与定性或者美学判断无关。此类指标在艺术评论家眼中可能一文不值,但却有可能在计算机平台上发挥重大作用。Frank辛集国,实际上图像中的熵值有可能在利用AI技术处理高分辨率图像这一长期难题层面带来突破性助力。

这是因为以MB甚至GB为单位的超高分辨率图像往往体积过大,无法通过AI神经网络进行处理——特别是图像识别算法中常见的所谓卷积神经网络(简称CNN)。

业余爱好者的杰作:AI系统能够准确分辨真假伦勃朗画作

研究人员们利用少量伦勃朗的肖像画(包括他的自画像,如图所示)对AI神经网络进行训练,并由此得出了能够测试艺术品是否属于伪造的识别算法。

1935年,荷兰画家伦勃朗-范-赖恩的作品集中仅列出611幅画作。

然而,即使是这样的数字也仍然不足以采信。目前艺术家评论家们认为,实际画作数量可能只占一半(这是因为世界上存在着大量关于伦勃朗作品的仿制品、复制品与伪造品)。

但即使将全部611幅由伦勃朗乃至其他伪造者创作的画作全部投入识别卷识神经网络的训练,这样的数据集规模也只占AI专家所认可的最低图像识别训练素材量的12%。

换言之,如果要让AI能够从伪造品当中准确找到真正的伦勃朗画作,那么其至少需要先观察5000张伦勃朗的画作。而在理想情况下,我们最好还能为AI系统提供更多来自伪造者、模仿者乃至复制者的更多图像样本作为参考。

由于客观上不存在这样的条件,因此AI技术在解决伦勃朗乃至其他著名艺术家画作的识别任务时一直发挥不了什么实质性作用。

Frank希望探索,熵概念能否给这两个问题找到答案?即图像分辨率过高问题,以及用于训练CNN的数据集规模太小的问题。

对于任何一幅给定的画作,例如伦勃朗于1654所创作的Jan Six肖像,一款简单的计算机程序(甚至不需要AI技术)就能够计算出它的熵评分。假设Jan Six肖像的熵评分为……只是假设哦,6分。现在,Frank和他的合作者(妻子)Andrea Frank意识到,他们可以在Jan Six肖像上运行一套简单的脚本,从而将整体大图像拆分成大量100 x 100像素的图块,且整体熵等级为6。接下来,脚本进一步将所有评分为6的200 x 200像素块挑选出来,而后是400 x 400像素的熵评分6图块。

在此之后,这些100像素、200像素以及400像素的图块至少在数学意义上讲包含有与其父图像相同的信息混乱度。因此,Frank希望弄清在这些图块之上(而非全尺寸原件)训练出的神经网络是否也能够“教会”神经网络如何从伪造品中辨别出伦勃朗的原作。

他们的方法是将伦勃朗那些广为人知的著名肖像画作拆分成大约1万3千个图块。在此之后,他们利用这些图块训练自己的CNN,而非像传统方法那样着眼于原始画作。为了测试自己的神经网络,他们引入了一系列已知的伪造品与真品图像(这些测试素材并未被包含在原始训练集当中),希望了解这套“伦勃朗CNN”能否给出正确判断。最终,他们报告称成功率达到90.4%。

分析还得出了另一个令人惊讶的结果,即哪些部分在弄清目标图像是否属于伦勃朗画作真品方面发挥着最为重要的作用。

Frank解释称,“事实上,对各个图块上的笔触进行分析并不能有效区分伦勃朗本人与伦勃朗风格画作之间的差异。而在另一方面,在较高的分辨率之下,例如完整截取整个肖像的头部部分,CNN开始表现得极为擅长从模仿者或者类似风格的艺术家作品中挑选出真正的伦勃朗创造。”

他同时补充称,“在我们看来,这代表着与伦勃朗同时代的画家们可能会在笔触层面模仿他的风格。但如果大家真的希望了解伦勃朗作品中那些与众不同的特色,那么必须要着眼于尺寸更大的画作并立足更为宏观的构图层级。”

两位研究者表示,同样的AI技术可能也会在某些医学图像分类场景下发挥作用。举例来说,放射学图像的体积往往非常庞大——可能达到数百MB甚至更高。CNN无法处理如此庞大的文件,因此放射科医师必须将图像缩小至低分辨率快照形式(在此过程中必须导致信息丢失),或者以手工方式挑选有代表性的样本进行比较与比对——这无疑会给放射科医生带来极大的工作负担。

Frank指出,“我们的系统可以实现更高的性能与更准确的分类效果,因为其不再单纯着眼于庞大的整体图像,而是将其降低至众多低分辨率图像,这意味着它完全能够处理与医学相关的高分辨率素材。”

不过他也补充称,与伦勃朗的画作不同,熵方法当中所不被注意到的某些图像细节,有可能在医学领域拥有重要的意义。因此,放射科医师必须意识到这种算法中的局限性。

作为众多图像分析程序中的工具之一,熵方法能够为已经明确了解其优势与短板的放射科医师提供极具现实意义的信息。从理论上讲,熵方法有朝一日也将为AI技术提供更多难得的训练图像。

与此同时,Frank夫妇强调称他们并没有对其算法进行专利申请或者商业化的想法。就目前而言,这种算法只是提供了一种非常聪明的概念验证方案,能够利用熵评分机制从大量伪造/模仿品中找出真正来自艺术家本人之手的画作。虽然范围有限,但这仍然代表着一大顽固问题被初步攻克。


    最新文章
    热门标签