UIUC的Jiabin Huang同学曾经对13年Miss Daegu的选手做过分析。
原帖在此,非常欢乐:
http://jbhuang0604.blogspot.com/2013/04/miss-korea-2013-contestants-face.html?m=1
用大白话翻译一下:先手工对齐鼻子眼睛嘴,然后用Candes et al的Rubust PCA 来重建图像(第二列)。这一步主要是去掉头发等遮挡物造成的影响。
再然后,上传统方法SVD做eigen analysis。发现eigenvalue只有6个非零元素——换句话说,20名参赛选手的脸只有6个自由度。
在eigenfaces的6维空间中,可以比较轻松地计算两个人的相似程度,再降维到2D空间,20个选手的分布情况大概是这样的:
这张图大概就从一个侧面回答了楼主的问题。在有效可靠的表达下,这些脸还是能够被区分出来的。但是大家可以看到,有几个点(人脸)靠的很近,说明这几个脸在算法的特征空间下,区分难度非常大。对应到真人照片,是这三个:
从视觉效果上看,这三位选手,我也很难分清楚他们是不是同一个人换了妆,还是不同的人。。。
=====继续搬运=====
按照这个思路,就可以找出“长(zheng)得最相似”的,和“长(zheng)得最不一样”的参赛选手。
最后两个gif分别是长得最像的人和最不像的人的大串烧(相邻两帧相似度最大,或者最小)。
再后来,选美结果出来了。长得最像的三个人和最特殊的三个人中,各有一人进入总票数三甲。贴主认为这和 JSTOR这篇文章 中提到的观点很相似,即平均脸漂亮,但是最漂亮的脸一般不是平均脸。