MS Celeb数据库2016年建立,拥有超过1000万张图像,将近10万人的面部信息。微软描述其为世界上最大的公开面部识别数据集,并用于培训全球科技公司和军事研究人员的面部识别系统。据了解,数据库中的面孔来自公众人物,但许多人并没有授权微软使用自己的面部照片。相反,微软是通过“知识共享”许可来抓取图像和视频的。根据“知识共享”(Creative Commons)许可,你可以将照片用于学术研究,但照片中的人物并不一定授权许可,而是拥有版权所有者授权。
根据人工智能论文中的引文资料统计,在微软删除该资料库前,已经有多个商业组织在使用MS Celeb数据库,IBM、松下电气、阿里巴巴、辉达、日立、商汤科技、旷视科技均有使用。