你相信吗?仅凭一段6秒钟的音频,就能推写出说话者的肖像来。
人说话时,脸部的骨骼、肌肉等都会影响发音。美国的研究人员开发了一个名为Speech2Face的人工智能系统。他们从网上找来几百万段视频,让人工智能收听和分(试读)...