面对每日数以千万的新增视频,该如何将其精准匹配到用户眼前?快手 CEO 宿华曾形容,这是快手员工需要面对的前所未有的难题。为此,快手提出了一整套基于 AI 技术的解决方案,贯穿视频生产、内容理解,用户理解,系统分发等使用快手的每个环节。在极客雇主交流会现场,快手科技 AI 技术副总裁郑文说,AI 是快手连接内容生产与消费两个端口的核心能力。
快手上线了一批爆款特效,像是叫做快手时光机的「变老」表情,可以在十几秒钟中,让视频中人物的容颜变成 60 年之后、还有可以实时进行肢体识别的舞蹈游戏、AR 换脸等等。这些玩法背后是快手对前沿 AI 技术的开发,涉及人体姿态估计、手势识别、背景分割等多个技术模块。这是在内容生产领域,快手努力将记录形式变得更加有趣的新尝试。
用户通过快手 app 拍摄、上传了一段短视频后,后台机器会提取其内含的基本信息,诸如视频中人脸的性别、表情、颜值等,尝试理解视频内容。机器还会依照场景识别、物体跟踪、图像质量评估等维度,对图像进行分类。语音识别,也是机器理解视频的重要方面。机器会把语音转化成文字,通过文字理解视频表达的含义。快手多媒体内容理解(Multi-Media Understanding)部门利用 AI 技术通过感知和推理两个阶段来解读一个视频,首先感知获取视频的客观内容信息,进而推理获取视频的高层语义信息。
评论专区