商务合作
福建省厦门市
[email protected]
工作机会
[email protected]
返回

Facebook更新了它的自动Alt-Text过程,以在发布的图片中识别更多的对象

Facebook宣布对其自动Alt Text(即AAT)程序进行了重大更新,这将确保平台上的更多图像能够被屏幕阅读器读取,从而使视力受损的用户能够在Facebook的应用程序中获得更好的体验。

Facebook在2016年首次启动AAT流程,在没有提供手动alt文本描述的情况下,通过机器学习流程自动识别发布图像中的对象。但在最初的迭代中,这个过程相当有限,Facebook一直在努力更新这个过程。

正如Facebook所解释的:

“首先也是最重要的是,我们已经将AAT能够在照片中可靠检测和识别的概念数量扩大了10倍以上,这反过来意味着没有描述的照片更少。描述也更详细,能够识别活动、地标、动物类型等——例如,“可能是2个人的自拍,户外,比萨斜塔。”

这为Facebook提供了更大的容量来提供图像中对象的详细描述,不仅包括它们是什么,还包括它们在帧中的位置。

因此,我们不必将照片的内容描述为“可能是5个人的图像”,而是可以指定照片的中心有两个人,其他三个人分散在边缘,这意味着中间的两个人是焦点。或者,与其简单地用“可能是一座房子和一座山”来描述一个可爱的景观,我们可以根据山与底部的房子相比显得有多大来强调山是场景中的主要对象。”

如前所述,Facebook多年来一直致力于发展其视觉识别工具,包括静态图像和视频内容。事实上,早在2017年,Facebook就分享了其视频ID工具的概述,这些工具目前尚不可用,但将进一步提升该平台的能力,既能满足视力受损用户的需求,又能收集更多关于发布内容中的内容、用户正在观看的内容、用户正在参与的内容等方面的数据见解。

在最新的AAT升级中,Facebook实际上利用Instagram图片和标签来映射内容,这进一步凸显了数据收集过程的潜力。

这可能不仅仅意味着帮助不同能力的用户。例如,Facebook可以帮助广告商接触到那些对咖啡感兴趣的用户,将目标锁定在那些定期发布咖啡杯或咖啡馆图片的用户身上。这也有助于进一步放大你的信息,因为这些用户可能也会发布你的报价-因此,你可以通过打折优惠联系这些用户,增加他们与追随者和朋友分享的可能性。

要清楚的是,Facebook目前还没有提供这些新的图像识别见解作为广告目标选择。但容量是有的,它可以促进新的搜索和研究选择,以最大限度地提高您的观众在未来的反应。

Facebook表示,新系统在文化和人口方面也更具包容性,这是因为Facebook通过翻译多种语言的标签,使用了更广泛的内容数据集:

例如,它可以根据(部分地)传统服装来识别世界各地的婚礼,而不是只标注带有白色婚纱的照片

新系统还可以为需要的人提供更多细节。例如,用户最初会看到每个图像的基本描述,但他们可以选择使用扩展的数据列表来选择更具体的细节。

同样,这里的扩展意义重大——虽然主要的重点是为所有用户提供更多访问Facebook平台的机会,但扩展的数据选项也可能在许多方面具有巨大的价值。

新的AAT系统现在已经投入使用,拥有屏幕阅读器的用户可以访问Facebook应用程序中的新数据。

图文内容来源于网络,版权归原作者所有,侵权请联系删除。

编辑
编辑

Leave a Reply

您的电子邮箱地址不会被公开。 必填项已用 * 标注

Captcha Code

备案号: 闽ICP备19012359号-1