商务合作
福建省厦门市
[email protected]
工作机会
[email protected]
返回

Twitter说,它越来越擅长检测和删除机器人,概述了常见的误解

正如包括我在内的许多人多年来多次指出的那样,Twitter在机器人配置文件方面存在问题。

多年来,用户一直抱怨机器人程序和虚假账户对该平台的影响,虽然各种研究报告将Twitter的虚假个人资料级别定在5%至15%之间,但他们的存在似乎比这更为重要。研究人员一再指出,大量的机器人账户被用于恶意目的,其中最令人关注的用途是放大政治信息,以淹没对立的观点。

但Twitter现在表示,这些统计数据很多都是不正确的——不仅是不正确的,而且对公众的言论也有潜在的危险。

Twitter表示,随着时间的推移,它已经改进了对有问题的bot档案的检测和删除系统,而这些报道的含沙射影(Twitter允许大规模转发,从而影响公众舆论)是错误的。

在Twitter诚信负责人Yoel Roth和该公司全球公共政策战略总监Nick Pickles共同撰写的一篇文章中,他们概述了第三方Twitter bot分析的各种局限性,并指出自己的结果是更准确的业绩指标。

根据帖子:

“几年前,自动账户对我们来说是个问题。我们专注于此,进行了投资,并在Twitter的各个方面都取得了显著的成效。”

Twitter说,它的透明度报告很好地显示了它在这方面的进展——在最近的更新中,Twitter说,它向可疑垃圾邮件账户(包括恶意机器人)发出的挑战总数为1540万,涵盖了2019年6月。

以此为指标,Twitter当时拥有1.39亿mDAU——因此,基于此,作为一个非常粗略的衡量标准,在这段时间内检测到的可能伪造的个人资料总数可能只有11.08%。但这一数字还包括其他所有可能的违规行为,这意味着Twitter根据其自身采取的行动得出的实际垃圾邮件账户数字为低个位数,而且这些账户确实正在被系统地检测和删除。

考虑到这个数字也在随着时间的推移而提高(如图所示),Twitter表示,它主要是在摆脱欺骗性的机器人。这导致了Twitter想要做出的另一个关键区别

“需要注意的是,并非所有形式的自动化都必然违反Twitter规则。我们看到了创新和创造性地利用自动化来丰富Twitter体验,例如,@pentametron和@tinycarebot等账户。”

Twitter还指出,业务概要文件还可以使用bot和自动化来改进客户服务交互,因此您不能将所有bot都标记为糟糕,从而进一步模糊了数据。

那么,Twitter认为哪些机器人违反了规则?

Twitter列出了各种各样的误用,这些误用将导致机器人的个人资料被禁止。

恶意使用自动化来破坏和扰乱公众对话,比如试图让一些东西成为趋势

人工放大Twitter上的对话,包括创建多个或重叠的帐户

产生、招揽或购买虚假约定

进行大量或积极的推特、参与或跟踪

以垃圾的方式使用标签,包括在tweet中使用不相关的标签(也称为“hashtag cramming”)

因此,机器人批评的主要焦点——操纵对话——确实是一种违规行为,Twitter将删除违反这一规则的机器人。只要它能探测到它们,大部分情况下,它都能探测到。

“我们在整个服务中主动识别和消除这些行为的技术力量比以往任何时候都更加成熟。我们每个月都会永久性地暂停数百万个自动或垃圾邮件账户,而且在它们在Twitter时间线或搜索中吸引眼球之前,我们就会这样做。”

因此Twitter正在移除机器人,其先进的检测流程表明,问题并不像一些报道所说的那么明显。

在你看来,这是否属实在很大程度上是一个意见问题。或者学术研究中提供的关于违规微博的数据。

这就更难接受Twitter的反驳了——他们所指的研究实际上将tweets作为数据,它们表明tweets经常是重复的,逐字逐句的,并且在趋势性的讨论期间快速连续地发布。我们知道这种情况会发生,但根据Twitter的说法,这要么是真实的人在发Twitter,要么是对更广泛趋势的曲解

Twitter特别指出,像Botometer和Bot Sentinel这样的工具,其目的是根据一系列参数识别Bot活动,但通常并不准确。

“这些工具从一个人看一个账户开始——通常使用你在Twitter上看到的相同的公共账户信息——并识别使其成为机器人的特征。因此,从本质上讲,帐户名、Tweeting的级别、bio中的位置、使用的标签等等,这是一种极其有限的方法。”

Twitter再次表示,它自己的检测系统现在的发展远远超过了这些工具所占的比例,因此,这些工具所显示的数字不仅是错误的,而且可能会损害相关讨论

“对谁是‘机器人或不是机器人’的二元判断,有可能毒害我们的公共话语——特别是当它们被媒体推出来的时候。”

总之,Twitter说,那些指向广泛的机器人操作的报道——包括这里、这里、这里和这里引用的那些报道——很可能会误导这种行为的实际影响。这并不是说Twitter涵盖了所有的角度,也不是说它完全没有机器人操作。但当人们通过机器人检查器运行一个配置文件时,这可能不足以证明有人指指点点,指责任何用户进行了协同操作。

根据现有的数据,这可能是真的,但很难说——因为没人知道,确切地说,有多少Twitter个人资料是机器人。正如Twitter所说,很多所谓的机器人活动很可能是真实的人,他们只是分享相似的信息,或者大量参与某些话题。一些建议的机器人活动也可能被那些根本不想接受实际结果或趋势的人贴上这样的标签,因此他们认为这些活动是人为的。

Twitter绝对最适合理解这种情况,因为它可以访问原始数据,而且根据Twitter的说法,大多数机器人活动都在处理中。另外,值得注意的是,Twitter正在考虑为bot账户添加新的标签,比如验证bot的ticks,这有助于更好地了解特定趋势的起源

同样,你如何看待这一点将取决于你的个人感受,但数据显示,Twitter正在努力解决其机器人问题——而问题本身可能并不像看上去那么明显。

图文内容来源于网络,版权归原作者所有,侵权请联系删除。

编辑
编辑

Leave a Reply

您的电子邮箱地址不会被公开。 必填项已用 * 标注

Captcha Code

备案号: 闽ICP备19012359号-1