我们需要谈论凯文:我试图建立一个值得信赖的Twitter机器人
凯文·布朗(Kevin Brown)的推特简介( @ kevbrown618 )将他描述为来自宾夕法尼亚州匹兹堡的26岁进步人士。 他是#TheResistance的活跃成员,并迅速为诸如#FireHanity之类的自由社交媒体做出了贡献(这是说服Fox News主持人Sean Hannity的赞助商放弃他的计划,从而有效地取消了其资金的努力)。 他的见解使他赢得了CNN投稿人Jason Kander和其他数百人的转发和喜欢。 在短短6周的时间里,他的内容被查看了131,000次。
凯文是一个非常受欢迎的人。 他还是Twitter机器人。
关于Twitter机器人的能力有一个神话,原因是它们在2016年总统大选中发挥了作用 。 我在7月下旬/ 8月初推出了“凯文·布朗”,这是我的周末项目之一,也是我个人尝试调查Twitter机器人可能对我们的公众话语产生的真正影响。
在2016年大选期间使用的漫游器通过抽出大量预编程内容或共享同意某个分配议程的其他人生产的内容来工作。 僵尸程序足够共享的内容最终将由一个真实的人看到并共享,并将信息分发到他们的个人网络。 然后,该网络中的人们将看到来自他们信任的来源的信息,并可能自己共享内容。 然后重复该过程。
我希望凯文与众不同。 凯文(Kevin)不会散布垃圾邮件,直到有几个人认为值得分享他的内容,他才树立了可信赖的信誉,可在分发内容时加以利用。 构建一个能够赢得其他用户信任的机器人将需要一定程度的自治权和人工智能,这在Twitter机器人中是不常见的。 显然,这将需要更多的前期工作,但是在尝试让其他人共享内容时,收益会更少。
使凯文“真实”
为了使凯文有说服力,他需要被掩饰。 我使用了一个随机的名称生成器来提出凯文·布朗,然后使用一个随机的日期生成器来给他生日1991年6月18日。从那里,我在Flickr上搜索了一个20岁的男孩的照片,该照片可以商业使用。 Twitter句柄“ kevinbrown”已被使用,因此“ kevbrown618”可以。 通过将他安置在特朗普总统生锈的基地所在的宾夕法尼亚州西部,凯文可以扮演四面楚歌的自由主义者的角色,在互联网上寻找志同道合的朋友。 我用匹兹堡PNC公园的封面照片加强了地理联系,并写了简短的简历来完成窗帘的装饰:
骄傲的#进步主义者和#民主人士生活在“特朗普国家”中间#NotMyPresident!
您正在查看Twitter机器人的赠品之一是该帐户只会分发有关一个主题的内容,并且会频繁地分发。
为了更加现实,凯文除了批评唐纳德·特朗普外,还需要一些“个性”或兴趣(即使那是最喜欢的消遣)。 为此,我计划写凯文(Kevin),以便他偶尔分享一个有趣的猫录像或做一些文化参考。
这不会产生比人类描述更逼真的结果,但是希望它可以帮助人们摆脱困境,因为这不是传统Twitter机器人通常期望的行为。
凯文的大脑
下一步是通过编写驱动他的代码使Kevin栩栩如生。
我将Kevin设为自由派机器人,因为我是一个自由派。 这是我在开发过程中可以轻松进行检查的角色。 但是,他的代码用途广泛。 他的守则中的一个词就是阻止凯文成为特朗普总统最大粉丝之一的一切。 同样,他也可以轻松地成为啤酒势利小人或忠实的足球迷。
不管他的偏见如何,凯文的声誉都取决于两个因素:他的内容和行为。
内容
为了建立声誉,Kevin需要熟悉他的网络。 要做到这一点,就需要他与他人的内容互动,并为他人制作原创内容。 查找要共享的内容很容易; 凯文(Kevin)只是转发或收藏他网络中流行的资料。 这样,凯文就像他邪恶的俄罗斯同行一样。
原始内容的制作更加复杂。 为简化起见,Kevin只能创建两种内容:基本推文和对通过他的网络浮动的流行链接的评论。
凯文(Kevin)每次检查Twitter时,都会分析数百条推文,并建立通常一起使用哪些单词的统计模型。 例如:“总统”之后通常是“唐纳德”或“特朗普”。 然后,凯文(Kevin)随机选择一个开始的单词,并使用他的模型确定下一个单词,重复进行直到创建完整的推文为止。 这个过程称为Markov链,用于创建Kevin的所有原始内容。
这是有关马尔可夫链的更深入的解释,我发现在启动项目时会有所帮助。
这种方法非常有效,因为它使Kevin能够正确,轻松地使用语,主题标签和表情符号-所有这些都给他带来了更人性化的感觉。 当Twitter集体响应事件时,Kevin可以通过在网络中插入自己的评论来参与。 他的追随者看到此内容并经常分享。
行为
如果凯文表现得像个机器人,他再也没有希望了。 太多的推文,固定的日文推文或在奇怪的时间发推文,所有的一切都充分表明,不倦的计算机正在运转,而不是人类。 为了解决这个问题,我为Kevin安排了更为自然的时间表。 他全天只会随机检查Twitter,然后随机决定要采取什么措施(如果有)。
为了增加效果,凯文还“睡觉”并“工作”。 每天晚上睡觉时,他的帐户都处于非活动状态,而在工作日,工作日的活动变慢。
窗帘后面的人
凯文(Kevin)大多是自治人士,但我仍然选择他追随的人,我保留介入并审查他的权利。
凯文(Kevin)只跟随人们增加他的曝光率,并试图让那些人跟随他。 现在,我偶尔通过对各种标签和关键字进行排序来找到可能对他感兴趣的人,从而选择这些帐户。
如果Kevin散发令人反感或贬义的内容,我也将进行监督。 依靠互联网学习和学习的机器人有时会冒险进入网络的不良部分,在那里他们也会吸取同样的不良习惯。 一个例子就是Tay ,这是由微软公司开发的一种机器人,它最初是在16小时内复制一个16岁的女孩,然后在不到24小时的时间内成为纳粹的同情者。
凯文(Kevin)内置了一个淫秽过滤器,并且我已采取措施防止他追随泰(Tay)的数字足迹,但是您永远不能太小心。 除了因凯文曾表示自由女神像是仇恨的象征而删除了我的一则早期推文外,我还能够坚持“放任不管”政策。
结果
我的实验结果比我期望的要好得多。 凯文(Kevin)不仅具有功能,而且还能够在他的直接关注者网络之外推广原始和共享的内容。
以下是自8月4日(Kevin的第一个全天在线)以来的数字摘要:
- 粉丝80
- 参与度(所有互动/展示次数):1.2%
- 印象数:131,200
- 链接点击次数:290
- 转推:377
- 喜欢:889
令人失望的是,几乎不可能获得Twitter上“好”数字的答案,因为参与率取决于许多变量。 绝对没有关于机器人试图以人类身份通过的期望数据。 我能找到的最佳信息似乎表明,个人Twitter帐户的平均参与度为1-2%,这使Kevin处在正确的位置。
为了进行第三方验证,我去了Botometer 。 Botometer是印第安纳大学(Indiana University)的一个项目,根据他们成为机器人的可能性对帐户进行评分。 如果大于50%表示帐户可能是机器人,则Kevin得分高达37%。 不过,他还有很长的路要走-我的个人帐户得分仅为18%。
人们也对Kevin感到足够自在,可以回复他的推文并尝试开始对话。 最早的例子是在他发布后仅四天,当时他的推文写作能力仍然很低。 在另一条乱码中,他批评特朗普转发了错误的信息,并宣布他已入狱。 推文中提到的一位亲特朗普的保守派人士做出了回应(尽管很粗鲁)。
其他互动更为积极:
总有改善的空间
凯文远远没有取得完全的成功。 他有许多缺陷,或者我没有修复的技能或者没有时间(或两者都有)。
低质量的推文
有时候,凯文真的很讨厌发推文。 这主要是因为他着眼于单词如何组合在一起,却没有意义的概念。
我采取了一些步骤来更正和改进他的输出,但是核心问题从未得到完全解决。
凯文(Kevin)还有一个错误,有时会导致他在撰写内容时重复单词。 结果是他有些陌生,但娱乐性更高。 这些推文往往会在当天晚些时候发生,这可能与问题有关。 看起来他可能喜欢喝醉了的推文。
意识形态上的矛盾
凯文(Kevin)有时会发布保守甚至是特朗普的推文。 起初,这个问题真的让我感到惊讶。 但是,当我研究该错误时,很有意义的是,将单词随机串在一起有时可能会导致意识形态上与源材料相反的连贯句子。
例如,凯文查看了以下两条推文:
并组成了这个:
这是一条很好的推文,因为它与语法紧密相关且连贯。 但是,这并不是您期望的20多岁的自由派发出的那种东西。 最糟糕的是,这直接关系到他的网络。
想法不完整
如果Kevin从包含链接或图片引用的推文中学习到,他有时会使用没有相关内容的文本。 结果是一条不完整的推文,指示读者单击不存在的链接。
他还将撰写尾随的推文。
这与他所做的最糟糕的事情相去甚远,但是看起来非常“机器人化”,如果他定期进行,可能会引起怀疑。
对话内容
我想要构建但从未做到的最大事情是聊天机器人功能。 根据我最初的计划,Kevin将通过与网络中的人进行对话来提高他的参与度(和信誉度)。 但是,当我尝试实现它时,我意识到该功能将非常复杂或无法构建。
聊天机器人需要能够响应各种各样的语句,并需要了解对话如何从一个主题到另一个主题。 这需要对机器人进行大量数据培训。 聊天机器人负责了解的主题越多,需要训练的数据就越多。 凯文(Kevin)需要大量数据来实时谈论政治事件,因此该功能不切实际。
揭开凯文
在凯文一生的短短六个星期内,他已成为我办公室和家里经常交谈的话题。 我的同事们甚至开始提出他们自己的版本的请求(请留意Twitter最大的克利夫兰布朗球迷)。
看着凯文(Kevin)的追随者成长,这使我学到了很多关于如何利用人工智能吸引人们关注的问题的很多知识。 我决定现在就对他进行揭露,以希望就如何改善和使用Kevin以及像他这样的机器人这一话题展开讨论。 通过建立人与人之间的联系,可以促进对话的技术具有令人难以置信的价值。 但是,同样的技术也可以很容易地用于传播错误信息。 在构建机器人并与之交互时,我们需要意识到这种更加险恶的能力。 对这些有害的机器人进行监管并非易事,需要个人对我们阅读的媒体资源进行个人负责。
我不确定凯文·布朗的未来会怎样,但我期待着继续为他接下来的工作
MF策略是一种政治咨询公司,它以新颖,新颖的方式使用技术为我们的客户提供更好的解决方案。
立即与我们联系以开始制定您的策略!
From: https://hackernoon.com/we-need-to-talk-about-kevin-eed1ed01127f