2018年贤者概念赠款获奖者采访 - 数字DNA工具箱


跟随 发射鼠尾草海洋 倡议于2018年2月,圣人概念赠款计划的就职获奖者是 宣布 同年3月。由于我们建立了今年的获胜者公告,我们已经赶上了2018年的三位获奖者,看看他们一直在努力以及种子资金如何帮助发展其工具。

在这篇文章中,我们与数字DNA工具箱(DDNA)获奖者,Stefano Cresci和Maurizio Tesconi关于他们的初步理念,他们沿途的挑战者和社会科学研究工具的未来。

ddnablogimage.png

什么是ddna,你是如何开始或想出这个想法的?

数字DNA(DDNA)工具箱是一组用于支持科学家们在线数据感的方法。特别是,它专为评估在线社交网络(OSNS)中的帐户和内容(例如,检测假和机器人账户)的可靠性。

DDNA提供的方法分析在线行为中的相似之处。当我们首次考虑研究在线行为时,我们将它们建模为行动序列。然后,我们认为账户的动作序列可以用一串字符表示,类似于一系列生物DNA。基于这个想法,我们将字符串挖掘和生物信息学算法应用于我们的“数字DNA”字符串的研究,令人惊讶的好结果!

在过去的两年里,你的主要挑战是什么,你是如何克服它们的?

检测虚假信息的主要挑战之一是在线假装,成为一段新闻或假账户,如此准确地设计,以便通常看起来很可信,如果没有彻底调查。换句话说,从可信的人讲述单一假新闻和账户越来越困难。

这篇文章最初发布在姐妹网站,Sage海洋,标题下,“2018年SAGE概念授予获奖者:使用数字DNA工具箱团队进行面试.”

由于这一挑战,我们希望在更有利的情景中对抗战斗。因此,我们从分析单一假物品分析到分析项目组。我们遵循直觉,即不同项目之间的异常相似性可以用作自动/伪造内容的红旗。通过分析群体,我们有更多的信息进行了分析,最终产生了积极的结果。

为什么你的包裹与社会科学研究人员如此愉快地共鸣?

许多研究人员利用社交媒体和OSN数据进行学习。但是,用于评估在线数据可信度的工具仍然很少又一次。此外,它们通常由技术人员为技术人员设计,因此它们仍然限制在计算机科学界。由于Sage概念授权的资金,我们有机会在Python和R包的方便形式中释放我们的方法。我们相信社会科学研究人员会发现利用DDNA包中包含的尖端算法和技术容易和有用。

您有任何有趣的例子或案例研究是否分享?

由于我们开始尝试DDNA,我们发现了许多案例被机器人篡改并充满了虚假内容。一个这样的案件是英国2016年欧盟成员资格 公民投票。通过将技术应用于包含#brexit hashtag的小鸣叫的小区,我们发现了几百个机器人账户,这些账户在投票前几周疯狂推文。有趣的是,所有这些账户都在Brexit投票后完全停止推文。

在最近的另一个研究中,我们使用DDNA揭示了众大的僵尸网络,试图人为地充当美国金融市场交易的低价股普及。机器人创造了大量虚构的推文,其中他们提到了具有一些高价值的股票(例如,谷歌,苹果等)。通过这种方式,他们对低价值股票进行了大量讨论和广泛兴趣的印象,努力愚弄自动交易算法和不知道投资者。

什么 sets you apart from other tools and services in this space?

不幸的是,有多少服务和工具用于评估在线数据的准确性和可信度。为此,DDNA是第一个可用工具。唯一类似的服务是Boolometers,这是一个公共机器人检测服务。关于BOT计,DDNA包中包含的技术获得了更好的假检测结果。

您是如何了解SAGE概念的授权,是什么让您申请,资金是如何帮助您将您的想法更接近研究人员可以使用的完全操作工具或包装?

一位计算机科学研究员偶然发现了圣人概念赠款,并认为我们可能会感兴趣,所以他让我们知道。实际上,他完全正确,因为我们发现这项计划非常有用。那时,我们缺乏将我们的检测技术重新设计成可由专家和非专家使用的东西。从圣人那里收到的资金帮助我们重新设计了我们的原型代码,并允许我们开发2包(即,Python和R包)。

什么’您对社会科学研究人员的工具的未来?

我们今天所面临的许多危急挑战需要跨学科方法。赋予计算机科学家开发的最佳算法和技术的社会和政治科学家使我们能够更好地准备面对这些挑战。但是,Sage概念赠款等值得称道的举措仍然是罕见的。为了未来,我们希望在努力下将举行更多类似的举措,以便有助于减少计算机科学家开发的开拓工具与利用在线数据的许多研究人员之间的差距。

研究人员在哪里找到你的工具,他们可以使用它吗?

我们Python包的第一个初步版本已经公开可用 如下下载 和实验!我们现在还接近r封装的第一个版本的发布。我们欢迎所有有兴趣的研究人员对DDNA进行实验,并让我们知道可能的改进方法。

您的后续步骤是什么,读者如何参与其中?

我们始终试图改善DDNA核心的技术。特别是,我们现在正在努力使DDNA更加可扩展,以便更方便的大规模分析。有兴趣的读者可以留意我们的 出版物,我们不断使用DDNA进行研究。最后,我们欢迎所有建议,因此请不要犹豫,向我们拨打电子邮件或关于DDNA的推文!


DDNA正在开发 Stefano Cresci. and Maurizio Tesconi. from the 意大利国家研究委员会信息学与远程信息处理研究所。


0 0 投票
文章评级

鼠尾草

Sage Ocean,社会科学空间的姐妹网站,是新的圣人出版计划的一部分,支持社会科学家与大数据一起使用&新技术,同时还专注于科技,数据和社会科学的新创新。

订阅
通知
guest

本网站使用AkisMet减少垃圾邮件。 了解如何处理评论数据.

0 注释
Inline Feedbacks
查看所有评论
0
会喜欢你的想法,请评论。x