将大数据放在大量使用中


在我们的报纸和杂志上显示大数据头条。几周前,Facebook,谷歌和推特在华盛顿的一个国会委员会前,回答有关俄罗斯通过在线传播错误信息来影响去年美国总统选举的问题。在英国, 一篇文章 观察者 在Brexit. 讲述“一个涉及特朗普的大数据和亿万富翁友好朋友的阴影全球经营”,他使用了政治广告的微目标来抑制选民细分并影响公民投票的结果。几周前,一个 Fortune headline 要求“是大数据杀死民主?”和11月4日 的封面 经济学家 展示了Facebook“F”的形状的吸烟枪。

凯茜O.'Neil
凯茜O.’Neil

好像这不够可怕,似乎这不仅仅是受到威胁的民主。在Cathy O'Neil最近的书中, 数学毁灭武器,她举例说明数据和预测性的大量专有算法如何用于最大限度地利用利润,并降低企业的成本,对人口的整个贩运造成破坏性效应,但特别是对于已经处于弱势群体的群体。

反对这一媒体故事的背景,警告我们关于大数据及其危险,圣人出版(社会科学空间的父母)举办了一个小组辩论作为其中的一部分 ESRC社会科学节 panel entitled  “将大数据置于良好用途“在伦敦的英国学院。该活动的目的是讨论新闻是否讨论了这一消息的大数据及其潜在用途以及我们如何有效利用社会科学中的大数据的力量。

我主持了这个活动,并加入了四名小组成员:

  • Maria Fasli博士, 埃塞克斯大学的分析与数据科学研究所计算机科学与董事教授
  • Dr. Slava Mikhaylov, 埃塞克斯大学公共政策和数据科学教授,在政府和分析和数据科学研究所举行联合任命
  • Jonathan Gray博士, 国王数字人文科技部的关键基础设施研究讲师’伦敦大学和公共数据实验室的联合创始人
  • 伊恩mulvany., Sage Publishing产品创新主管

没有那么好的大数据

为了让我们踢开,我通过分享凯茜书的示例来设置场景,这些示例是如何以大多数人都能找到令人反感的方式使用的大数据如何使用 掠夺性目标广告 由美国营利大学进行的,留下了数千名弱势学生,债务山脉。另一个例子是让新闻,并在Cathy的书中推出的是使用大数据和 重建风险算法 在美国刑罚系统中 已经以一种方式编写了“保障黑人被告将不准确地确定为未来的罪犯,而不是其白色同行。”

共同批评

从这些各种新闻报道,以及凯茜的书籍,对大数据的一些常见批评正在收集和使用。  

首先,有同意的问题。虽然我们所有人都勾选了一个框来同意Facebook的条款和条件,但我们中的任何人都通过一直阅读了吗?或知道 剑桥分析 将来会使用我们的Facebook数据来构建一个型号,帮助特朗普竞选微目标政治广告?

尽管人类偏差可以是,但是,算法被认为是科学和客观的方式也存在一个问题,并且经常是烘焙到设计。 Cathy O'Neil和许多其他人谈到了危险 “黑匣子算法”,以及在新信息可用时不会更新或自我更新或自我更新的模型的危险。

例如,谁在规范这些算法,以确保他们不是种族主义或性别歧视?在许多情况下,如果个人由公司算法不公平地评分,个人几乎不可能反击。 Cathy的书籍告诉教师因算法评分而发射,信誉否认,没有提供的工作......后果可能是普遍的和破坏性的,特别适用于那些已经处于不利地位的人。

另一方面…

但是,这是一个非常重要的,但是,大数据和数学模型都不是本质的坏事。 大数据有可能做精彩的事情。 正在使用大数据来支持 选举监测在全球南方, 解决流行病和治疗疾病,改善对最需要它的人的人道主义援助的目标。组织喜欢 Datakind UK 将慈善和数据科学家匹配,并致电呼唤类似的事件“合唱团“使用数据科学找到慈善问题的解决方案(见 这里 有关去年赞助的数据的更多信息)。

大数据既不是良好也不是坏的,这取决于它使用的方式,由谁以及服务于什么结果。对于我们大多数人来说,问题是我们通过我们的数据信任的问题以及结果使用我们的数据带来了什么。

在社会科学赛事的ESRC节日,我们的专家小组通过了一些大数据如何用于社会益处的示例,以及学者面临的一些挑战,他们正在努力将大数据更好地利用减少不平等,改善社会的成果。

教科文组织数据科学与分析

Fasli教授解释了术语大数据,数据科学和分析以及她的工作作为教科文组织的数据科学和分析椅。

“联合国教科文组织和数据科学团队中的联合国教科文组织主席的关键目标之一是突出数据在促进平等,可持续发展以及它如何增强人民生活中的关键作用。越多的人可以获得数据,你提高了一个国家内的透明度越多......与我们的国际合作者一起工作,我们将支持专门关注发展和过渡国家的研究基础和技能的发展。在解决这一技能差距,通过有针对性的奖学金和培训计划,我们将提高人民的数据素养,这意味着他们将被崛起,使工具积极贡献并参与公共生活,提高他们做出明智决策的能力,以及提高知情决策的能力,以及持有组织和机构来账户。“

自然语言处理,气候变化和公共卫生

Mikhaylov教授谈到了他最近关于气候变化和公共卫生的工作 出版于 柳叶瓶.

“气候变化已经影响全球数百万的健康和福祉。在解决这一挑战的努力中有一个明显的增加,但更多可以采取更多,特别是加快气候变化对健康影响的政策响应。“

自然语言加工专家Mikhaylov教授参与了公众和政治参与部分,他们专注于联合国。

他解释说:“我们在联合国大会的国家和政府部门或其代表中收集了国家和政府部门或其代表的演讲,以及我们评估了与其陈述中的气候变化和公共卫生交叉口的参与水平。” “我们发现各国各种各样的接触程度,根据他们的气候变化(例如西太平洋国家)和对该问题的政治争夺水平(例如北美)。

“我们还确定,在重大气候变化峰值上涨但在此之后大幅下降,突出的程度大幅下降,突出了高层政策制定者仍然普遍存在的短暂关注跨度。”

Mikhaylov教授的研究表明,通过将气候变化和公共卫生联系在一起,以及气候变化次要峰会周围的重要信息,有机会增加政策制定者的参与(至少是短时间!)。

假新闻和公共数据实验室

格雷博士告诉我们关于这项工作 公共数据实验室 在巴斯大学,最近出版的 假新闻的现场指南.

假新闻的现场指南 探索使用数字方法来追踪在线生产,流通和接收的假新闻。

与圣人出版合作的公共数据实验室旨在促进社会科学研究,教学和公共参与活动的数据社会的未来。它动员了研究人员,从业者和组织的跨学科网络,以便为创建和使用公共数据而开发和传播创新的研究,教学,设计和参与格式。它渴望支持在社会研究,政策制定,宣传,新闻服务中的创建和使用数字公共数据的审议和知识交流,以及周末和未来的全球挑战的公众参与 - 从气候变化到税基地侵蚀,迁移到自动化。

“通过现场指南,”灰色博士解释说,“我们想为富裕的公众辩论和民主审议有关假新闻以及如何解决它的贡献。特别是我们希望促进不仅探索假新闻项目的内容和声称,而是更好地了解他们如何传播以及它们对不同的公众的意义。“

大数据,大障碍

最后,当试图从事大数据研究时,伊恩Mulvany从鼠尾草谈到一些障碍学者面临的障碍。 在2016年,Sage进行了一个 民意调查 超过9,000个社会科学家了解有关使用大数据从事研究的研究人员的更多信息,以及他们面临的挑战,以及在未来寻求做这种研究的人的障碍。

目前从事大数据研究的32%的受访者报告说 访问商业或专有数据 对他们来说是一个“大问题”:

大数据研究人员面临的挑战(n = 2273)

还有一个技能缺口持有社会科学返回:大数据研究所需的定量和编程技能水平使教育者将其引入传统的社会科学学位课程,因为在教学教师中几乎没有时间或专业知识。 Sage通过在社会科学家推出教学数据科学技能的新一系列在线课程,已经回复了这一点: 圣人校园。  

我们都乐观主义者

要结束这一活动,我们向每个小组成员询问他们是否对数据科学的未来以及社会良好的大数据持乐观态度。不幸的是,对于那些寻找热烈辩论的人来说,所有的小组成员都希望大数据提供的学术研究的巨大机会。显然,有努力使效益最大化并尽量减少危害,并确保社会科学研究人员能够有效地实现的技能和工具,但我们在这里都是乐观主义者。

观看以下完整面板讨论:

 


0 0 投票
文章评级

凯蒂·梅德勒

凯蒂·梅德勒 是Sage Publishing社会科学创新的副总裁。她在出版业拥有超过14年的经验,并带领跨职能团队从发现到交货中带来新的数字产品。

订阅
通知
guest

本网站使用AkisMet减少垃圾邮件。 了解如何处理评论数据.

0 注释
Inline Feedbacks
查看所有评论
0
会喜欢你的想法,请评论。x