转录的单调:谁’彻底改变这个过程?

符号:"Ubefyrwdeehe"
一个看起来有点像对转录不好的迹象。

没有正确的方法是在社会科学研究中转录访谈或其他类型的录音。如果我要接受采访,我肯定会要求研究人员从成绩单中删除所有的'ers'和'uhms'。这是 exactly what a few 研究人员问英国社会学家哈利柯林斯 在他转录关于引力波检测的整个谈话之后要做 逐字。柯林斯随后决定纠正某些意大利物理学家的破碎的英语,在他们与美国物理学家的辩论中,因为在书面形式中,这些表达将大大减少他们争论的感知有效性或他们作为专家的信誉。这样的决定以及删除或离开非语言声音,如笑声和叹息,可以影响研究的方向,以及结果。 

可以说,转录的最简单方法是在所有声音中留下,延迟对“清洁”数据的任何决定,直到转录完成。因此,将转录转化为相对机械过程–你写下你听到的一切。从历史上看,这是研究生或初级研究员的责任,几乎就像一个进入该领域的感应过程。虽然非常繁琐,但思想学校,在社会科学的任何深入定性研究中,仍然存在,仍然存在,通过转录自我的接受,帮助您更好地了解数据, 拾起洞察和模式。

ai启动扰乱转录

紧张的时间而不是这种工作的细致性和长度的动机,少数人在都柏林城市大学,决定自动化这个过程。他们很快研究了语音识别的最新发展,并提出了 幸福。两年后,Hypyyscribe支持超过100种语言,具有多种文件格式的导出和导入功能。 HyperyScribe由超过七万千名的研究人员和记者使用。 tr, 验证, Voicea. 具有类似的转录技术,并且与工业和学术界都受欢迎,允许实时转录,备注,有时甚至产生内容的摘要。所有这些都最近筹集了至少几百万美元的资金 - 这表明这个市场的规模和转录的需求正在增长。如果您正在寻找自动转录工具,我会从水獭开始,因为您每月有600分钟的免费计划。对于一些更复杂的东西,使用Verbit,因为它具有多打样层,并且做了非常非凡的东西:您可以上传自己的字典,例如,您的访谈充满了行话。

Sage海洋博客标志
这篇文章最初出现在标题下的Sage海洋博客上,“谁在学术界中断转录?” .

录制 通过Wresally Studios(已经有大约200个引文)是这种空间中的另一个工具,开发了用于语音识别的算法。在其网站上,它声称将音频转换为在几分钟内,您可以选择使用其集成媒体播放器进行自己的转录。同样,建立了定性分析软件解决方案 NVIVO. 来自QSR International还在添加功能 自动转录,搜索和注释成绩单。 NVIVO转录支持26种语言和各种英语口音,而且也是如此 GDP.HIPAA 符合要求。 Silvana di Gregorio 描述了NVIVO转录的特征以及最近的研究人员可以做些什么 博客 post.

如果您想要携带抄写项目, 录制me. (约有300个引文)将是您最好的选择。或者, dictate2us. (约有15篇文章引用它)与300K的转录器一起工作,类似于流行的 REV录音机,谁也使用专业的转录器,可作为应用程序提供的应用程序,以便录制您的面试。或者如果您希望一个应用程序更加无缝地将自己转录,那么 otranscribe. 会做,它也是免费的。

挑战

学术研究人员转录访谈的市场很小或至少不足以推动专注于转录的资助初创公司的爆炸。相反,这些工具的发展是由两个大趋势决定的:渴望改善视频和音频材料的可访问性,例如学术界的标题讲座;稳步走向声音 在4年内部署的Amazon Echos数量加倍 和视频 仅在YouTube上传了300个小时的每一分钟

因此,由大型科技公司开发的语音识别,主持和记录这些大量音频和视频的大量音频和视频,这对长期的独白块或两个人之间的对话来说真的很好。他们处理了背景噪音,甚至改善了口音和方言。因此,甚至引导您的转录 谷歌文档 (免费),或 微软的语音识别 服务(包含在Azure订阅中)几乎 与人类经销商相提并论 在转录少数面试时节省时间和精力。 

有一个捕获,但需要改进算法,它们会用更多的数据来做。最近的调查 亚马逊, 苹果, 谷歌微软 只证实我们已经知道的东西–人体转录仍然雇用。因此,使用自动转录服务与数据保护有关的大挑战,特别是当您的访谈具有敏感性和人识别的数据时,如果您的文件或转录输出发生的任何指示,则几乎没有完毕。无论您最终雇用研究生,众所周心,还是完全自动化,您的音频文件可能会被可能不参与面试的第三方听取,这是包括同意表格的指出。  

最近,越来越多的语音识别和转录初创公司 Voicea. 正在提供商业用途,例如工作场所内的录制会议。这导致焦点组类型研究或涉及多个人群的转录的改进,并且在对话中可靠地跟踪个人更难。这也仍然是一个挑战,虽然是一个较小的挑战,适用于通常的职业转录者(甚至是研究生),谁通常 减慢演讲 或者听到多次录制。 

虽然目前的许多自动转录工具涵盖了50多种语言和各种英语方言,口音甚至 言语障碍当您的受访者与另一种语言混合英语时,它们是无用的。此外,大多数工具仍在努力可靠地努力预测他们无法清楚地检测的单词,使您更容易找到和编辑它。当然,声音的质量是人类和机器人转录的挑战,但后者更为挑战。

展望视频和录音的研究

1976年计算机科学家Raj Reddy 预测语音识别算法将在10年内建立。花了比这更长时间,但今天可用的算法与人类转录相当,不断提高错误率,但也降低了性能的成本。通过这些工具,研究人员可以通过详细翻译,研究人员可以传输大型音频语料库–从逐字转录中的任何东西都侧重于单词和非文本元素,对侧重于内容的编辑和抛光的文本输出,将演讲转换为写成良好的文本,一些提供奖励选项以创建摘要和突出显示。 

QSR国际言论的Silvana di Gregorio认为“自动转录正在归功于”沉重的升降“–允许研究人员更多的时间来反思和开始分析过程,因为他们查看了成绩单(在听到音频时)“。事实上,所有工具都在其平台上直接提供编辑和注释,这是社会科学研究人员常用的特征,以进一步和更深入的分析。但是,研究人员始终返回音频文件,一次又一次地聆听,同时也将转录的输出注释为令人难以置信的细节。  

然而,问题仍然存在:我们需要重点转录多少?由所需细节的标准困惑,社会科学家目前正在转录访谈时,柯林斯,相同的英国社会学家,他们编辑了意大利物理学家破碎的英语物理学家,经济研究,并证明了书面形式,非言语元素的存在“在文本中传输时比在录制的声音传输时表示扬声器中的更远的不确定性”. 

在一个 最近的书 (2019年)进一步探讨了社会学的实践和方法,柯林斯认为,“知道作为一个良好的例证或说服展览的重要性需要解释性技能 - 这不能通过计数或分类词语或话语来完成”。跨学科社会科学家尼古拉斯路易伯雷会同意。事实上,他 开发了一种新方法 他称之为系统性和反身面试和报告,或短暂的争吵。使用这种方法,研究人员完全跳过了转录过程,而是将采访与同事一起进行。在一起,他们将在面试后占据一次反身对话并正确挑选关键内容,以后独立地写报告。或许,转录过程的真正破坏者不是自动转录工具,而是使研究人员能够直接注释视频和音频文件的新方法和工具,并从事音频语料库的进一步深入分析。  

5 1 投票
文章评级

daniela duca

daniela duca 是Sage Ocean的产品经理,与初创公司合作,帮助他们将工具带到市场上。在加入SAGE之前,她与学生和研究员领导的团队合作,开发了新的软件工具和服务,提供业务规划和市场发展指导和支持。她设计并运行了一个2年的计划,为研究人员提供了在新的软件服务上使用出版商​​的研究人员提供创新赠款,以支持研究数据管理。

0
会喜欢你的想法,请评论。x