开学了,人工智能第一弹
当前位置:首页 > AI资讯 > 正文

用人工智能识别“假新闻”有多准?这所大学

10-30 AI资讯

 

人工智能可以解决“假新闻”问题吗?
苏黎世大学的研究人员正在尝试通过使用“深度学习”机器智能来找出意识形态各个方面在新闻报道方面的偏见。

该项目是该大学新的“数字社会计划”的一部分,该计划是一个由学者和科学家组成的跨学科网络,他们正在研究社会数字化如何影响沟通,健康,工作,社区和民主。苏黎世研究小组由海德堡科学院资助,其基础是信息科学家贝拉·吉普(Bela Gipp)博士在伍珀塔尔大学和康斯坦茨大学进行的研究。贝拉·吉普(Bela Gipp)博士正在就利用人工智能识别学术窃进行类似研究。
框架和偏见

在苏黎世,假新闻项目由苏黎世大学政治行为与数字媒体助理教授Karsten Donnay博士领导。他的团队“发现并揭示”有偏见的新闻报道的努力是使用人工智能对抗互联网上虚假和误导性信息传播的第一批严肃尝试。

“新闻的构架很重要,”唐娜最近在由汤森路透主持并在线主持的AI @ TR邀请演讲者系列活动中说。他说:“重要的是新闻的报道方式,尤其是使人们能够识别以新闻报道为幌子传播的偏见,虚假且经常引起轰动的信息。”

例如,考虑以下描述同一事件的两个句子:

    联合国武器检查员说,出于安全原因,他们已经撤出了两架U-2侦察机在伊拉克上空。

    伊拉克战机威胁到两架美国U-2侦察机,迫使他们中止任务并返回。

在第一句中,“撤回”,“侦察”和“安全”这两个词相对中立。然而,在第二句中,威胁,监视和强迫这些词的语气更为险恶。两者在技术上可能都是正确的,但是这些单词传达了不同的次文本含义,因此它们的框架不同。
教授人工智能

根据Donnay的说法,该项目的最终目标是创建一个新闻汇总网站,该网站使用AI工具识别每日新闻中的偏见和欺骗,然后以意识形态中立的方式对故事进行分类和呈现,以使读者可以轻松地理解并希望,信任。但是,该项目仍处于初期阶段,困难是巨大的。首先,AI工具需要学习如何识别偏见,这意味着它需要能够解析语言和上下文中的细微差别,即使是细心的人类读者也难以分辨。

其中存在许多挑战之一。

对计算机进行编程以识别书写中的人为偏见实质上意味着要教计算机如何阅读。但是阅读本身是一个科学家无法完全理解的复杂的心理过程,而人工智能仅与支持它的程序和数据一样聪明。尽管如此,唐娜(Donnay)的团队正在尝试通过模仿人类用来评估他们吸收的信息的准确性的潜意识过程,来“教”其AI来识别偏见。不幸的是,人类也不善于识别偏见。而确定任何给定新闻故事中“真相”程度的整个想法可能会导致科学界可能无法解决的几个哲学难题。毕竟,如果一个人的恐怖分子是另一个人的“自由战士”,那么真理至少在一定程度上是一个观点问题。

正如Donnay解释的那样,解决假新闻问题的困难始于认识到收集,报告,撰写,编辑和传播新闻的过程本身是不完善的。例如,新闻机构拥有所有者和广告商以及目标受众,这些因素会影响他们对故事的选择和展示。同样,作者产生的每个句子都是一系列的判断,涉及使用哪些单词以及强调哪些思想,所有这些都反映了教育,经验,文化等。也有读者要考虑的观点。
(非常)复杂

Donnay及其团队面临的首要挑战之一是为AI工具创建足够大的语言示例数据集,以用作分析框架。 Donnay指出,过去创建单词和短语“字典”的工作效果不是很好。相反,他的团队正在尝试开发一种更全面的深度学习方法,该方法需要大量带注释的数据。
假新闻
苏黎世大学的Karsten Donnay博士

在一个试点项目中,团队首先关注于情感分析的简单任务,以说明如何使用这种方法来衡量新闻故事中的想法被定性为“积极”或“消极”的程度。下一个主要挑战是扩展情感分析的逻辑,以构建一个足够大的注释数据库,以应用神经建模技术来模仿人脑如何推断更复杂的单词含义和意图。

数百名编码人员组成的团队分析并评分了数以万计的句子,以创建用于检测媒体偏见的新基准数据集。一旦AI工具“学习”了足够多的示例以在单词选择和句子结构级别识别偏见问题,它就可以将其分析扩展到更大的段落和整个故事的上下文。

但是,为了分析新闻故事的偏见并将其与同一主题的其他故事进行比较,AI工具需要能够识别出多个故事中讨论的核心主题和概念是相互联系的。 “为此,没有开箱即用的工具能很好地工作,这就是为什么我们想出自己的方法的原因,” Donnay解释说。这种方法是由吉普博士的团队开发的,涉及使用六步合并启发式方法来识别每个故事的主题和概念,以及其他指示符,例如上下文线索和动词选择。

“我们意识到这必须分步进行,”唐尼补充道。下一步-增强AI工具识别虚假和误导性信息或“假新闻”(而不是简单的有偏见的新闻)的能力是一项重大任务。
新闻来源是否值得信赖?

根据唐娜(Donnay)的说法,“假新闻与确定偏见的框架在结构上有所不同”,因为识别伪造涉及区分“可信赖”和“不值得信赖”的新闻来源,以及事实,谎言,谣言和影射。唐娜承认:“确定新闻的准确性非常困难。”他补充说,新闻报道的框架本身会产生固有的偏差,理解这一点是朝着更加平衡和值得信赖的新闻迈出的重要的第一步。

唐纳伊说,他希望在明年某个时候开发一个原型网站,但仍有很多工作要做。对于初学者来说,需要进行精确神经建模所需的数据集。需要对跨域和来源的新闻进行广泛采样;并且由人类完成的编码质量需要始终保持较高水平。

即使新闻汇总网站Donnay设想最终可以运行,也无法保证人们会相信它的判断。如果该网站使用英语以外的其他语言版本,那么它也将作为全球资源更有用,但这对另一天也是一个挑战。

“在2021年,一旦一切完成,我们计划使用最终工具进行大规模实验,”唐尼说。他解释说,这就是实验的“社会科学”部分,在这一部分中,读者对AI选定的内容做出反应,并报告他们是否能够分辨出事实的表达方式。

当然,要找到有关新闻的“真相”可能要问的太多了,但是朝着基本达成事实的方向迈出的任何一步都是朝着正确方向迈出的一步。

 

 

sodoai.com 翻译自:thomson reuters

版权保护: 本文由 首页 原创,转载请保留链接: http://www.sodoai.com/news/26.html