我之前写的内容虽然可以被认为是猜测,但很可能是真实的。,也可能不是真的,所以请持保留态度。 DeepMind 和 Google 搜索 2014年,谷歌收购了一家专门研究学习系统的公司,名为DeepMind。我不禁想到,谷歌使用它的一些技术及其技术的演变来改进其搜索算法——这就是 RankBrain 的机器学习过程。
这篇文章于去年
月发表在 上,详细介绍了没有正确格式的数据库如 whatsapp 数据库 何成为准确的机器和深度学习过程的最大障碍之一。没有它,神经计算(机器和深度学习的背后)就无法工作。 就语言而言,如果没有上下文,那么拥有“大量书面语言”是不够的,特别是如果在搜索中不使用 n-gram 以便机器能够理解它的话。
然而和他的一些 DeepMind
同事在本文中描述了他们如何能够在独立于主要新闻机构的 内容营销是任何营销策略 经典“新闻亮点”中发现他们正在寻找的注释类型。 请允许我引用《技术评论》的文章来解释他们的实验: 赫尔曼和他的同事通过用通用描述替换句子中的参与者来匿名化数据集。
《每日邮报》的部分原文示例如下:
“据称受到杰里米·克拉克森攻击的 BBC 制片人的律师周 資料庫數據 五表示,不会对《Top Gear》主持人提出指控。克拉克森是世界上收视率最高的电视节目之一的主持人,英国广播公司的内部调查发现,克拉克森对制片人奥辛·泰蒙进行了“无端的身体和言语攻击”,周三被 BBC 解雇。
该文本的匿名版本如下:
据称遭到 ent212 攻击的 ent381 制作人不会对“ent153”主持人提出指控,他的律师周五表示。 ent212 是世界上收视率最高的电视节目之一的主持人,在 ent180 广播公司的内部调查发现他对制作人 ent193 进行了“无端的身体和言语攻击”后,周三被 ent381 解雇。
通过这种方式可以将以下
用于识别 X 的完形填空型查询从“生产者 X 不会对杰里米·克拉克森提出指控,他的律师说”转换为“生产者 X 不会对 ent212 提出指控,他的律师说”。 所需的答案从“Oisin Tymon”更改为“ent212”。
这样匿名演员只能通过
对故事中实体之间的语法联系和因果关系的某种理解来识别。 使用《每日邮报》,Hermann 能够向 DeepMind 深度学习机器提供大量有用的数据集,从而对其进行训练。训练结束后,计算机能够正确回答高达 60% 的问题。 我们可能会想,这个比例并不大。