# AI及信息技术应用2022年5月16日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，能够感知环境、学习、推理、解决问题和执行任务。

## 2. 核心洞察 (TL;DR)
- DeepMind的Gato智能体能够执行600多项任务，具有多模态、多任务、多具身特点。
- 深度学习模型可实时检测多种视网膜疾病，提高欠发达地区早期诊断水平。
- 中国将在西藏使用AI和3D打印技术建造水电站，机器人将充当巨型3D打印机。

## 3. 关键事实与数据
- 关键事实1: Gato智能体能够执行600多项任务，包括玩游戏、控制机器人等。
- 关键事实2: 深度学习模型在眼底图像检测视网膜异常方面准确率高达95%。
- 关键事实3: 西藏水电站项目预计在两年内完成，使用AI驱动的机器人建造。

## 4. 深度分析正文


AI及信息技术应用2022年5月16日简报
=====================

本周Google I/O 提供很多 AI 应用的案例，都是多种AI 能力集成应用。AI 算法应用上 DeepMind 的 AI 智能体 Gato、以色列AI21 Labs 宣布了其MRKL 系统提供了语言模型融合知识库的新用法，外接知识库、实时信息跟语言模型算法能力实现更准确的信息输出、意图理解和知识应用服务。

**01＃AI应用**

**DeepMind「通才」AI智能体Gato来了，多模态、多任务，受大语言模型启发**

\[摘要\]:受大规模语言建模的启发，Deepmind 应用类似的方法构建了一个单一的「通才」智能体 Gato，新AI可以执行600多项任务，从玩游戏到控制机器人它具有多模态、多任务、多具身（embodiment）特点。Gato 可以玩雅达利游戏、给图片输出字幕、和别人聊天、用机械臂堆叠积木等等。此外，Gato 还能根据上下文决定是否输出文本、关节力矩、按钮按压或其他 token。

**AI模型可以实时准确检测多种视网膜疾病**

\[摘要\]:在JAMA Network Open上发表的一项研究中，研究人员开发并验证了一种 DL 模型，该模型可以使用眼底图像检测视网膜异常。然后，他们评估了该模型是否可以有效地应用于临床环境。研究人员指出，视网膜和视神经疾病是全球不可逆视力丧失的最常见原因之一。这些疾病的诊断需要有经验的眼科医生。然而，这些临床医生的分布因地区而异，欠发达地区通常很少有眼科医生可以筛查个体的视网膜疾病迹象。一项新的研究表明，深度学习算法可以同时识别多个视网膜异常，这有助于提高欠发达地区视网膜疾病的早期诊断水平。

中国将在西藏建造人工智能驱动的3D打印水电站

\[摘要\]:青藏高原的一个新项目旨在通过人工智能 (AI) 和 3D 打印在短短两年内建造一座水电大坝。据报道，大坝将完全由人工智能驱动的机器人建造，机器人将充当巨型3D打印机，逐层建造180米的结构。虽然该项目使用的确切增材制造工艺的细节很少，但参与该项目的科学家表示，该技术已经足够成熟，可以用于大规模“大型、填充的基础设施”应用。

研究人员教人工智能写葡萄酒和啤酒评论，他们很有说服力

\[摘要\]:《科学美国人》 报道称，研究人员使用发表在《葡萄酒爱好者》杂志上的大约 125,000 条评论来训练他们的程序并教它通常如何撰写葡萄酒评论。他们还通过来自RateBeer网站的超过 140,000 条评论重复了这一过程。AI 使用这些评论，以及每种饮料的酿酒厂或啤酒厂、ABV 和成本的详细信息，开始生成自己的评论。他们能够创建一种人工智能(AI) 算法的原因之一，该算法可以编写自己的葡萄酒评论，尽管他们从未喝过一杯酒。“这只是一个非常独特的数据集，”达特茅斯计算机工程师 Keith Carlson 告诉媒体。“人们以同样的方式谈论葡萄酒，使用相同的词组。

UiPath 推出下一代 UiPath 自动化，以在最新平台版本中扩展自动化领导地位

\[摘要\]:作为 UiPath 2022.4 平台版本的一部分，领先的企业自动化软件公司UiPath推出了 Automation Cloud Robots 以及许多其他强大的新功能。新版本为企业提供了更全面的自动化基础，以实现快速准确的结果。新的 SaaS 机器人以及可简化开发人员创建自动化、升级安全性和治理以及将自动化访问扩展到 Mac 的附加功能，加深了企业自动化的覆盖范围。

**微软 AI 研究人员开发 MoLeR：一种基于深度学习的生成模型，可实现高效的药物设计**

\[摘要\]:研究人员提到，虽然 MoLeR 没有“分子优化”的概念，但可以使用现成的黑盒优化方法在潜在代码空间进行优化。他们在这项工作中使用了分子群优化 (MSO)，因为它为其他模型中的潜在空间优化产生了最先进的结果。他们的研究结果表明，它也适用于 MoLeR。该团队使用 MSO 和 MoLeR 在新的基准任务上测试了优化，这些任务类似于涉及巨大支架的真正药物发现项目，并发现这种组合优于当前模型。 

Unlearn.AI在 Insight Partners 领投的B轮融资中筹集了 5000 万美元

\[摘要\]:Unlearn.AI 使用从客户记录中获取的全面纵向数据来创建人工智能驱动的模拟或“数字双胞胎”，可以预测临床试验期间使用的药物的效果。该公司由物理学家 Charles Fisher（现任 CEO）、Aaron Smith 和 Jon Walsh 于 2017 年创立。筹集的资金将用于壮大公司团队并开始临床试验。Unlearn.AI 希望其“数字双胞胎”技术可以帮助预测药物试验如何影响患者的结果，进而加快试验过程。

“宜家机器人”背后的团队 Eureka Robotics 获得 425 万美元

\[摘要\]:Eureka Robotics 的产品基于新加坡南洋理工大学和麻省理工学院的研究。它专注于机器人软件和系统，以自动化需要高精度和高敏捷性 (HAHA) 的任务。其机器人用于精密搬运、组装、检查、钻孔和其他任务。这笔资金将用于加速公司旗舰产品 Eureka Controller 的开发，该产品允许工厂在系统集成商和工厂中部署 HAHA 任务。

Evisort 是一家使用 AI 分析和管理企业合同的初创公司，该公司表示已在 TCV 牵头的融资中筹集了 1 亿美元

\[摘要\]:Evisort 的人工智能技术解析法律语言的含义和上下文，以自主管理端到端的合同流程。该公司表示，其 AI 算法接受了超过 1000 万份合同和数十亿个数据点的训练。结合工作流和文档管理解决方案，Evisort 表示，它现在向 150 多个商业客户提供其功能，包括 Microsoft 和 Keller Williams。其收入专门通过软件许可获得。

Hyphen 在以 Tiger 为首的 A 轮融资中筹集了 2400 万美元，用于自动化餐厅生产线

\[摘要\]:Hyphen 的机器人系统，简称为 The Makeline，餐厅的厨房装配线使餐饮服务团队能够快速协作地准备比萨饼、墨西哥卷饼和潜艇等物品。Makeline 有两个部分：一个是人类手动准备订单的顶部，一个是自动组装碗、沙拉和类似物品的下部。后者专门用于履行通过餐厅网站或应用程序或第三方送货服务下达的数字订单。在传感器的帮助下，The Makeline 使用基于人工智能的视觉来监控订单的部分质量、准确性和大小。Hyphen 联合创始人兼首席执行官 Stephen Klein 告诉AFN ，该系统还监控其“精确到克”的成分库存。当配料用完时，Makeline 会提醒厨房，以便工作人员可以重新装满托盘。

**以色列人工智能公司 AI21 Labs 宣布了其MRKL 系统，以使用天气应用程序等外部知识源增强大型语言模型**

\[摘要\]:AI21 Labs 既是研究实验室，也是提供自然语言处理(NLP) 服务的商业企业。在 Udacity 创始人 Sebastian Thrun 的建议下，AI21 Labs 由 Crowdx 创始人 Ori Goshen、斯坦福大学教授 Yoav Shoham 和 Mobileye 首席执行官 Amnon Shashua 于 2017 年共同创立。该公司表示，其使命是通过让人工智能成为人类的思想伙伴来改变和塑造人们阅读和写作的方式。AI21 Labs 开发了 Wordtune 和 Wordtune Read 等 AI 语言应用程序，具有生成自然语言和理解含义的能力。MRKL 系统 Jurassic-X 的首次实施包括不同的语言模型，并通过天气应用程序和 Wikidata 等外部知识源进行扩充。“预训练的语言模型不可能跟上动态信息，例如波动的汇率、天气预报，以及不断更新维基数据等来源。通过这种方式，当前的语言模型无法发挥其真正的潜力：一个通用的自然语言界面，它接收与实时目的相关的各种自然语言输入，并以自然语言类似地回复， ”肖汉姆说。

客户服务自动化初创公司 Lang 获得 1500 万美元

\[摘要\]:Lang.ai 是一家初创公司，它开发了一个自动标记客户对话的平台，以更快地解决服务问题。通过将智能应用于服务交互，Penalva 断言像 Lang 这样的技术可以提供有价值的见解来指导产品体验和策略。Lang 将努力确定将支持对话与购买数据联系起来的方法，例如，确定有特定问题的人继续购买产品的可能性。Lang 平台的未来版本将根据代理通常执行的操作为客户服务团队提供自动化建议。

DeepMind 为核聚变研究设备训练 AI 控制器

\[摘要\]:DeepMind 团队设计了一个使用 AI 设计托卡马克控制器的三步流程。首先，实验设计者为等离子体的各种特性提供一组客观值，例如电流、位置和伸长率。这些目标被转化为用于 RL 训练的奖励函数。RL 算法与模拟的托卡马克环境交互，并尝试为该奖励函数找到最佳控制策略。由于模拟环境的运行速度比典型的 RL 环境慢得多，DeepMind 使用称为最大后验策略优化(MPO) 的 actor-critic 算法优化了控制器策略。在这个方案中，critic 学习预测参与者行为的未来奖励，并且参与者使用这些预测来选择策略。由于参与者最终必须实时运行以控制物理托卡马克设备，因此团队使用了轻量级前馈网络。然而，critic 并没有那么受限，研究人员在那里使用了更大的循环神经网络 (RNN)，它可以模拟托卡马克复杂的基于时间的动力学。

**Hugging Face 估值达到 20 亿美元，打造机器学习的 GitHub**

\[摘要\]:Hugging Face已完成新一轮融资。这是一笔 1 亿美元的 C 轮融资，估值20 亿美元。Hugging Face 正在构建机器学习的 GitHub。这是一个社区驱动的平台，拥有大量的存储库。开发人员可以在 ML 模型、数据集和 ML 应用程序上创建、发现和协作，还提供托管服务，例如允许您通过编程接口使用数千个模型的推理 API，以及“自动训练”模型的能力。通过今天的融资，该公司计划做更多相同的事情；现在有 10,000 家公司以一种或另一种方式使用 Hugging Face，所以现在不是再次转向的时候。

多模态视频理解模型新标杆！微软黄学东团队发布 i-Code

\[摘要\]:预训练目标函数是掩码单元建模和对比学习目标的加权和：5实验我们在多模态情绪&情感分析、多模态推理、视频问答以及一些单模态任务上评估了 i-Code 模型的性能。i-Code 在预训练期间使用了以下双模态数据集：视觉-语言：使用来自 Florence 计算机视觉基础模型的预训练数据中的7,280 万对图像-描述文本对。2大规模多模态预训练数据视频中包含了视觉、语言、语音三种模态的数据。

**02＃产品市场创新**

Twitter的新政策强调了其打击垃圾邮件和重复推文的努力

\[摘要\]:Twitter 今天宣布，它正在推出一项新的“复制粘贴和重复内容”政策，以阐明该平台如何打击垃圾邮件和重复内容。就上下文而言，copypasta 是指多人尝试从原始来源复制内容并广泛共享。这家社交媒体巨头于2020 年 8 月首次透露，它将限制 copypasta 推文的可见性，现在正在强调它认为哪些违规行为以及采取了哪些措施来限制此类违规行为的可见性。违规示例是由单个帐户或多个帐户在推特上发布的相同或几乎相同的内容。另一个例子是 Twitter 认为会“破坏他人体验”的重复或复制粘贴的推文。Twitter 指出，它不会限制包含现有内容以及独特内容或评论的转推或推文的可见性。

谷歌将让你通过看屏幕与 Nest Hub Max 上的助手交谈

\[摘要\]:Nest Hub Max 的最新更新让您可以使用 Google 助理，而无需在每次请求之前说“Hey Google”，根据Google 助理副总裁 Sissie Hsiao的博客文章， Look and Talk 是一项可选功能，您需要同时开启Google 的 Face Match和Voice Match 技术才能使用它。来自 Look and Talk 交互的音频和视频将在设备上进行处理。

**谷歌在 I/O 2022 上的公告**

\[摘要\]:谷歌宣布了其最新的语言模型人工智能 LaMDA 2 突出的各种产品开发，该模型专为“对话应用程序”和“自然对话”而构建。Google Pixel 备受期待的 Pixel Watch 将于今年秋季发布，这标志着苹果消费硬件业务的强大竞争对手。谷歌宣布推出适用于 Android 和 Wear OS 的谷歌钱包，这将允许用户安全地存储信用卡、数字身份证、活动门票等。谷歌还展示了一副能够在对话中进行实时翻译的 AR 眼镜，可以把翻译功能通过 AR相结合，实现实时翻译和字母的显示，目前还没有关于这是否会成为人们可以购买的产品的详细信息。Google 还发布了 谷歌的带屏幕智能音箱Nest Hub，可以通过看它一眼实现唤醒而不是原来的喊唤醒词。

推特是如何失去名人青睐的？

\[摘要\]:在马斯克4月份在推特上发表了关于名人不活跃的言论后，一位用户回复说："在twitter上'推送你的想法'的成本对名人来说太高了，被取消的担忧使他们变成了被动的用户。"许多名人社交媒体经理说，该平台未能解决骚扰和虐待问题是他们放弃Twitter的主要原因。名人社交媒体战略家Morris说："Twitter正在变成Facebook的样子。

**03＃监管与合规**

Clearview AI 与 ACLU 达成和解，同意停止向大多数美国企业出售或免费提供其面部识别数据库访问权限   

\[摘要\]:来自 ACLU v Clearview 诉讼的重大新闻：该公司被永久禁止向美国企业 + 私人实体出售其面部识别工具的访问权限。它还被禁止在伊利诺伊州出售执法权至少 5 年。和解协议中存在例外情况：Clearview 仍可将其面部数据库出售给银行（根据伊利诺伊州法律例外）；Clearview 仍可将其面部识别算法出售给私营公司，而无需 20B+ 面部数据库。

**Google 向 300 多家欧盟出版商支付新闻费用，未来还会有更多**

\[摘要\]:欧盟版权规则，该规则要求谷歌和其他在线平台向音乐家、表演者、作家、新闻出版商和记者使用他们的作品付费。在谷歌最激烈的批评者中，新闻出版商长期以来一直敦促政府确保在线平台为其内容支付公平的报酬。澳大利亚去年强制支付此类款项，而加拿大上个月推出了类似的立法。谷歌将推出一个注册登记工具，该工具为出版商提供了一个扩展的新闻预览协议，允许谷歌显示片段和缩略图以收取许可费。

**英国监管机构的人工智能之路始于审计算法**

\[摘要\]:国监管机构组成的数字监管合作论坛 (DRCF) 于 4 月 28 日上周发布了两份文件，为企业提供了有关人工智能 (AI) 和机器学习 (ML) 的好处和风险以及如何实现审计算法。2021 年，英国政府发布了国家人工智能战略，制定了成为人工智能“超级大国”的计划。该战略包括创建国家人工智能研究和创新计划、人工智能标准中心（建立或合作制定国际标准）以及修改现有法律以纳入人工智能。政府还可以在今年晚些时候发布人工智能白皮书，这是制定法律的先决条件。然而，DRCF 可能已经开始帮助设计这个 AI 框架。这一联合监管机构的一个独特之处在于，它计划利用每个成员、金融行为监管局 (FCA)、竞争与市场监管局 (CMA)、信息专员办公室 (IC) 和电信监管机构 (Ofcom)，向利益相关者提供共同的回应——换句话说，来自监管机构的统一信息。这可能对企业特别有用，因为越来越多的监管机构发布了带有建议的指南，却没有意识到某些行动可能会对其他监管机构的领域产生影响。例如，更高的算法透明度可以提供更大的竞争，但也可能引发数据保护问题。 

谷歌、微软和雅虎支持纽约禁止有争议的搜查令

\[摘要\]:包括谷歌、微软和雅虎在内的科技巨头联盟已承诺支持纽约的一项法案，该法案将禁止使用有争议的搜查令，该搜查令可以根据人们的位置数据和互联网搜索关键词来识别人。该法案如果获得通过，将成为第一个禁止所谓的地理围栏搜查令和关键字搜索令的州法律，这些搜查令依赖于要求科技公司交出犯罪现场附近用户的数据或搜索特定关键词的用户数据。具体时间点。但该法案自 1 月份提交给委员会讨论以来一直没有动议，这是考虑进行表决前的第一个主要障碍。执法部门要求地理围栏令并由法官签署，命令谷歌、微软和雅虎等公司从其用户的手机和应用程序中收集和存储数十亿个位置数据点，将其手机上的位置数据交出。在特定时间的特定地理区域，以帮助识别嫌疑人。关键字搜索权证以类似的方式工作，除了法官命令像谷歌这样的搜索巨头交出在特定时间搜索某些关键字的用户记录。

上海高院发布涉虚拟货币案例：比特币具备财产属性 适用财产权法律规则

\[摘要\]:上海高院在案例评析中指出，审判实践中，人民法院对比特币的法律定位形成统一意见，认定其为虚拟财产。

成都智算中心正式上线

\[摘要\]:同时，成都智算中心将结合国家新一代人工智能创新发展试验区、国家人工智能创新应用先导区在成都的落地，以及“东数西算”国家战略举措，承接人工智能生态发展、产业孵化和科研创新，在智慧城市、交通、医疗、遥感、金融等领域打造全国人工智能产业应用标杆，服务千行百业，助力智慧蓉城建设。成都智算中心由成都高新区、郫都区与华为公司共同建设运营，包括人工智能算力平台、城市智脑平台和科研创新平台三大平台，将承接人工智能生生态发展、产业孵化和科研创新，服务千行百业，推动成都高质量发展。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20220516-ai2022516](https://www.haxitag.com/briefs/ai-brief-20220516-ai2022516)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。