# AI及信息技术应用2024年5月5日简报

## 1. 核心定义
> 人工智能技术，通过模拟、延伸和扩展人的智能，实现数据分析和处理、问题解决、决策支持等功能。

## 2. 核心洞察 (TL;DR)
- Chat2DB平台简化数据查询和处理，非专业人士也能轻松探索和分析数据。
- 谷歌Med-Gemini医疗模型在多模态理解和临床推理方面超越GPT-4。
- LinkedIn客服问答系统结合知识图谱和RAG技术，提升问题解答准确率至94%。

## 3. 关键事实与数据
- Chat2DB平台已吸引超过100万开发者使用，通过开源项目Chat2DB-SQL-7B提供高级AI模型。
- Med-Gemini在MedQA测试中准确率达到91.1%，比之前模型高出4.6%。
- LinkedIn客服问答系统在MRR和BLEU分数上分别提高了77.6%和0.32。

## 4. 深度分析正文


AI及信息技术应用2024年5月5日简报
====================

上周在AI产业及应用研究领域，近期的动态表明了人工智能技术的多方面进步和应用拓展。Chat2DB平台通过其AI技术简化了数据查询和处理，使得非专业人士也能轻松探索和分析数据。谷歌的Med-Gemini医疗模型在多模态理解和临床推理方面取得了显著成果，其性能在多个医疗基准测试中超越了GPT-4。LinkedIn的客服问答系统通过结合知识图谱和RAG技术，显著提升了问题解答的准确率，而微软的PHI-3-MINI模型则展示了在移动设备上运行大型语言模型的潜力。

数据隐私和保护方面，内华达州和科罗拉多州通过新的法案来加强个人数据的保护。在商业应用方面，Amazon Q和MyShell OpenVoice V2等工具的推出，体现了AI在提升工作效率和个性化体验方面的应用。Atlassian的Rovo智能助手和Meta AI的CyberSecEval 2则分别在工作流程自动化和AI安全风险评估方面取得了进展。

此外，金融领域也见证了AI技术的影响，摩根大通的IndexGPT工具利用GPT-4模型为投资者提供主题投资篮子，而Nexus AI交易机器人则结合了AI算法和量子计算能力。在游戏行业，Steam平台上约1000款游戏采用了生成式AI技术，突显了AI在创意领域的潜力。同时，谷歌在降低AI答案生成成本方面的成功，预示着搜索结果质量和效率的提升。

合规和监管方面，乌克兰外交部引入AI发言人，微软禁止美国警方使用其面部识别服务，美国国家档案管理局对ChatGPT的访问限制，以及8家地区性报纸对OpenAI和微软的版权争议，都反映了AI技术在发展中面临的法律和伦理挑战。微软对印尼人工智能发展的投资，则显示了全球范围内对AI技术基础设施建设的重视。

产品市场创新方面，谷歌Chrome的新快捷方式和Meta AI的免费聊天机器人服务，进一步将AI技术集成到日常应用中。QueryPal、Vidu、My AI聊天机器人和ChatGPT的临时聊天功能，都是AI技术在提升用户体验和个性化服务方面的体现。苹果计划中的智能搜索功能，预示着AI将在提升网络浏览效率方面发挥作用。

综上所述，AI技术正以前所未有的速度渗透到社会的各个层面，从提高工作效率到增强用户体验，从金融交易到游戏娱乐，AI的应用前景广阔。同时，随着技术的不断发展，相关的隐私、版权和监管问题也日益凸显，需要行业、政府和社会各界共同努力，确保AI技术的健康发展。

**1，AI产业及应用研究  
  
**
---------------------

Chat2DB：让普通人轻松处理数据的AI平台  
\[摘要\]：Chat2DB是一个AI驱动的数据开发和分析平台，旨在让普通人无需专业技能也能处理和查询数据。通过自然语言处理技术，用户可以轻松探索数据、发现有用信息，并做出基于数据的决策。该项目已吸引超过100万开发者使用，并通过开源项目Chat2DB-SQL-7B提供高级AI模型，将自然语言查询转换为SQL语句，提高了数据利用的效率和普及程度。

Med-Gemini：谷歌医疗人工智能建模的突破  
\[摘要\]：谷歌发布了基于Gemini架构的Med-Gemini医疗模型，在临床推理、多模态理解和长文本处理方面表现出色。研究人员对Med-Gemini进行了14个医疗基准测试，结果显示其性能优异，明显超越了GPT-4。例如，在MedQA测试中，其准确率达到91.1％，比之前的模型高出4.6％。Med-Gemini不仅擅长处理医学图像、视频、心电图等多模态数据，还在文本任务中表现出色。它能够解读医学图像、回答相关问题，并从教学视频中理解手术步骤。此外，它能够迅速提取长篇医疗记录中的关键信息，在总结患者状况和起草转诊信等任务上甚至超过了人类医生。处理多种医疗数据类型，进行多模态医疗对话，甚至**在多模态任务中超越 GPT-4。**

LinkedIn推出创新客服问答系统，结合知识图谱与RAG，提升召回准确率至94%  
\[摘要\]：本文介绍了LinkedIn推出的一种创新型客户服务问答系统，该系统通过结合检索增强生成（RAG）和知识图谱（KG）技术，显著提升了问题解答的准确率。在采用历史客户服务问题单构建全面的知识图谱后，系统能够保留问题的内部结构和相互关系，从而在召回方面达到了86%至94%的准确率。实验结果表明，该方法在MRR（Mean Reciprocal Rank）和BLEU分数上分别提高了77.6%和0.32，显著超越了传统RAG方案。此外，该系统已在LinkedIn客户服务团队中实际应用近六个月，成功将问题解决时间缩短了28.6%。

微软的PHI-3-MINI模型可在手机上运行  
\[摘要\]：微软的Sebastien Bubeck代表团队在推特上宣布发布PHI-3-MINI模型，相当于ChatGPT 3.5性能的70%，足够小、足够快，可在手机上进行实时查询。这一消息显示了在移动设备上运行大型语言模型的可行性，将为实时查询和边缘计算带来新的可能性。

内华达州颁布数据隐私法，科罗拉多州加强数据保护力度  
\[摘要\]：内华达州通过了备受关注的数据隐私法案，借鉴了GDPR的一些理念，要求在处理敏感数据前获得同意。该法案将于2025年1月1日生效，但不包括私人诉讼权。然而，一系列例外情况削弱了其实际影响。与此同时，科罗拉多州加强了数据保护力度，以应对不断增长的隐私和安全挑战。

亚马逊推出基于生成式人工智能的代码助手Amazon Q  
\[摘要\]：亚马逊云科技发布了Amazon Q，这是一款基于生成式人工智能的代码助手，旨在简化软件开发生命周期的各个阶段。Amazon Q能够理解代码、AWS资源，并生成代码、解释功能、调试故障以及现代化改造旧代码。该服务已向开发者和企业提供预览版，以提升编码效率。

MyShell推出Introduce OpenVoice V2，多语言文本转语音模型  
\[摘要\]：MyShell发布了Introduce OpenVoice V2，这是一款能够模仿任何人声并支持多种语言发音的文本转语音模型。该模型具有广泛的语言支持和高度逼真的声音模仿能力，将为用户提供更加丰富和个性化的语音体验。

Atlassian推出智能助手Rovo，革新团队合作  
\[摘要\]：Atlassian在Team '24会议上推出了Rovo，一款先进的智能助手，可与Atlassian产品和第三方工具无缝集成。Rovo通过创新的Rovo Agent简化数据访问和工作流程自动化，实现自然语言交互，无需编程。这一举措将加强团队合作的连接性，并推动自动化任务的实现，彰显了Atlassian对团队协作的承诺。

Meta AI发布CyberSecEval 2，用于评估LLM安全风险和能力的新机器学习基准  
\[摘要\]：Meta研究人员推出了CyberSecEval 2，这是一种新颖的机器学习基准，用于量化LLM的安全风险和功能。该基准包括提示注入和代码解释器滥用测试，开源代码有利于其他法学硕士的评估。通过错误拒绝率（FRR）量化安全性与实用性的权衡，强调了法学硕士拒绝不安全提示的倾向，影响了实用性。CyberSecEval 2的细分测试集涵盖了逻辑违规和安全违规类型，涵盖了广泛的注入策略，并侧重于挑战性但可解决的漏洞利用场景。该基准确保对LLM的全面评估，促进了LLM开发和风险评估的稳健性。

摩根大通推出人工智能主题投资工具IndexGPT  
\[摘要\]：摩根大通开发了IndexGPT，采用OpenAI的GPT-4模型生成主题投资篮子。该工具识别新兴趋势，并通过关键字列表和NLP模型链接相关公司，扩大了股票选择范围。摩根士丹利也加大人工智能投入，提拔杰夫·麦克米兰领导AI工作。

NVIDIA的ChatRTX加入Gemma、ChatGLM3和CLIP模型，提升数据分析能力  
\[摘要\]：随着Google的Gemma、ChatGLM3和OpenAI的CLIP模型的加入，NVIDIA的ChatRTX正在加紧竞争。用户现在可以使用更强大的人工智能工具来分析个人数据和搜索照片。通过Whisper添加语音查询支持，ChatRTX正在成为RTX GPU用户的终极数据侦探。

Yelp推出新AI聊天机器人简化业务交流  
\[摘要\]：Yelp推出了iOS应用中的全新AI聊天机器人，帮助用户直接描述需求以便有效联系企业。借助OpenAI模型和Yelp数据，该助手将收集项目详细信息并匹配用户与服务提供商，简化了专业人员搜索过程。Yelp还计划通过“项目创意”和AI驱动的内容个性化功能增强用户参与度。

SafeBase获得3300万美元资金，利用AI改变软件安全审查  
\[摘要\]：SafeBase在Touring Capital领投的B轮融资中获得3300万美元，创始人Al Yang和Adar Arnon于疫情期间创建了该公司。作为Y Combinator成员，他们利用人工智能自动化软件采购安全调查问卷，简化了流程。SafeBase的平台采用专门的AI模型，旨在简化技术买家的治理和合规性。拥有客户群包括Palantir和LinkedIn，他们计划利用新资金扩大团队规模。

1000款Steam游戏采用生成式AI技术  
\[摘要\]：前Steam实验室开发者透露，约1000款Steam游戏现在都在角色设计和用户界面等方面采用生成式AI技术。该技术的快速普及反映了在游戏社区中的接受度和潜力，Valve的批准也证实了人工智能在游戏开发中的广泛应用。从艺术制作到配音，人工智能正在引领游戏领域的革命，为创意带来新的可能性。

谷歌人工智能答案生成成本降低80%  
\[摘要\]：谷歌成功降低了运行人工智能答案的成本，使投资者担忧的问题之一得到缓解。此举预示着谷歌在AI领域的技术进步，有望提高搜索结果的质量和效率。

Nexus AI以尖端技术彻底改变了交易  
\[摘要\]：首个旨在彻底改变金融市场的AI交易机器人Nexus AI现已正式推出。Nexus AI结合了尖端AI算法和先进量子计算能力，提供无与伦比的速度、准确性和盈利能力。该软件简单易懂，交易者可利用完全自动化的AI软件进行交易，无需复杂操作。利用先进算法和技术，Nexus AI分析市场趋势和数据，帮助投资者做出准确的交易决策，最大程度降低风险并最大化回报。

Synthesia推出全新的Expressive Avatars，开创AI支持的新时代  
\[摘要\]：Synthesia推出了全新的Expressive Avatars，这是由全生成的AI数字人类组成的新系列，由新的EXPRESS-1模型提供支持。这些数字人类不仅栩栩如生，还可以“理解”他们所说的内容，将人工智能技术推向了一个新的高度。

Proem AI：解答重要复杂问题的智能引擎  
\[摘要\]：Proem AI是一种由人工智能代理驱动的答案引擎，专门针对重要、复杂、技术和科学问题而设计。它利用先进的算法和深度学习技术，为用户提供高效、准确的解答，助力解决各领域的挑战。

OpenAI面临欧盟隐私投诉，指控未修复ChatGPT提供的不准确信息  
\[摘要\]：欧盟隐私组织NOYB代表“公众人物”向奥地利数据保护局提出投诉，指控OpenAI未能修复ChatGPT提供的错误信息，违反了欧盟GDPR和隐私法。OpenAI表示技术上无法纠正数据，而NOYB则要求调查OpenAI的数据处理方法，并敦促处以罚款以确保未来合规性。

**2，产品市场创新  
  
**
------------------

谷歌Chrome推出Gemini快捷方式，直接从地址栏启动AI对话  
\[摘要\]：谷歌Chrome推出了新的快捷方式，用户可通过在地址栏输入“@gemini”直接启动Gemini对话，无需导航至单独网站。这一功能与现有的快捷方式相融合，使人工智能聊天与其他浏览器功能无缝连接。Gemini扩展功能还将聊天机器人整合到地图、YouTube等应用程序中，但仅在支持的语言和国家/地区推出。

Meta AI推出免费AI聊天机器人服务  
\[摘要\]：Meta AI集成了新的Llama 3模型，免费提供AI聊天机器人服务，覆盖Meta旗下平台如Instagram和Facebook。然而，尽管具有广泛的可访问性，但其功能尚未脱颖而出，通常只提供基本搜索结果反馈。尽管马克·扎克伯格对其未来充满期待，但目前其存在的合理性仍受到质疑。

Anthropic推出企业“团队”计划，加强AI融合  
\[摘要\]：Anthropic推出了名为“Team”的企业订阅计划，特别针对医疗保健和金融等受监管行业。该计划提供了对Claude 3 AI模型的增强访问，以及额外

QueryPal：基于公司知识库，人工智能驱动的即时问答服务的创新  
\[摘要\]：在知识工作领域，我们的公司推出了一项革命性的服务——QueryPal，这是一个基于先进人工智能技术的即时问答系统。它能够从公司内部的丰富知识库中提供精确、即时的答案，极大地提升了知识检索和信息处理的效率。QueryPal不仅简化了用户获取知识的流程，还展示了人工智能在企业内部决策支持和知识管理中的巨大潜力。

神树科技发布 Vidu：中国创新的文本到视频生成器  
\[摘要\]：中国初创企业神树科技推出了 Vidu，一款创新的文本到视频生成器，能够模拟物理世界，并生成具有一致人物、场景和时间线的16秒视频。虽然比 OpenAI 的 Sora 更短，但 Vidu 代表了中国人工智能能力的重大进步。文章突出了 Vidu 从各种文本提示中生成逼真且引人入胜的视频的能力，展示了其在娱乐、教育和营销等领域的潜在应用。尽管处于早期阶段，但 Vidu 有望彻底改变视频内容创作，体现了中国在人工智能创新方面的进步。

Snapchat推出My AI聊天机器人，提供更多功能和个性化体验  
\[摘要\]：Snapchat推出了My AI聊天机器人，为用户提供更多功能，包括设置应用内提醒。此外，它还推出了可编辑的聊天、人工智能驱动的自定义Bitmoji外观、地图反应和表情符号反应。这一举措旨在提升用户体验，加强个性化互动，反映了Snapchat在AI技术应用上的持续创新和努力。

ChatGPT临时聊天功能：私密交流无历史记录  
\[摘要\]：现在，使用ChatGPT开始临时聊天吧，隐身匿名模式，这些聊天不会留下历史记录，也不与OpenAI共享内容。您可以选择不与整个ChatGPT共享数据，但仍然可以访问聊天历史记录，保障您的隐私和数据安全。

苹果计划在Safari浏览器中引入智能搜索功能  
\[摘要\]：苹果计划将“智能搜索”功能整合到其Safari网络浏览器中，利用自家设备上的人工智能技术来提取网页关键主题摘要。这一举措将使用户更轻松地获取网页内容要点，提升浏览体验。

**3，合规和监管**  

-----------------

乌克兰外交部引入AI发言人维多利亚·施，提升外交工作效率  
\[摘要\]：乌克兰外交部创新性地引入了一个由人工智能生成的女AI发言人——维多利亚·施（Victoria Shi）。这一举措在外交服务领域具有先锋性，她以数字形式提供预先编写好的人类声明的视觉表示。该AI发言人由The Game Changers开发，受到乌克兰歌手Rosalie Nombre的设计灵感，旨在提升外交工作的效率。维多利亚·施的亮相不仅展示了乌克兰对新技术的积极态度，也体现了对外交沟通和资源管理优化的追求。这一创新步骤将有助于乌克兰外交部更好地与世界各地的伙伴们保持联系和沟通。

微软禁止美国警方使用其 GenAI 进行面部识别  
\[摘要\]：微软已经明确表示，禁止美国警方利用 Azure OpenAI 服务进行面部识别。该决定是基于对执法技术中可能存在的幻觉和种族偏见等问题的担忧。尽管禁令严格适用于美国，但在受控环境中使用固定摄像头进行的国际面部识别不受影响。

美国国家档案管理局禁止ChatGPT访问，考虑替代方案  
\[摘要\]：美国国家档案和记录管理局（National Archives and Records Administration）通知员工，ChatGPT可能泄露机密数据，因此将禁止在机构发放的笔记本电脑上访问该聊天机器人。该机构正在考虑使用Microsoft Copilot或谷歌的Gemini来代替，以确保联邦机构的数据安全。这反映了对数据保护的严谨态度，也引发了对聊天机器人访问限制的讨论。

8家地区性报纸起诉OpenAI和微软，引发AI版权争议  
\[摘要\]：8家地区性报纸由Alden Global Group旗下起诉OpenAI和微软侵犯版权，引发AI在新闻领域的版权争议。尽管OpenAI与《金融时报》等达成交易，但与新闻出版商的关系仍不尽人意。

微软投资17亿美元推动印尼人工智能发展  
\[摘要\]：微软承诺投入17亿美元在印尼扩展云服务和人工智能，包括建立数据中心和培训250万名AI人才。这一举措将引领人工智能基础设施的发展，为该地区的科技进步注入新动力。

谷歌广告禁止深度伪造色情内容服务  
\[摘要\]：Google Ads、购物广告、Admob 和其他 Google Ads 产品很快将禁止深度伪造色情内容、合成露骨色情内容或包含裸露服务的合成内容。我的意思是，这似乎是他们以前应该禁止的事情，但现在围绕这些类型的内容的任何工具或服务都将被禁止。


---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20240505-ai202455](https://www.haxitag.com/briefs/ai-brief-20240505-ai202455)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。