# AI及信息技术应用2023年11月26日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，能够执行通常需要人类智能才能完成的任务，如视觉识别、语言理解和决策制定。

## 2. 核心洞察 (TL;DR)
- Inflection推出新型语言模型Inflection-2，性能仅次于GPT-4。
- 百度文心一言实现盈利，用户数达7000万。
- 微软中国将推出Web AI聊天功能Copilot，保障数据安全和隐私。

## 3. 关键事实与数据
- 关键事实1: Inflection-2在多项标准AI性能测试中表现出色，但在编程和数学任务上仍不如GPT-4。
- 关键事实2: 百度文心一言在3个月内积累了7000万用户。
- 关键事实3: 微软Copilot服务具有商业数据保护功能，并确保数据隔离，保证数据不会泄露。

## 4. 深度分析正文


AI及信息技术应用2023年11月26日简报
======================

本周AI领域持续活跃，Inflection推出新型语言模型Inflection-2，百度文心一言取得突破，ANTHROPIC升级Claude AI，微软中国即将发布Web AI聊天功能Copilot，Meta推出Emu Video AI视频生成项目，Microsoft展示定制AI芯片。在产品创新方面，OpenAI提供ChatGPT语音功能，Devv Search面向开发者的AI搜索引擎，Pitch 2.0支持AI创建PPT。监管合规上，Meta解散Responsible AI团队，欧洲三国达成AI监管协议，亚马逊调整Alexa团队职位，WPS隐私政策更新引发争议。

1，AI产研应用

深度学习先驱推出新型语言模型 Inflection-2，仅次于 GPT-4

\[摘要\]由LinkedIn联合创始人里德·霍夫曼、DeepMind联合创始人穆斯塔法·苏莱曼和前DeepMind研究员卡伦·西蒙扬创立的AI初创公司Inflection开发了新型语言模型Inflection-2。该模型被认为在性能上超越了直接竞争对手，如Google的PaLM-2和Claude 2，仅次于GPT-4。Inflection-2展示了更好的事实知识、风格控制和推理能力。它在多项标准AI性能测试中表现出色，但在编程和数学任务上仍不如GPT-4。Inflection计划用更大的AI模型继续研发，并已获得微软、比尔·盖茨和英伟达等投资者的大额投资，公司估值达40亿美元。

百度最新季度财报超预期，对标ChatGPT，文心一言已实现盈利

\[摘要\]创始人李彦宏对中国「百模大战」发出警告，百度的文心一言在公开推出3个月后就积累了7000万用户，该公司声称其自主开发的模型在通用能力方面已与GPT-4相匹配。百度创始人李彦宏表示，Ernie现在每天处理数千万条查询，而数千家企业正在使用百度的服务。

ANTHROPIC 让 CLAUDE AI 更有用

\[摘要\]随着 OpenAI 面临领导层动荡，Anthropic 更新了其 Claude 聊天机器人的新功能。最新的 Claude 2.1 可以处理多达 200,000 个令牌，是其先前上下文窗口的两倍。这在行业中处于领先地位，并超过了 GPT-4 的极限。Claude也会减少幻觉，使用计算器等工具，并支持持续的指令。

微软中国将于12月1日推出面向企业和教育机构的Web AI聊天功能Copilot

\[摘要\]微软中国宣布，从12月1日开始，将为中国大陆的企业和教育机构推出Web AI聊天功能Copilot，此前称为Bing Chat Enterprise。这项服务将支持Windows Copilot、Bing Chat Enterprise和Microsoft Edge中的Copilot。适用的微软许可证包括Microsoft 365 E3、E5、商业标准版、商业高级版、A3、A5和F3（后续将支持）。订阅上述许可证的企业和教育机构可以免费使用Copilot，该服务具有商业数据保护功能，并确保数据隔离，保证数据不会泄露，微软也不会用这些数据进行模型训练，从而保障了数据安全和隐私。

Meta发布了Emu Video AI视频生成项目

\[摘要\]Meta发布了一个比较强大的AI视频生成项目和编辑工具，Emu Video 和 Emu Edit。Emu Video：可以响应各种输入：仅文本、仅图像以及文本和图像。将这个过程分为两个步骤：首先，根据文本提示生成图像，然后根据文本和生成的图像生成视频。这种“分解”或分割方法可以有效地训练视频生成模型。Emu Edit：旨在简化各种图像处理任务，并为图像编辑带来增强的功能和精度。能够通过指令进行自由形式编辑，包括本地和全局编辑、移除和添加背景、颜色和几何变换、检测和分割等任务。比较强的是可以精确地遵循指令，确保输入图像中与指令无关的像素保持不变。

通过芯片的系统方法，Microsoft旨在定制“从芯片到服务”的一切，以满足AI需求

\[摘要\]在Microsoft Ignite上，该公司推出了两款定制设计的芯片和集成系统：Microsoft Azure Maia AI加速器，针对人工智能（AI）任务和生成式AI进行了优化，以及Microsoft Azure Cobalt CPU，这是一种基于Arm的处理器，专为在Microsoft云上运行通用计算工作负载而设计。这些芯片是Microsoft提供基础设施系统的最后一块拼图，其中包括从芯片选择，软件和服务器到机架和冷却系统的所有内容，这些系统从上到下设计，可以根据内部和客户工作负载进行优化。

StyleTTS 2：一个开源的媲美 Elevenlabs 的文本转语音工具

\[摘要\]StyleTTS 2是一种先进的文本到语音合成技术，能生成多样化、自然的语音。它利用风格扩散和对抗性训练，结合非自回归架构和风格编码器，实现高效、高质量的语音生成。该技术能从文本和风格向量直接生成音频，具有自然度高、适应不同说话者等特点，在多个测试中表现出色，语音质量接近真人录音。

引入混合检索（Hybrid Search）和重排序（Rerank）改进 RAG 系统召回效果

\[摘要\]9 月份时，Microsoft Azure AI 在官方博客上发布了一篇《Azure 认知搜索：通过混合检索和排序能力超越向量搜索》，文章对在 RAG 架构的生成式 AI 应用中引入混合检索和重排序技术做了完整的实验数据评估，量化了该技术组合对改善文档召回率和准确性方面的显著效果。以下是针对不同查询情景的评估结果，也可以看到在各个用例情景下，混合检索+重排序在不同程度上提升了文档召回的质量：我们讨论论了在 RAG 系统中引入混合检索和语义重排序对于改善文档召回质量的原理和可行性，但这涉及到的还仅仅是 RAG 检索管道设计中的一部分环节。

高效截图转代码项目：GPT-4 Vision 与 DALL-E 3 的创新应用

\[摘要\]GitHub 上的项目 "screenshot-to-code" 展示了如何利用 GPT-4 Vision 和 DALL-E 3 技术，将设计稿或网页截图转换成 HTML 和 Tailwind CSS 源码，实现高度还原。项目的核心机制意外地简单，表明 ChatGPT 已足以高效完成截图转代码工作，效率提升达到1000倍。项目作者为方便体验，还开发了一个网页，用户通过输入 OpenAI Key 即可亲身体验整个转换过程。

xAI计划下周推出GROK

\[摘要\]埃隆·马斯克 （Elon Musk） 的新公司 xAI 将于下周为 X Premium+ 订阅者推出 ChatGPT 的竞争对手 Grok。Grok 将直接集成到 X（以前称为 Twitter）中，并拥有其选项卡。Grok 与 ChatGPT 不同，拥有独特的个性和对 X 知识的实时访问。这项高级功能附带价格更高的 X Premium+ 订阅，每月收费 16 美元，是标准费用的两倍。用户可以提供反馈来训练 Grok，从而改进其答案。

2，产品创新

OpenAI 为所有免费用户提供语音 ChatGPT

\[摘要\]ChatGPT 语音功能——该功能于 9 月宣布，几周前开始向 OpenAI 的人工智能聊天机器人 ChatGPT 的高级订阅者推出——由文本转语音模型提供支持，该模型可以从文本和几秒钟的采样语音中生成类似人类的声音。OpenAI表示，它与成熟的配音演员合作，创造了五种不同的声音，其开源的Whisper语音识别系统用于将口头话语转录为文本。

Simplescraper-为自定义 GPT 从网站提取数据

\[摘要\]一种允许用户轻松从网站提取数据并将其转换为 JSON 或 CSV 文件的工具。想要在不雇用人员的情况下扩大规模的初创公司

Devv Search：面向开发者的AI搜索引擎

\[摘要\]Devv Search 是一款面向开发者的 AI 搜索引擎，基于文档、代码、实时搜索数据从零到一构建了一套高效、准确的 RAG 系统，底层的模型基于微调后的 Code Llama 和 GPT-3.5。

Pitch 2.0：支持AI创建PPT

\[摘要\]要在主页或应用程序内使用免费生成器，只需输入提示，选择调色板和字体，瞧，空白幻灯片在几秒钟内就会神奇地填充。您可以获得与我们人工制作的模板相同的设计质量和吸引力，但具有针对甲板结构、内容和布局的特定于主题的想法。生成任意数量的幻灯片，并快速可视化不同的幻灯片选项、字体和配色方案，然后再进行更自定义的编辑。

Discord 已经扼杀了其实验性 OpenAI 聊天机器人 Clyde

\[摘要\]Discord 在其 AI 聊天机器人 Clyde 首次推出不到一年后就拔掉了它的插头。Clyde 的支持页面已更新，并添加了一条说明，提醒用户该机器人将在本月底停用。该平台早在三月份就宣布了 Clyde，将其描述为一项实验性功能。它由 OpenAI 技术提供支持。

赋予声音以想象：MiniMax语音大模型优势及能力介绍

\[摘要\]MiniMax推出了一款创新的语音大模型，超越传统语音合成技术。该模型能够深度理解人类语言，精准捕捉并学习数千种音色特征，并自由组合，创建多样的声音变体、情感和风格。它熟练掌握8种语言，已在多个商业应用和场景中实现落地，如星野APP、起点、高途等。MiniMax语音大模型的亮点包括超自然高保真的语音表现、多样化高延展的音色特性，以及低成本高效率的操作。它可以在无需专业录音设备的情况下快速复刻语音，适用于多元场景。MiniMax提供了丰富的服务和交付形式，如公有云API、独占云端算力等，满足不同用户需求。

3，监管与合规

Meta悄悄解散了Responsible AI团队

\[摘要\]据报道，Meta 已解散其 Responsible AI (RAI) 团队，因为它将更多资源投入到生成人工智能领域。据报道，大多数 RAI 成员将转移到该公司的生成式 AI 产品团队，而其他成员将在 Meta 的 AI 基础设施上工作。该公司经常表示希望负责任地开发人工智能，甚至专门设立了一个页面来阐述这一承诺，其中该公司列出了其“负责任的人工智能的支柱”，包括问责制、透明度、安全性、隐私等。

德国、法国和意大利达成人工智能协议

\[摘要\]德国、法国和意大利已就人工智能监管框架达成一致，重点关注人工智能基础模型的“通过行为准则进行强制自我监管”。该论文建议人工智能开发人员使用模型卡来提供有关其模型的详细信息，包括其功能和局限性。这种方法强调对人工智能应用程序的监管，而不是技术本身，认识到风险与人工智能系统的使用方式更相关，该论文建议人工智能治理机构制定指导方针并监督这些模型卡的应用，但最初，不会实施任何制裁。

亚马逊裁掉数百个 Alexa 工作岗位

\[摘要\]亚马逊刚刚削减了该公司 Alexa 团队的“数百个”职位，理由是优先事项发生变化以及对生成人工智能的关注。随着生成式人工智能引入更智能的技术，已有十年历史的 Alexa 感觉被抛在了后面，让旧设备看起来很原始。

WPS隐私政策更新引发争议

\[摘要\]WPS近期更新隐私政策后，提及将用户上传文档用于AI训练，引起用户隐私泄露担忧。WPS官方回应称已修改政策，去除误解内容，强调不会在未经同意下使用用户文档于AI训练，承诺遵守隐私保护法律。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20231126-ai20231126](https://www.haxitag.com/briefs/ai-brief-20231126-ai20231126)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。