到目前为止,您可能已经意识到在ChatGPT中使用机密公司数据并不是一个很好的主意。公司商业机密和知识产权的可能泄露是一个巨大的问题,即使是像苹果、亚马逊和三星这样的科技巨头也限制或完全禁止员工使用这个流行的人工智能服务。
当您使用ChatGPT时,您向ChatGPT背后的OpenAI公司明确同意使用您的互动数据,包括您输入的问题和服务返回的响应,用于他们自己的用途。由于这包括使用您的数据来训练ChatGPT的未来版本,因此存在公司机密被ChatGPT响应泄露的风险。(太可怕了!)在这里阅读他们的数据使用政策的详细说明。
微软Azure发布了一种解决方案,可以在客户自己的云环境中部署类似ChatGPT的应用程序。这将为员工提供访问安全和符合数据隐私规定的聊天助手,他们实际上可以用于工作——无论是生成、总结还是翻译包含专有信息的文本,校对机密电子邮件,编写或解决内部代码库中的代码错误以及其他各种可以帮助提高员工生产力的任务。
该解决方案是一个Web应用程序,利用API调用大型语言模型(LLM),如原始的ChatGPT(或gpt-3.5)和gpt-4。可以使用笔记本电脑和移动设备上的浏览器访问该应用程序。该应用程序由微软开源,采用非常宽松的许可证,包括商业使用。GitHub存储库可以在此处找到。它提供了一键部署到客户自己的Azure订阅中的应用服务。
Azure ChatGPT在功能上几乎与“零售”ChatGPT相当。它包括用户聊天历史记录、深色模式以及根据查询上下文格式化的响应,例如列表、表格、图表、代码片段、JSON、CSV等。它与Azure Active Directory(AD)集成捆绑在一起,作为用户认证的主要方法,因此对于那些已经在使用带有AD的Office365的微软客户来说,这是一种即插即用的部署。
安全和隐私
首先,让我们谈谈用户数据的安全性,因为这是这个解决方案的主要价值主张。
该应用程序调用的LLMs是ChatGPT中使用的相同模型(gpt-3.5/gpt-4),但它们托管在Azure数据中心中,利用Azure自己的计算资源进行推理(例如GPU)。
相比之下,零售ChatGPT使用的模型驻留在OpenAI服务器上。
因此,任何用户数据,如问题和机器人的响应,都不会经过任何OpenAI渠道,而是仅驻留在Azure环境中。Azure OpenAI数据隐私政策明确表示,用户数据不会与OpenAI共享,也不会用于训练未来的OpenAI模型。(见下文)
每个用户的聊天历史记录存储在安全的Azure存储(称为Azure Cosmos DB)中,位于客户自己的云环境中,并受到严格的数据隐私政策的保护。在Cosmos DB中存储的数据支持冗余选项,可以将数据备份到全球多个Azure数据中心。
功能
聊天历史记录
聊天历史记录存储在Azure Cosmos DB中,每个唯一用户帐户都有一份。
支持的响应格式
以下是我迄今为止尝试过的支持的输出格式。(可能还有其他格式。)
- 列表
2. 表格
3. 代码
4. 计分卡
5. JSON
6. CSV
7. SVG
深色模式
与“零售”ChatGPT的比较
“高级”功能,如插件、自定义指令和代码解释器,在此解决方案中尚不可用。
该应用程序仅使用 Azure OpenAI 模型的 API 调用,不会部署自托管模型到客户自己的云环境。客户根据使用的模型和令牌消耗量进行计费。