盖亚智能 指南
欢迎使用 盖亚智能 指南!本指南将帮助您了解 盖亚智能 项目的各个方面,包括安装、配置和使用。
资源链接
介绍
欢迎使用 盖亚智能!本指南将帮助您了解 盖亚智能 的基本概念和使用方法。
什么是 盖亚智能?
盖亚智能 是一个开源的企业级AI应用平台,包括跨平台的客户端和企业级管理中心,旨在为企业提供全面的AI应用提供一站式解决方案,帮助用户更高效地构建AI应用。它具有以下特点:
- 企业级管理:提供企业级管理中心,支持多用户、多权限管理,模型集中管理和计费
- 高度可扩展:基于MCP协议的插件系统支持添加任意MCP Server
- 多Agent智能协同:支持多Agent,智能选择最优Agent执行任务
为什么选择 盖亚智能?
目前开源的chatbot类产品中,没有一个企业级的产品,更多是针对个人用户的。而盖亚智能 是针对企业级用户的产品,具有如下显著特点:
1. 企业级功能
基于golang开发的企业管理中心,提供如下核心企业管理功能:
- 企业用户管理,包括支持OAuth2.0、LDAP、钉钉等用户登录和信息管理。
- 大模型API授权管理,避免告知用户大模型API 秘钥。无需告知普通用户模型API秘钥,即可为普通用户提供模型服务。
- 计费和额度管理:支持对用户进行按月额度管理、对Agent API进行日额度和月额度双重控制。
- 各类企业级报表。
- 企业级插件市场、智能体市场等。
- 其他Agent平台代理,包括Dify、Coze等。
2. MCP 支持
国内第一个支持MCP模型上下文协议的企业级AI产品,包括:
- MCP 社区各类标准MCP Server运行。
- 企业内部系统API可以通过管理中心配置转化为标准MCP Server提供服务,且能控制权限。
3. Multi-Agent 智能协同
默认自带多Agent管理,主要如下:
- 所有Agent自动向量化存储。
- 用户提交问题时大模型自动重写问题后基于RAG检索相似度最高的Agent列表。
- 分类器自动选择最优的一个或多个Agent处理用户问题后响应。
4. 自然语言驱动的RPA
与传统RPA需要编写代码或需要录制脚本的模式不同,我们基于大模型的规划能力和电脑操作能力,直接将用户的需求转换为多个电脑操作步骤,操作过程与人操作电脑是类似的,而无需理解如网页源码之类的专业知识。
5. 可人工确认的ReAct操作
为解决企业场景中的大模型调用工具的风险,特别是直接向企业系统API提交数据的场景,我们引入了可进行人工确认的工具调用方式。
- 支持对MCP Server中的工具进行配置为需要人工确认。
- 需要人工确认的工具,在调用时,会自动根据参数类型渲染为对应的显示模式,如表单,且支持人工修改后确认提交再执行后继流程。类似Cursor编写代码中的人工确认流程。
6. Canvas支持
除前述支持动态渲染表单(即多种工具参数)外,还支持其他Artifacts场景自动适配,主要如下:
- 代码高亮显示和运行(需对应语言的MCP Server支持)。
- SVG、HTML显示。
- 常见图表渲染,如Echarts、Mermaid等。
7. 划词和悬浮球
- 划词有弹出专属工具条,可以将划词的内容发送给对应的Agent进行生成。
- 划词工具条支持自定义配置或从已有Agent列表进行选择。
- 全局悬浮球,可以在任意场景调用Gaia-X。
- 划词和悬浮球都能轻易关闭,避免影响用户操作。
技术架构
客户端使用Electron + Ant DesIgn X 实现,支持MacOS和Windows平台。Windows端划词部分使用C++开发,MacOS端划词使用Objective-C开发。MCP支持TypeScript和Python两种,每个MCP Server都在独立且隔离的空间运行以确保安全。
电脑操作支持Claude 3.7 Sonnet、智普CogAgent和字节UI-TARS三种模型,按需选择配置即可,其中智普CogAgent和字节UI-TARS为开源模型,需自行部署运行,部署详见文档xxx。
核心概念
在开始使用 盖亚智能 之前,了解以下核心概念将有助于您更好地理解和使用它:
- 模型上下文协议(MCP):Anthropic公司开源的模型上下文协议,支持模型上下文传递。社区活跃,大量MCP Server可选。
- 智能体(Agent):盖亚智能 智能体,在对话中可以被智能协调调用,可以使用多个MCP Server提供的工具。
- 插件(Plugin):扩展 盖亚智能 功能的组件