如何在OCI上配置并使用OCI GenAI服务的步骤
如何在OCI上配置并使用OCI GenAI服务的步骤
在本文中,我们将介绍在Oracle Cloud Infrastructure(OCI)上配置和使用OCI GenAI服务的步骤,包括如何选择适当的区域(Region),配置Resource Manager,以及为OCI GenAI API创建必要的Policy。
1. 确认部署区域
在开始配置之前,首先需要确认您打算部署RAG(Retrieval-Augmented Generation)的区域。
Oracle建议如果您选择 Tokyo Region 以外的区域部署RAG精度提升项目,可能需要在Resource Manager中进行一些额外的设置。请确保在项目启动前,与Oracle确认您的Region选择,以避免配置上的问题。
2. OCI GenAI服务的Region要求
目前,OCI GenAI服务仅支持Chicago Region,这意味着:
- 您需要在 Chicago Region 中订阅OCI GenAI服务。
- Tokyo Region暂不支持OCI GenAI服务。因此,如果您在东京或其他不支持GenAI服务的区域,可能需要额外的配置或考虑切换到Chicago Region进行部署。
3. Resource Manager的Policy配置
要使用Resource Manager进行资源管理,您需要在Root Compartment下创建特定的Policy,赋予指定用户组对资源的管理权限。
在Root Compartment下,添加以下Policy语句,以确保用户组具有管理所需资源的权限:
allow group <group_name> to manage orm-stacks in tenancy
allow group <group_name> to manage orm-jobs in tenancy
- orm-stacks: 此Policy允许指定的用户组管理所有的Resource Manager堆栈(Stacks),包括创建、更新和删除。
- orm-jobs: 此Policy允许用户组管理Resource Manager作业(Jobs),以便在资源管理流程中有效运行。
替换<group_name>
为实际的用户组名称。
4. 配置OCI GenAI API访问的Policy
如果您需要使用OCI GenAI的API,例如生成式AI对话(generative-ai-chat)和文本嵌入(generative-ai-text-embedding)功能,也需要在Root Compartment下配置特定的Policy。添加以下Policy语句:
allow group <group_name> to manage generative-ai-chat in tenancy
allow group <group_name> to manage generative-ai-text-embedding in tenancy
- generative-ai-chat: 允许用户组访问和管理生成式AI的对话API。
- generative-ai-text-embedding: 允许用户组使用生成式AI的文本嵌入API功能。
确保将<group_name>
替换为您实际的用户组名称,以便正确赋予权限。
总结
按照以上步骤,您就可以在OCI中成功配置并使用OCI GenAI服务。主要包括:
- 确认部署区域,避免Tokyo Region的限制。
- 订阅支持OCI GenAI的Chicago Region。
- 为Resource Manager配置Policy,以管理堆栈和作业。
- 为OCI GenAI API创建Policy,确保用户组具有访问生成式AI对话和文本嵌入功能的权限。
通过上述配置,您可以在OCI平台上更好地管理并利用GenAI服务,从而提升AI应用的效率和性能。希望本文对您在OCI上部署和管理AI服务有所帮助。
原文地址:https://blog.csdn.net/engchina/article/details/143754167
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!