快速开始
资源需求
资源 | 数量 |
---|---|
RTX 4090 24GB | 1 |
数据盘 | 50GB |
使用步骤
0. 创建镜像
您可以参考平台的快速开始来创建镜像。 在选择镜像时,选择Bagel:
1. 启动webui
在实例界面点击“WebUI”按钮即可与Bagel在网页端对话
2. 与Bagel对话
Bagel的webui界面提供文生图、图片编辑和图片理解三个模块
文生图模块:
输入提示词后,点击“Generate”按钮即可生成图片
展开推理超参数部分,可以根据需要进行调整
Bagel支持思考模式,点击“Thingking”按钮即可开启思考模式,同时页面出现“Thinking Process”版块,推理结束后可以在该板块看到思考过程,推理超参数部分可以调整思考模式的参数。注意,开启思考模式推理效果略好一些,但是会多消耗一些时间。
输出示例:
大约两分钟时间完成推理
图片编辑模块
推理超参数部分和思考模式部分与“文生图”模块相同。上传图片并输入提示词后,点击submit按钮即可进行图片编辑。大约两分钟完成编辑。
- 图片理解模块
开启思考模式后,在右侧的Result中会返回标签包裹的思考内容。推理超参数部分根据需要进行调整。注意,思考模式下返回的思考内容也被计入总输出token数中,因此开启思考模式后应该在推理超参数中适当增加“Max New Tokens”
上传图片并输入问题提示词后,点击“Submit”按钮即可。思考模式下大约一分钟完成推理,非思考模式10秒左右完成推理(取决于最终输出长度)。