大模型收藏我的收藏
收藏
我的收藏一、介绍
抖音云集成了火山引擎方舟给 AI 分身应用提供大模型能力,基于抖音侧合规风险考量,仅限在抖音云开发者服务内免鉴权调用大模型 OpenApi。
火山方舟是面向开发者的企业级大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。
二、使用限制
定向向 AI 分身应用类目开放。
三、操作指引
操作 | 选择 AI 分身进入应用详情页 | 进入行业解决方案 | 开通大模型 | 在线推理 | 模型管理 | 新建推理节点 |
说明 | 点击「AI 分身」tab 选择已开通应用 | 点击行业解决方案 | 点击开通按钮,勾选协议进行开通 | OpenApi 调用时需要指定在线推理节点的 ID | 目前已开放 4 款豆包系列模型,如有其他豆包模型需求,可联系对接运营申请开通 | 新建推理节点进行使用 |
截图 |
四、开发指引
接口文档 | 说明 |
仅限在抖音云部署到开发者服务内发起调用,需要将域名替换为抖音云内网域名,调用时需要指定在线推理点 ID。 |
五、计费相关
计费说明
模型服务计费:模型服务计费--火山方舟大模型服务平台-火山引擎
按tokens使用量付费:按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。按Token使用量付费适用于访问豆包大模型以及访问基于豆包大模型精调后的模型。
模型 | 上下文长度 | 服务类型 | 定价(单位:元/千tokens) | 计费方式 | 免费额度 |
Doubao-lite-32k | 32K | 推理服务(输入) | 0.0003 | 后付费 | 50万tokens |
推理服务(输出) | 0.0006 | 后付费 | |||
Doubao-pro-32k | 32K | 推理服务(输入) | 0.0008 | 后付费 | 50万tokens |
推理服务(输出) | 0.002 | 后付费 | |||
Doubao-embedding | 4K | 推理服务(输入) | 0.0005 | 后付费 | 50万tokens |
Doubao-embedding-large | 4K | 推理服务(输入) | 0.0007 | 后付费 | 50万tokens |
服务关停
- •账户余额不足或账户余额小于0被扣为负值即为欠费。
- •账号欠费后2小时内补缴所有欠费账单的,可正常使用火山方舟模型服务;欠费2小时后仍未能补缴所有欠费账单的,则账号下的所有火山方舟相关模型服务将无法正常使用,请及时补缴所有欠费账单,以避免服务中断带来的影响
费用预估
按 tokens 使用量(输入文本+输出文本)计费,每小时出账,按量后付费,以 Doubao-pro-32k 模型为例(ai 分身应用一期上线的能力)属于豆包大模型的高阶版,输入 80 元/亿 tokens,输出 200 元/亿 tokens。
举例: 按照每天 100 人与 AI 分身对话,每轮对话 3 次「输入输出各 3 次」,每轮对话平均产生 1000 tokens 的输入,100 tokens 输出
- •单天输入 token 费用:100x3x1000x0.0008/1000=0.24 元/天
- •单天输出 token:100x3x100x0.0020/1000=0.06 元/天
- •累计费用=(单天输入+单天输出)*30=0.3*30=9 元/月
六、常见问题
如何获取在线推理节点ID?
在大模型详情页中的在线推理列表中可复制接入点 ID。
注:dev 和 prod 环境在线推理节点ID 各不相同,可通过顶部导航栏切换环境来复制指定环境的在线推理节点 ID。