• 开发者工具 IDE
  • 沙盒环境
  • 抖音云
  • 产品介绍
  • 快速开始
  • 场景指南
  • 操作指南
  • 账号入驻
  • 服务管理
  • 组件中心
  • 设置
  • 资源用量
  • 运维管理
  • 费用中心
  • 火山引擎
  • 行业解决方案
  • 短剧媒资管理
  • 媒资管理OpenApi
  • 短剧媒资管理常见问题
  • 大模型
  • 函数服务管理
  • 浏览器启用第三方 cookie配置指引
  • 总览
  • 操作限制
  • 开发指南
  • SDK参考
  • 产品动态
  • 产品计费
  • 常见问题
  • OpenAPI调试台
  • 一、介绍

    抖音云集成了火山引擎方舟给 AI 分身应用提供大模型能力,基于抖音侧合规风险考量,仅限在抖音云开发者服务内免鉴权调用大模型 OpenApi。
    火山方舟是面向开发者的企业级大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。

    二、使用限制

    定向向 AI 分身应用类目开放。

    三、操作指引

    操作
    选择 AI 分身进入应用详情页
    进入行业解决方案
    开通大模型
    在线推理
    模型管理
    新建推理节点
    说明
    点击「AI 分身」tab 选择已开通应用
    点击行业解决方案
    点击开通按钮,勾选协议进行开通
    OpenApi 调用时需要指定在线推理节点的 ID
    目前已开放 4 款豆包系列模型,如有其他豆包模型需求,可联系对接运营申请开通
    新建推理节点进行使用
    截图

    四、开发指引

    接口文档
    说明
    仅限在抖音云部署到开发者服务内发起调用,需要将域名替换为抖音云内网域名,调用时需要指定在线推理点 ID。

    五、计费相关

    计费说明

    按tokens使用量付费:按tokens使用量(输入文本+输出文本)计费,每小时出账,按量后付费。按Token使用量付费适用于访问豆包大模型以及访问基于豆包大模型精调后的模型。
    模型
    上下文长度
    服务类型
    定价(单位:元/千tokens)
    计费方式
    免费额度
    Doubao-lite-32k
    32K
    推理服务(输入)
    0.0003
    后付费
    50万tokens
    推理服务(输出)
    0.0006
    后付费
    Doubao-pro-32k
    32K
    推理服务(输入)
    0.0008
    后付费
    50万tokens
    推理服务(输出)
    0.002
    后付费
    Doubao-embedding
    4K
    推理服务(输入)
    0.0005
    后付费
    50万tokens
    Doubao-embedding-large
    4K
    推理服务(输入)
    0.0007
    后付费
    50万tokens

    服务关停

      账户余额不足或账户余额小于0被扣为负值即为欠费。
      账号欠费后2小时内补缴所有欠费账单的,可正常使用火山方舟模型服务;欠费2小时后仍未能补缴所有欠费账单的,则账号下的所有火山方舟相关模型服务将无法正常使用,请及时补缴所有欠费账单,以避免服务中断带来的影响

    费用预估

    按 tokens 使用量(输入文本+输出文本)计费,每小时出账,按量后付费,以 Doubao-pro-32k 模型为例(ai 分身应用一期上线的能力)属于豆包大模型的高阶版,输入 80 元/亿 tokens,输出 200 元/亿 tokens。
    举例: 按照每天 100 人与 AI 分身对话,每轮对话 3 次「输入输出各 3 次」,每轮对话平均产生 1000 tokens 的输入,100 tokens 输出
      单天输入 token 费用:100x3x1000x0.0008/1000=0.24 元/天
      单天输出 token:100x3x100x0.0020/1000=0.06 元/天
      累计费用=(单天输入+单天输出)*30=0.3*30=9 元/月

    六、常见问题

    如何获取在线推理节点ID?

    在大模型详情页中的在线推理列表中可复制接入点 ID。
    注:dev 和 prod 环境在线推理节点ID 各不相同,可通过顶部导航栏切换环境来复制指定环境的在线推理节点 ID。