


首先克隆具体的代码仓库。
# 仓库下载
git clone https://github.com/volcengine/ai-app-lab.git
# 进入对应具体目录
cd demohouse/chat2cartoon
接着打开 .env 文件,对环境变量进行配置,添加文生图、语音合成、视频生成、视频理解等模型。
# 大模型接入点ID,用于脚本创作、分镜、角色 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenTokenDrawer=false
LLM_ENDPOINT_ID='ep-xxx'
# 视觉理解大模型接入点ID,用于最终视频影片交互
VLM_ENDPOINT_ID='ep-2025xxx'
# 火山引擎TOS储存桶名,用于存储模型产物 https://console.volcengine.com/tos/bucket/
TOS_BUCKET='chat2'
# 语音技术API Access Key https://console.volcengine.com/speech/service/
TTS_ACCESS_KEY='7naxxx'
# 语音技术API Resource ID https://console.volcengine.com/speech/service/
TTS_API_RESOURCE_ID='volc.service_type.10029'
# 语音技术App Key https://console.volcengine.com/speech/service/
TTS_APP_KEY='113xxx'
# 生视频大模型接入点ID(暂时只支持Doubao-视频生成模型)
CGT_ENDPOINT_ID='ep-20250306153842-pg2b4'
# 火山方舟API Key,用于方舟模型接入点推理时做鉴权 https://console.volcengine.com/ark/region:ark+cn-beijing/apiKey
ARK_API_KEY='99831b24-55xxxx'
# 火山引擎账号Access Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_ACCESSKEY='AKLTYxxxx'
# 火山引擎账号Secret Key,用于访问TOS API,上传模型产物 https://console.volcengine.com/iam/keymanage/
VOLC_SECRETKEY='Tmprexxxx'
为了方便大家寻找,我们进行稍微详细的说明。首先开通火山方舟的相关服务(各种 AI 模型都在这里),进入火山方舟,然后左下角往下滑,点集开通管理,分别对大语言模型和视觉大模型进行服务开通。


在开通了具体模型服务之后,我们需要创建接入点,也就是我们具体使用的模型。
点击左侧在线推理,然后点击自定义推理接入点,创建推理接入点。

根据要求填写信息,并添加具体模型后,确认接入。

而后即可复制接入点 ID。

具体的模型大家可以按自己喜好和场景选择,我们选择为
1. LLM_ENDPOINT_ID 选择 Doubao-1.5-pro-32k;
2. VLM_ENDPOINT_ID 选择 Doubao-vision-pro-32k;
3. CGT_ENDPOINT_ID 选择 Doubao-视频生成-Seaweed。
访问这些模型的 Key(也就是 ARK_API_KEY),点击查看 API Key,即可查看与选择(若要创建新的,则可在左下角进行管理)。


点击进入我们刚刚具体的桶,配置跨域访问。

具体参数根据大伙实际情况配置,这里为了方便,仅供参考(生产环境请谨慎)。

再接下来进入火山引擎的访问控制:
https://console.volcengine.com/iam/keymanage/
获取火山引擎的 Access Key 和 Secret Key 用于访问 TOS API。
依次对应 VOLC_ACCESSKEY 和 VOLC_SECRETKEY。
https://console.volcengine.com/tos
点击桶列表,再点击创建桶,填写相关信息之后,就创建好了,这里我们创建的名称为 chat2,那么对应 TOS_BUCKET=’chat2’。

最后是语音技术部分,访问火山引擎语音技术:
https://console.volcengine.com/speech/app
创建应用,然后选择大模型语音合成和流式语音识别大模型。

接着点击左侧任意一栏,下方可以找到 APP ID 和 Access Token。
然后根据文档说明,
TTS_ACCESS_KEY 对应 Access Token,
TTS_APP_KEY 对应 APP ID。

https://www.volcengine.com/docs/6561/1329505
那么到这 .env 文件就完全准备好了,接下来就是安装各种依赖并运行。
后端部分:
# 进入后端
cd backend
# 安装 poetry
pip install poetry==1.6.1
# 用 poetry 安装依赖库
poetry install
# 后端启动!
poetry run python index.py
运行成功则看到如下类似内容。

前端部分:
# 进入前端
cd frontend
# 安装 pnpm
npm install -g pnpm@8
# 利用 pnpm 安装依赖包
pnpm install
# 复制环境变量 .env 文件
cp ../.env ./
# 前端启动!
pnpm dev
运行成功则看到如下类似内容。

接着我们访问 http://localhost:8080/ 即可使用!


可以看到,用户一键即可生成分钟级视频,操作简便高效。无需繁琐设置,只需输入需求,即可快速获得符合要求的长视频作品,大幅提升创作效率。
整一个视频质量还是很高的,清晰流畅,故事情节也流畅自然,还支持对整个故事进行互动问答。

从 Coze 的模板到 AI 应用开源实验室,不仅是解决方案从低代码到高代码的覆盖,更是从通用场景到深度定制的演进。
在大模型落地的浪潮中,应用开源的战略意义比模型本身的开源会更大。模型固然是强大的引擎,但如何高效地将模型能力融入实际业务场景,才是应用落地、提升业务能力的关键所在。
火山引擎开源 AI 实验室,开源提供的高代码 SDK 和原型 AI 应用,正是辅助 AI 应用落地的最后一公里开源的 AI 应用提供了一个冷启动的最佳方案。
虽然很多企业虽然清楚大模型的潜力,也明白在理论上如何将其应用到自身业务场景中,但若是初次实践,还是会有诸多障碍。而开源 AI 原型应用,企业开发者无需再从头摸索复杂的模型对接和应用开发流程,可以迅速上手,快速学习并构建和扩展符合自身业务的 AI 应用,试错成本、时间成本、人力成本大大降低。
对于广大 AI 技术爱好者及开发者而言,刚入门 AI 应用开发时,自然会接触到类似 LangChain 等高度封装且抽象层次较高的框架。LangChain 虽然在熟悉之后开发效率极高,但其大量的语法糖和抽象概念对初期学习曲线提出了较高的挑战。相比之下,火山引擎提供的 Python SDK Arkitect ,上手更容易,工具链和开发流程更加直观,并且在 Demo 里也提供了技术架构图和实现细节。
额外补充,利用 trae 跟项目对话能大大提高学习速度~


归根结底,模型的价值需要通过应用来释放,而开源应用,提供解决方案,让价值进一步放大。
从 Coze 免费模板到 AI 开源实验室,覆盖低代码和高代码,字节的战略布局不仅仅是为行业提供一套工具,更是在推动整个生态系统的成熟,为企业和开发者创造更大的想象空间与价值。
‼️目前火山引擎还在免费送代金券,参与入口:
https://volcengine.com/L/i5x8THBj/



(文:特工宇宙)