项目详情

🌏ZhiYuAI 多模态翻译平台

将原本的单体翻译工具升级为语音 + 文本 + 场景协同的多引擎平台，演示与生产一键切换。

最近更新 · 2025-10

Starlette/Uvicorn 拆分语音、翻译、场景、AI 路由四大微服务，统一暴露 REST/WebSocket/SSE 接口

DashScope/Qwen + Mock 双模 SDK，自动路由最优模型并在无凭据时降级为本地示例

start_services.py/final_demo.py + Docker Compose 脚本一键拉起依赖，内存库与 PostgreSQL 自由切换

领域

AI云与发布

技术栈

PythonStarletteDashScopeOpenAI compatible APIPostgreSQLDocker ComposeVue 3Flutter

项目简介

ZhiYuAI 2.0 将翻译系统重构为语音交互、文本翻译、场景识别与 AI 路由四个 Starlette 微服务，配合共享的 DashScope/OpenAI 适配层、内存数据库与快速演示脚本，既能在 HR Demo 中一键跑全链路，也能按需对接真实的 PostgreSQL、Redis、监控栈。

我的角色与贡献

重新划分 translation / voice-interaction / scene-recognition / ai-router 目录，封装统一 CORS、TLS、健康检查，保证服务组合时的接口一致性与部署弹性
实现 services/ai-router 的 LLM 驱动策略引擎，根据任务类型、优先级与实时指标挑选最优模型并在解析失败时自动回退
编写 shared/ai_clients，对 DashScope SDK 与 OpenAI 兼容接口进行统一封装，提供 Mock 模式、流式参数、语言/模型配置与熔断重试
在 shared/database 中实现内存数据库，配套 install_and_setup.py/test_database_integration.py，帮助离线演示也能跑完 CRUD + 指标链路
交付 start_services.py/final_demo.py 以及 docker-compose / Makefile，覆盖一键启停、健康检查、日志聚合与 PyInstaller 打包路径

技术亮点

实时语音链路：voice-interaction 结合 DashScope ASR/TTS、VAD 与对话管理，支持 REST、SSE、WebSocket 多协议
LLM 驱动 AI Router：通过 chat_completion 汇总可用引擎能力、延迟、成本并输出 JSON 决策，失败时回落到规则表
视觉/对话协同：scene-recognition 服务融合摄像头内容与上下文对话，动态生成翻译语气、推荐模式与多语策略
Mock + 真实双模：shared/ai_clients 与 shared/database 允许缺失凭据时自动启用内存实现，确保训练/演示稳定性
多端入口：web/ 调试控制台与 mobile-app/Flutter 客户端共用 API 网关，方便将翻译流嵌入不同终端

系统架构

start_services.py 负责按顺序拉起四个 Starlette 微服务，它们通过共享的 AI 适配层与内存/真实数据库交互，再由 Web 控制台、Flutter 客户端或命令行 Demo 访问 API 网关完成整条翻译链路。

架构图渲染中...

四个 Starlette 微服务由一键脚本协调，并通过共享适配层访问 AI 能力与数据平面。

使用场景

项目价值

项目成果

第七届全球校园人工智能算法精英大赛 · 省赛二等奖已获奖
基于 ZhiYuAI 的语音 / 场景 / 翻译协同链路，在省赛答辩中完整演示 DashScope AI Router + 实时 Demo，获得二等奖。
第七届全球校园人工智能算法精英大赛 · 国赛进行中
晋级国赛后继续迭代智能翻译 Agent，补充可观测性、Mock 降级与部署脚本，聚焦「可靠交付」场景准备最终答辩。
全国 RISC-V 高水平创新及应用大赛进行中
规划将语音模型裁剪到 RISC-V 边缘板卡上，并结合 Workers API 做远程推理调度，目前处于方案打磨与验证阶段。