Phase 1: 产品定义与MVP规划
明确产品定位、目标用户、核心价值主张
📅 Month 1-2产品定位
一句话定义:面向年轻家庭的AI情感陪伴机器人,通过大模型驱动的多模态交互,成为"家庭第N+1成员"。
核心差异化
❌ 不是什么
不是智能音箱、不是工具助手、不是冷冰冰的问答机器
✅ 是什么
有温度的伙伴、能记住你的朋友、会成长的家人
目标用户画像
👨👩👧 核心用户
25-35岁年轻父母,希望陪伴孩子成长
🧑💻 扩展用户
独居青年,渴望情感陪伴和日常对话
🎨 潮玩用户
Z世代,追求IP联名和收藏价值
MVP核心功能定义
MVP原则:验证"用户是否愿意与机器人建立情感连接"这一核心假设。
🎯 MVP Must Have
• 自然语言对话(大模型驱动)
• 基础情感表达(眼部LED表情)
• 简单动作反馈(点头、挥手)
• 用户识别(声纹识别主人)
📋 V2 Nice to Have
• 长期记忆系统
• 个性化成长
• 多模态输入(视觉)
• 智能家居联动
Phase 2: 产品架构设计
整体产品架构、功能模块拆解
📅 Month 2-3产品架构图
用户触点层
用户与机器人的所有交互入口
应用体验层
核心功能模块和用户体验
AI能力层
大模型驱动的智能能力
硬件执行层
机器人物理能力
云端服务层
后端基础设施
核心功能模块拆解
1. 对话系统
输入处理
唤醒词检测 → ASR语音识别 → 意图理解 → 情感识别
输出生成
LLM生成 → 安全过滤 → TTS合成 → 表情动作编排
2. 记忆系统(核心差异化)
| 记忆类型 | 存储内容 | 生命周期 | 检索方式 |
|---|---|---|---|
| 短期记忆 | 当前对话上下文 | 单次会话 | 直接拼接 |
| 中期记忆 | 近期事件、话题 | 7-30天 | 时间+语义检索 |
| 长期记忆 | 用户画像、偏好、关系 | 永久 | RAG向量检索 |
3. 多模态表达系统
情感到表达的映射逻辑:
情感识别
开心/难过/惊讶...
强度计算
1-10级
表达编排
眼+嘴+动作+灯光
同步输出
语音+肢体协同
Phase 3: 技术架构与选型
AI技术栈、硬件方案、云端架构
📅 Month 3-4技术架构设计
AI技术栈选型
| 模块 | 技术选型 | 选型理由 |
|---|---|---|
| 主对话模型 | GLM-4 / 通义千问 | 国产、中文优秀、成本可控、合规 |
| 本地小模型 | Qwen-1.8B / ChatGLM3-6B | 简单任务本地处理,降低延迟 |
| 语音识别 | 讯飞 / 阿里ASR | 国内最佳识别率,支持方言 |
| 语音合成 | 讯飞 / 微软TTS | 情感化语音,多音色可选 |
| 向量数据库 | Milvus / Pinecone | 长期记忆的语义检索 |
硬件技术方案
主控芯片
ARM Cortex-A53/A72 + NPU
支持本地小模型推理
音频模块
4麦克风阵列 + DSP降噪
3W扬声器 × 2
舵机系统
6-8个智能舵机
头部2轴 + 手臂4轴 + 腰部2轴
显示模块
OLED眼部表情屏
或 LED点阵 + RGB灯带
云端架构
设备端
唤醒/预处理
API网关
鉴权/限流
对话服务
Agent编排
AI服务
LLM/TTS/ASR
数据服务
记忆/用户画像
关键技术难点与解决方案
🎯 难点1: 对话延迟
问题:云端LLM响应慢,影响对话流畅度
方案:流式输出 + 本地预测 + 提前加载表情动作
🎯 难点2: 角色一致性
问题:LLM容易"出戏",性格不稳定
方案:System Prompt优化 + 角色锚点 + 回复后校验
🎯 难点3: 记忆检索准确率
问题:检索到不相关记忆
方案:混合检索(语义+时间+权重) + 相关性阈值
🎯 难点4: 成本控制
问题:LLM API调用成本高
方案:分层调用 + 缓存热门回复 + 本地小模型兜底
Phase 4: 数据迭代与商业化闭环
数据驱动迭代、商业模式设计
📅 Month 5+数据指标体系
北极星指标
分层指标看板
| 维度 | 指标 | 目标值 | 采集方式 |
|---|---|---|---|
| 使用 | 日均对话轮次 | 15轮+ | 日志埋点 |
| 质量 | 对话满意度 | 85%+ | 用户反馈 + AI评估 |
| 情感 | 情感对话占比 | 30%+ | 意图分类 |
| 记忆 | 记忆触发成功率 | 80%+ | 检索日志 |
| 商业 | 增值服务转化率 | 15%+ | 支付数据 |
数据驱动迭代循环
数据采集
行为/对话/反馈
问题发现
BadCase分析
假设验证
A/B测试
模型优化
Prompt/微调
效果验证
指标监控
迭代优先级框架
🔴 P0 - 立即修复
• 安全问题(不当内容)
• 严重Bug(无法对话)
• 高频BadCase(影响>5%用户)
🟡 P1 - 本周迭代
• 对话质量问题
• 用户明确反馈
• 核心指标下降
商业化闭环设计
硬件销售
基础款 ¥1299
高配款 ¥1999
IP联名款 ¥2499+
订阅服务
基础版 免费
高级版 ¥29/月
家庭版 ¥49/月
增值内容
IP人设包 ¥19
技能包 ¥9-29
配件周边 ¥39+
用户生命周期价值 (LTV) 模型
获客
电商/线下
激活
开箱体验
留存
情感连接
付费
订阅/增值
推荐
社交传播