AI技术栈
🤖 大语言模型 (LLM)
AI陪伴机器人的"大脑",负责理解用户意图和生成自然回复。
主流模型对比
| 模型 | 优势 | 适用场景 |
|---|---|---|
| GPT-4 | 推理能力强、上下文长 | 复杂对话、情感理解 |
| Claude 3 | 安全性好、长文本 | 儿童场景、安全对话 |
| GLM-4/通义千问 | 国产、中文优秀、成本低 | 国内产品首选 |
| 本地小模型 | 延迟低、隐私好、离线可用 | 简单对话、快速响应 |
在陪伴机器人中的应用
- 意图理解:识别用户真正想要什么
- 情感对话:生成有温度的回复
- 角色扮演:保持一致的人设风格
- 知识问答:回答各类问题
🧠 Agent架构
让AI不只是问答,而是能主动思考、记忆、行动的智能体。
感知
语音/触摸输入
理解
意图识别
记忆
检索相关记忆
推理
LLM生成回复
行动
语音+表情+动作
核心组件
💾 记忆系统
短期对话记忆 + 长期用户画像 + 情景事件记忆
🔧 工具调用
控制硬件、查询天气、设置提醒、播放音乐
🎭 人设管理
性格参数、说话风格、情感状态
🛡️ 安全过滤
内容审核、儿童保护、敏感话题处理
🎤 多模态交互技术
语音识别 (ASR)
将用户语音转为文字,支持方言、噪音环境
语音合成 (TTS)
文字转语音,支持多音色、情感语调
声纹识别
识别不同家庭成员,个性化响应
情感分析
从语音语调和内容判断用户情绪
智能硬件技术
⚙️ 舵机控制系统
让机器人"动起来"的核心,控制各关节实现表情和动作。
关键概念
- 舵机 (Servo):精确控制角度的电机,用于关节运动
- PWM控制:通过脉冲宽度调制控制舵机角度
- 动作编排:多个舵机协调运动形成复杂动作
- 动作库:预设动作序列,支持自定义编辑
产品应用
头部运动
点头、摇头、倾斜,配合对话情绪
手臂动作
挥手、拥抱、指向,增强表达力
身体旋转
转向声源、跟随用户、主动互动
📡 传感器集成
机器人的"感官系统",感知周围环境和用户行为。
麦克风阵列
多麦克风拾音,声源定位,降噪处理
触摸传感器
感知用户触摸,触发互动响应
距离传感器
检测用户距离,自动唤醒/休眠
光线传感器
自动调节屏幕亮度,感知环境
摄像头
人脸识别、表情识别、视觉互动
陀螺仪/加速度计
检测姿态变化,防跌落保护
🎨 外观与材质
产品经理需要理解的工业设计协作要点。
关键考量
- 材质选择:ABS塑料、硅胶、织物等,影响触感和成本
- 安全性:圆角设计、无小零件、材质无毒
- 可维护性:模块化设计、易拆卸清洁
- IP联名兼容:可替换外壳、配饰接口
IoT互联技术
🌐 设备联网
WiFi配网
SmartConfig/AP配网,简化用户设置
蓝牙连接
BLE近场连接,APP快速配对
云端通信
MQTT/WebSocket,实时数据同步
OTA更新
固件远程升级,持续优化体验
🏠 智能家居联动
机器人作为智能家居入口,联动控制其他设备。
- 语音控制:通过机器人控制灯光、空调、电视
- 场景联动:"晚安"时自动关灯、调暗屏幕
- 平台接入:接入主流智能家居平台(米家、HomeKit等)
☁️ 云端服务架构
设备端
本地处理+缓存
接入层
设备认证/路由
服务层
AI推理/业务逻辑
数据层
用户数据/记忆存储
关键考量
- 边缘计算:简单任务本地处理,减少延迟
- 隐私保护:敏感数据加密,用户可控
- 离线能力:断网时保持基础功能