🔧 技术栈深度理解

AI技术 × 智能硬件 × IoT互联

AI技术栈

🤖 大语言模型 (LLM)

AI陪伴机器人的"大脑",负责理解用户意图和生成自然回复。

主流模型对比

模型 优势 适用场景
GPT-4 推理能力强、上下文长 复杂对话、情感理解
Claude 3 安全性好、长文本 儿童场景、安全对话
GLM-4/通义千问 国产、中文优秀、成本低 国内产品首选
本地小模型 延迟低、隐私好、离线可用 简单对话、快速响应

在陪伴机器人中的应用

  • 意图理解:识别用户真正想要什么
  • 情感对话:生成有温度的回复
  • 角色扮演:保持一致的人设风格
  • 知识问答:回答各类问题

🧠 Agent架构

让AI不只是问答,而是能主动思考、记忆、行动的智能体。

感知

语音/触摸输入

理解

意图识别

记忆

检索相关记忆

推理

LLM生成回复

行动

语音+表情+动作

核心组件

💾 记忆系统

短期对话记忆 + 长期用户画像 + 情景事件记忆

🔧 工具调用

控制硬件、查询天气、设置提醒、播放音乐

🎭 人设管理

性格参数、说话风格、情感状态

🛡️ 安全过滤

内容审核、儿童保护、敏感话题处理

🎤 多模态交互技术

语音识别 (ASR)

将用户语音转为文字,支持方言、噪音环境

语音合成 (TTS)

文字转语音,支持多音色、情感语调

声纹识别

识别不同家庭成员,个性化响应

情感分析

从语音语调和内容判断用户情绪

智能硬件技术

⚙️ 舵机控制系统

让机器人"动起来"的核心,控制各关节实现表情和动作。

关键概念

  • 舵机 (Servo):精确控制角度的电机,用于关节运动
  • PWM控制:通过脉冲宽度调制控制舵机角度
  • 动作编排:多个舵机协调运动形成复杂动作
  • 动作库:预设动作序列,支持自定义编辑

产品应用

头部运动

点头、摇头、倾斜,配合对话情绪

手臂动作

挥手、拥抱、指向,增强表达力

身体旋转

转向声源、跟随用户、主动互动

📡 传感器集成

机器人的"感官系统",感知周围环境和用户行为。

麦克风阵列

多麦克风拾音,声源定位,降噪处理

触摸传感器

感知用户触摸,触发互动响应

距离传感器

检测用户距离,自动唤醒/休眠

光线传感器

自动调节屏幕亮度,感知环境

摄像头

人脸识别、表情识别、视觉互动

陀螺仪/加速度计

检测姿态变化,防跌落保护

🎨 外观与材质

产品经理需要理解的工业设计协作要点。

关键考量

  • 材质选择:ABS塑料、硅胶、织物等,影响触感和成本
  • 安全性:圆角设计、无小零件、材质无毒
  • 可维护性:模块化设计、易拆卸清洁
  • IP联名兼容:可替换外壳、配饰接口

IoT互联技术

🌐 设备联网

WiFi配网

SmartConfig/AP配网,简化用户设置

蓝牙连接

BLE近场连接,APP快速配对

云端通信

MQTT/WebSocket,实时数据同步

OTA更新

固件远程升级,持续优化体验

🏠 智能家居联动

机器人作为智能家居入口,联动控制其他设备。

  • 语音控制:通过机器人控制灯光、空调、电视
  • 场景联动:"晚安"时自动关灯、调暗屏幕
  • 平台接入:接入主流智能家居平台(米家、HomeKit等)

☁️ 云端服务架构

设备端

本地处理+缓存

接入层

设备认证/路由

服务层

AI推理/业务逻辑

数据层

用户数据/记忆存储

关键考量

  • 边缘计算:简单任务本地处理,减少延迟
  • 隐私保护:敏感数据加密,用户可控
  • 离线能力:断网时保持基础功能
返回首页