Research Portfolio 2025
强化学习 · 基础模型 · 自主系统
7 个研究项目,覆盖机器人运动控制到多智能体学术助手
Barlow Twins 对比学习 · Cost-Constrained PPO · 四条腿机器人运动
下一代 PPO 变体。Barlow Twins 对比学习替代标准 RMA teacher-student 蒸馏,1600 轮即收敛——超越 10000 轮基线,跟踪精度与稳定性均更优。
核心创新
Barlow Twins 损失函数对比过去与未来 5 帧本体感知窗口——无需特权信息即可学习时不变表征
Cost-Constrained PPO
3 项安全约束(关节限位/力矩/速度),Softplus 成本 critic,k 值退火课程
速度预测辅助头
MSE(z_vel, priv_vel)——编码器从历史状态预测机器人速度
The Real Real-Time LLM · 8 头并行解码 · vLLM 推理 · AI 虚拟主播
端到端实时 LLM 系统:SimpleTool 8 头并行解码消除自回归瓶颈 + Open LLM VTuber 生产级实时直播应用。基于 RT-Qwen3-4B-AWQ,消费级 GPU 即可运行。从推理加速到多模态直播的完整技术栈。
SimpleTool 核心
8 头并行解码——Content + Function + 6 Argument 头在 vLLM 上同时解码,消除工具调用的自回归串行瓶颈
RT-Qwen3-4B-AWQ 骨干
4B 量化模型,消费级 GPU,多工具协调(确认 4B 会坍缩为单工具,8B+ 才稳定多工具)
创新点 3
vLLM continuous batching + PagedAttention 高吞吐推理
多智能体强化学习 + MPC · RACER 分布式集群协同探索 · ROS1→ROS2 桥接
基于 MAPPO/MAPPG 多智能体强化学习与 MPC 的自主无人机航迹规划系统。CNN+GRU 循环策略网络 + PopArt 自适应值归一化,ACADO 最优控制 + qpOASES 实时轨迹优化。引入 RACER 算法实现 swarm_exploration 分布式多机协同探索,自研 ROS1→ROS2 跨版本桥接层打通新旧生态。
MAPPO/MAPPG 多智能体策略
CNN+GRU 循环架构,PopArt 自适应值归一化保证多智能体训练稳定收敛
RACER 分布式集群算法
swarm_exploration 多机协同探索,动态任务分配与信息共享,实现多无人机分布式覆盖搜索
ROS1→ROS2 跨版本桥接
自研桥接层兼容 ROS1 遗留节点与 ROS2 新生态,打通仿真到真机全链路
16 Agent · LangGraph 多智能体 · 学术研究全流程
综合多智能体学术研究系统。LangGraph StateGraph 协调 16 个专业智能体,星形拓扑。Chainlit + CLI 双界面,PostgresSaver 检查点,PPT-Master 幻灯片生成,AGENTREVIEW+REBUTTALAGENT 双阶段审稿。
16 个专业智能体
文献检索、论文分析、代码生成、实验设计、写作、审稿、驳斥等——星形拓扑协作
创新点 2
LangGraph StateGraph 编排 + PostgresSaver 持久化检查点(SQLite 本地回退)
Chainlit + CLI 双界面
Web 交互式研究 + 命令行批处理自动化
狭窄隧道自主飞行 · EDF 距离场 · B 样条轨迹优化 · FastLIO 定位
首个能在直径仅 0.5m 真实隧道中全方向自主飞行的四旋翼系统。EDF 欧式距离场实时建图,霍夫变换 + CNN 检测截面形状,一维动力学 A* 降维搜索,B 样条多目标轨迹优化。FastLIO 紧耦合 LiDAR-IMU 里程计提供无 GPS 定位,标注数据集训练神经网络实现感知缺陷在线检测。
核心创新
首次实现四旋翼在 0.5m 直径真实狭窄隧道内的任意方向自主穿行
创新点 2
EDF 距离场建图 + 霍夫圆/矩形检测 + CNN 形状分类器——实时感知隧道截面几何结构
一维动力学 A* 搜索
将 3D 隧道规划降维为沿中心线的位置-速度二维状态空间搜索,生成动力学可行初解
全驱动倾转旋翼 · PX4 飞控 · 控制分配 · 集群预留
基于 PX4 飞控框架的全驱动倾转旋翼无人机控制模块。定制角速度 PID + 解析推力分配算法,四个独立倾转舵机让无人机在悬停时也可产生水平力,实现真正全向运动。预留 swarm_bridge 集群通讯架构。
全驱动控制分配
解析公式将期望三轴力与力矩实时映射到四个倾转舵机 + 四个电机,突破传统四旋翼欠驱动限制
PX4 原生模块
uORB 消息总线集成,订阅姿态/角速度/遥控器输入,发布舵机/电机输出,深度嵌入 PX4 生态
SITL 仿真支持
提供完整 Gazebo SDF 模型 + ROMFS 启动脚本,可软件在环仿真验证全驱动控制逻辑