Research Portfolio

我现在主要做随机系统中的 reach-avoid 控制

我关注的是：给定初始集、目标集、危险集和概率要求后，怎样真正做出一个带形式化保证的控制器。现在这条工作线主要包括四步：先用强化学习训练参考策略，再用 PAC 近似把策略转成更适合求证的多项式控制器，然后结合 stochastic barrier-like certificates 与 SOS / SDP 求解概率下界，最后再根据结果继续做控制器或证书迭代。

进入研究页查看简历与材料

Top 12024 年考研综合成绩第一（初试 373，复试 89）

3.95本科学位课程 GPA，成绩单已加入简历页与档案页

2nd · 3rd · HM华为杯二等奖、三等奖；MCM/ICM Honourable Mention

What I am doing now

我现在的工作内容

这不是单独做控制器，也不是只做验证。我现在更关心的是，把策略学习、可求证近似和概率下界求解放在同一条流程里。

先把问题写清楚

针对随机动力系统，给定初始集、目标集、危险集和概率要求，研究 infinite-horizon 的 reach-avoid 控制问题。

再把策略变成可求证形式

先用 SAC 学出参考控制器，再用 PAC 近似得到多项式控制器，让后续的证书求解和 SOS 优化真正可落地。

最后输出概率下界与迭代方向

除了最终的 reach-avoid 概率下界，我也会同时看求解时间、控制器次数、证书次数和后续还该往哪里继续迭代。

Research focus

主页只保留研究概览

这里现在只保留你在做什么、想解决什么问题，以及主要方法链的文字概览。
更详细的技术材料已经移到研究页与简历页，首页不再直接展开。
这样首页会更轻，更适合作为对外入口；真正需要看细节的人，再继续进入研究页查看。

查看研究页查看简历

Quick navigation

继续往哪里看

研究方向：看完整问题设定、方法流程、论文和实验结果。
个人档案：看学习经历、奖项、证明照片和成长轨迹。
项目展示：看开源仓库、项目背景、获奖图片和工程实践。

项目展示个人档案

Selected materials

站内已整理好的材料入口

Transcript

本科成绩单

成绩单已经加入个人档案页和简历页，方便查看 GPA、课程结构和已修学分。

打开成绩单

Evidence

经历证明照片

研究生和本科阶段的获奖、志愿者、菁英班、学生组织等证明材料，都整理到了个人档案页与简历页。

查看档案页

Projects

项目与仓库

项目页里已经补充了毕业设计、中软实习项目、对应的 GitHub 仓库和获奖图片。

打开项目页