Research Portfolio

我现在主要做 随机系统中的 reach-avoid 控制

我关注的是:给定初始集、目标集、危险集和概率要求后,怎样真正做出一个带形式化保证的控制器。现在这条工作线主要包括四步:先用强化学习训练参考策略,再用 PAC 近似把策略转成更适合求证的多项式控制器,然后结合 stochastic barrier-like certificates 与 SOS / SDP 求解概率下界,最后再根据结果继续做控制器或证书迭代。

Top 12024 年考研综合成绩第一(初试 373,复试 89)
3.95本科学位课程 GPA,成绩单已加入简历页与档案页
2nd · 3rd · HM华为杯二等奖、三等奖;MCM/ICM Honourable Mention
What I am doing now

我现在的工作内容

这不是单独做控制器,也不是只做验证。我现在更关心的是,把策略学习、可求证近似和概率下界求解放在同一条流程里。

先把问题写清楚

针对随机动力系统,给定初始集、目标集、危险集和概率要求,研究 infinite-horizon 的 reach-avoid 控制问题。

再把策略变成可求证形式

先用 SAC 学出参考控制器,再用 PAC 近似得到多项式控制器,让后续的证书求解和 SOS 优化真正可落地。

最后输出概率下界与迭代方向

除了最终的 reach-avoid 概率下界,我也会同时看求解时间、控制器次数、证书次数和后续还该往哪里继续迭代。

Research focus

主页只保留研究概览

  • 这里现在只保留你在做什么、想解决什么问题,以及主要方法链的文字概览。
  • 更详细的技术材料已经移到研究页与简历页,首页不再直接展开。
  • 这样首页会更轻,更适合作为对外入口;真正需要看细节的人,再继续进入研究页查看。
Quick navigation

继续往哪里看

  • 研究方向:看完整问题设定、方法流程、论文和实验结果。
  • 个人档案:看学习经历、奖项、证明照片和成长轨迹。
  • 项目展示:看开源仓库、项目背景、获奖图片和工程实践。
Selected materials

站内已整理好的材料入口

Transcript

本科成绩单

成绩单已经加入个人档案页和简历页,方便查看 GPA、课程结构和已修学分。

本科成绩单首页预览
Evidence

经历证明照片

研究生和本科阶段的获奖、志愿者、菁英班、学生组织等证明材料,都整理到了个人档案页与简历页。

华为杯二等奖证书预览
Projects

项目与仓库

项目页里已经补充了毕业设计、中软实习项目、对应的 GitHub 仓库和获奖图片。

毕业设计项目相关图片预览