Research Portfolio
我现在主要做 随机系统中的 reach-avoid 控制
我关注的是:给定初始集、目标集、危险集和概率要求后,怎样真正做出一个带形式化保证的控制器。现在这条工作线主要包括四步:先用强化学习训练参考策略,再用 PAC 近似把策略转成更适合求证的多项式控制器,然后结合 stochastic barrier-like certificates 与 SOS / SDP 求解概率下界,最后再根据结果继续做控制器或证书迭代。
Top 12024 年考研综合成绩第一(初试 373,复试 89)
3.95本科学位课程 GPA,成绩单已加入简历页与档案页
2nd · 3rd · HM华为杯二等奖、三等奖;MCM/ICM Honourable Mention


