悔悟个屁。。
我TM又开始玩亚索了,真是贱的
说一下要干的事情,缕一下思路吧
——————————————————————————
强化学习之前已经看的差不多了,我觉得可以找个开源的代码研究一下
然后就开始写代码了
论文需要修改,按照老师的要求
代码还有两个要跑
t一直有问题,出在结果不正常,debug效果不好,但是现在实验室服务器开了,我决定在实验室搞【问题应该是解决了,必须要从forward里return,所以大小除以4即可】
f跑到很慢,直接用实验室的跑,应该就不慢了
sampler我换掉了,所以需要修改代码
network也改了
先从代码开始改吧
————————————————————————————
被蠢逼队友连坑2把,想到又一天没学习了,怒删游戏
凌晨1点了,不想睡觉,怀着怒气开始学习,写代码的速度都变快了
玩亚索还能提高打字速度,惊了
管他呢,老子干正事去了,干嘛浪费生命带那些蠢货上分呢?————————————————————————————
TODO:
1. co跑出来效果比m差,这不太合理,我觉得需要重新跑co
2. f在实验室跑一下看看速度【顺利,但是报了一个以前已经见过的错误,已经修改了】
3.修改论文的abstract、intro、以及cauchy的介绍
4.强化学习代码阅读【代码能够顺利跑起来,但是还仔细研究】
5.我确实要确定好,如何设计我的state,以及编写好交互环境,还需要确定,我到底是做模拟实验还是真实的实验,可以先从的模拟的做起,站点地点信息我应该都有了,随便生成一些站点,以及用户,应该还是容易的。另外我觉得没必要用什么芝加哥的数据了,直接用纽约的,这样我不需要重新跑旧的代码,直接拿那个结果作为baseline就能对比了,但是生成方式,我需要确认一下,大致上我都还记得,能够重新写出来。
——————————————————————————