童永山的脚步声比平时更重也是有原因的。
他回国之前,还做过新大的特聘教授。
原本他想让新大支援个专门做深度学习的副教授进组,也妥协了新大共同一作的要求。
结果新大那边又出了幺蛾子,居然想连通讯作者都想要。
最后新大计院那边更是放出话来,这个课题的底层肯定是基于计科的,计科是理论,计量模型只是应用,如果童永山不同意,那就搞学术竞争。
最后自然是不欢而散。
实在不行只能和国立计院商量商量了。
但国立的计院水平……唉,看看能不能屎里淘金吧。
如果没有机器学习方面有研究的高手,这个课题是真没办法做下去的。
组会的主题早在一周前已经邮件发给了所有人,这里面只有程风在组里的经验是最丰富的,因此,童永山让程风开场,也有打个样的意思。
这一次的组会的主要内容就是文献汇报,童永山之前已经要求每人精读三篇大数据与强因子方面的文献,具体的文献由研究生自己选择。
童永山是蛮喜欢程风的,程风的性格和他很像,都比较专注学术。
他年轻时也比较木讷社恐,哪怕到了迈国,拿到终身教职,也只不过达到一般人的社交能力水平。
程风和人聊天时经常词不达意,但要说到专业,可就完全没有那种唯唯诺诺的样子了。
这三篇文献基本都是近一年在A刊上发的一些强因子模型及时间序列和面板数据方面的拓展性研究,这部分也是他一直以来比较关注的方向。
从研究背景、研究结果、结论、研究意义几个方面,程风把这三篇文献用近半个小时的时间讲了一遍,随后就是一些小组讨论。
其实也讨论不出来啥,方豫作为大二学生基本就是旁听,另外两个研一的到现在还没搞明白什么是文献汇报呢,看到程风做完汇报才刚刚摸到点门路。
至于江南蓁这个水货博士,更是说不出来啥,低着头在记录本上写写画画,搞的很认真的样子。
所以讨论基本上就沦为了程风和童永山之间的一问一答。
“程风,这三篇文献找的还是不错的,刚刚的分析也比较准确。”
“但主要还是之前我跟你提的两个问题:第一个,相关性,你这三篇论文的相关性不足,相互之间没有建立起足够的关联度。”
“第二个问题,就是阅读面的问题,你选的这三篇文献不止相关性不够,在研究方向上也很窄,后面可以读一些相关领域的文献,不要仅仅集中在因子模型和面板数据的算法上。”
程风点了点头,结束了自己的汇报。
“张畅、宋立恒,你们两个谁先开始?”童永山点了点另外两个研一学生的名字。
这两人一个是数院的,一个是计科的,数院的张畅就是国立毕业的保研,而宋立恒则是科大计科专业的推免。
两人都是第一次参加组会,不过能成为童永山的研究生,自然也不是什么水货,虽然经验不足,但也能凭能力补齐。
尤其是张畅,可是长了一张好嘴,反应贼快,所有人都能看出来他按照他的ppt报告,他的观点应该是A。结果听完程风的汇报,这货马上意识到自己最后的观点结论有问题,可能童永山会不认可,最后硬靠一张嘴把观点扭成了B。
两人汇报完,就只剩江南蓁没汇报了。
本身就是用的江南蓁的电脑连接的投影仪,江南蓁轻车熟路的翻到自己的ppt。
好家伙,做的这叫一个花团锦簇淡雅清新。
说淡雅清新,是指她这个ppt的模板。
其他人的模板大多就是网上随便找的,男生往往也不太注意这个,能符合一个对齐原则就已经算是很对得起导师的眼睛了。
而江南蓁这个模板,一看就是花了钱找淘猫定制的。
极简化的视觉风格,图表风格与ppt风格相一致,字体与圆角图标相一致,插图还专门加了不饱和色调滤镜。
不是,你读的啥文献?为啥还有插图?
说花团锦簇,是江南蓁简直把ppt技巧玩出了花。
淡化,飞出,飞入,分离……光是一个图片动画,江南蓁做的就不带重样的。
至于内容嘛,mia,mia,mia。
“好了,不用再讲了。”童永山眉头紧皱,“你刚才讲的这是什么东西?什么时候维基百科能作为论据了?”
“你说的第三点和第一点又有什么关系?推导过程是什么样的?”
“你说你之前的研究方向是金融数学,我也看过你的论文,你的毕业论文是你自己写的吗?你之前的研究生导师是怎么让你硕士毕业的?”
童永山这话说的就已经有些重了,江南蓁泪珠啪嗒啪嗒的往下掉。
其他人都屏住呼吸,大气都不敢喘。
算了吧,毕竟是个女生。
看到江南蓁的样子,童永山心头一软。
“下次开组会之前做好准备。”
童永山不为已甚,皱了皱眉,最后补了一句。
“老师,对不起,我……我中间工作了一年多,有些不适应……呜呜呜。”
江南蓁虽然长得只有70分,但这一哭,颜值就升到了80,还挺神奇。
除了张畅,其他几个人男生都是没女朋友的,哪见过这个,就是感觉大师姐这么温柔的人,被老师批评成这样,太可怜了。
张畅倒是翻了个白眼,嘴角微微露出不屑。
童永山挥了挥手,不再管继续抽泣的江南蓁,指了指方豫:“方豫,你也讲一下,你是大二的,不用太有心理负担,也不用太注重表现,有内容就可以。”
方豫点了点头,接过江南蓁手里的ppt遥控,切换到自己的那部分。
江南蓁作为汇总者,是看过方豫的ppt的,但没太看懂。
倒不是方豫的ppt有多高深,是内容太少了。
基本上每页就是一两个词和一两幅图表,其他的啥也没有。
而这一两个词,看起来也云山雾罩,搞不明白说的什么。
这种ppt风格江南蓁工作的一年没少见到,她所在的那家金融公司中有几个擅长讲ppt的大忽悠,基本都是这个路子。
不过,这可是童永山的组会!
光凭忽悠是过不了关的!
张畅能强拗过来,也是因为有实际内容,你连实际内容都没有,等着挨骂吧!
刚刚我做的都被骂了。
江南蓁眼梢微微挑起,等着看好戏。
“老师好,各位师哥师姐好,我叫方豫,金融学大二。”
“我这两周主要读了三篇文献,分别是3052年发表在《神经计算》上的《基于深度置信网络的快速学习算法》,和去年在ICLR会议上发表的《自动编码变分贝叶斯》以及同样是去年在NIPS会议上发表的《生成对抗网络》。”
方豫说的这几篇文章,没一个和计量经济学有关系的,基本全是和神经网络相关的。
江南蓁刚被童永山批评完,不适合再说什么,程风又是个木讷性子,也不会有什么表态。
张畅和宋立恒两人对视一眼,都觉得有点扯淡。
噗!
宋立恒差点忍不住笑出声来。
这小师弟,装逼装的有点生硬啊。
他本身就是学计科的,作为科大计科专业的优秀毕业生,本科毕业论文做的就是机器学习方面的内容,虽然研究的不深,但还是有一些基本了解的。
但这三篇文献中,他只粗略读过古狗的伊安发表的那篇《生成对抗网络》。
没办法,那篇论文在去年实在太火了,凑热闹也得读一下啊。
但几乎没弄懂。
至于说那个变分贝叶斯,听着就不容易懂。
一个金融学大二的,去读这种论文?
哈哈哈。
宋立恒看向方豫的目光,多少带上一些同情和缅怀。
想起了自己初中时在教室里捧着一本《百年孤独》的时光。
想起了自己高中时在教室里捧着复印本的全盎文《深入理解计算机系统》的时光。
想起了自己大学时在暗恋的女生面前与室友大声讨论毕业后究竟去阿狸还是藤讯的时光。
年轻真傻。
年轻真好。
“《基于深度置信网络的快速学习算法》这篇文献介绍了深度信念网络(DBN)的快速学习算法,是深度学习研究的一个重要里程碑。它展示了如何逐层预训练深层网络,然后使用反向传播进行微调。”
“这篇论文主要介绍了深度信念网络,这是一种由多个受限玻尔兹曼机堆叠而成的多层生成模型……”
“论文的核心贡献之一是提出了一种有效的逐层贪婪预训练算法。该算法通过逐层训练RBMs……”
“论文展示了在MNIST数据集上的实验结果,证明了DBN相比浅层网络和其他传统方法具有更好的表现。”
……
“啪”的一声打断了方豫,众人看了一眼江南蓁,江南蓁赶忙刚刚不小心捏断的一根木头簪子,抱歉的对所有人笑了笑。
刚刚她在心中嘲笑方豫那些只有关键字和简单图表的ppt,现在每一个提示词和图表都在打她的脸。
因为这些东西居然真的有用!
这小子真的是天才?
怎么可能?
有这个疑问的当然不只是江南蓁。
宋立恒目瞪口呆的看着侃侃而谈的方豫。
究竟你是计算机专业还是我是计算机专业?我都不懂,你说的这些老童能听懂吗?
别说他不懂,方豫自己其实也不懂。
但他懂得通过柚子传递到埃瑟朗之核的信息照本宣科的念呀。
果然还是装学术比最爽。
方豫念着意识中的信息,感觉好像每个毛孔都做了个毒龙。
爽死了。
“我研读的第二篇是《自动编码变分贝叶斯》,这篇论文实际上……”
“这种近似通过最大化证据下界来实现,从而避免了直接计算难以处理的后验分布……”
“VAE的损失函数由两部分组成……”
“基本上,可以把这篇论文提到的VAE视为机器学习的底层工具之一,可以为强因子模型在大数据中的应用提供底层支持。”
听完方豫对第二篇论文的讲解,张畅也坐不住了。
他是国立数院的,这篇论文中相当一大部分比例内容都是他专业方面的内容,涉及到复杂的概率图模型和变分推断,需要研究者对概率论、统计学都有比较深入的理解才能读懂。
而在方豫的讲解之下,他居然真听明白了这论文到底是干嘛的!
这说明这个大二学弟是真的把这篇文章彻底理解了啊。
这种妖孽不早就应该去MIT或者斯坦福了吗?至少也得去个普林斯顿,还留在国内读什么大学!?
张畅是真学神,智商高达160,他的智商可不是那种网上公众号九块九一套题测出来的,而是真的参加了门萨测验的结果。
要不是他研究生毕业后的路早就被铺好了,他都不可能留在国内读研。
没有人比学神更能理解什么是学神。
这还是张畅生平第一次有了被人碾压智商的感觉。
方豫讲完第二篇,紧接着就开始讲第三篇。
“第三篇《生成对抗网络》是去年的大热论文,内容比较简单……”
听到方豫说的,宋立恒感觉心脏都在疼。
比较简单?你说的是人话吗?
哪儿特么简单了?
那个目标函数你真搞明白了?
“其中,D(x)是判别器对真实数据xx的判别概率,G(z)是生成器生成的假数据……”
艹!还真搞明白了。
现在的本科生都这么变态的吗?
不对啊,7月份之前,老子也是本科生啊。
在宋立恒生无可恋的目光中,方豫开始为自己的组会首秀结尾。
“在应用层面,这篇论文主要讨论了对抗网络训练模型在图像生成方面的作用。”
“但实际上,依据其算法,我们可以尝试生成对抗网络应用在强因子模型之中。”
“例如在合成数据集方面,它可以……;同样,也能用于高维数据的降维,提取因子的效率比之前可以提升上百倍;在异常数据监测上……;最重要的,它展现出了模拟和预测复杂的金融市场行为的潜力……”
“综上所述,我认为我们课题第一阶段的目标,完全可以将GANs与强因子模型进行结合,我相信这两方面应该能碰撞出比较灿烂的火花。”
“我的汇报结束。”
方豫对童永山以及其他组员点了点头,很自然的坐了下来。
现场足足安静了十几秒。
“啪!啪!啪!”
童永山打破安静,率先鼓起掌来。
“好!好!好!”童永山激动的脸都红了。
方豫再次获得了童永山的三好学生认证。
童永山怎么也没想到,一次普普通通的组会,居然由组内学历最低的本科生,给自己找出了课题的第一阶段的方向。
“方豫,如果由你来组建GANs与强因模型的应用结合,你有多大把握能够成功?”
童永山此言一出,四座皆惊。
这是已经指定组长了吗?
我们一堆硕士博士,以后要听这个本科生的?
这特么还是本科生吗?
童永山目光炯炯。
他根本不在乎谁当组长,无论谁是组长,最后都是给他打工。
他更不介意自己是一作还是通讯作者,如果方豫能够搞成功,一阶段论文的一作给方豫又如何?
这就是手握7篇五大顶刊SSCI顶级学者的底气!