17年7月初在纽约的时候,收到了一篇颇多波折的论文录取结果,中了acmmm的oral presentation (7% 录取率)。 看到结果的时候,并没有太多惊喜,更多是如释重负。
这个项目的起因是一个我特别为之激动的想法:
我开车的时候,总是嫌广播讲话慢。机器视觉做了这么多年的研究,然后youtube还是只有基本加速。为什么不能把简单的加速做出花样来?
15年6月的hackday花了一天,折腾出了原始demo,拿了那一届的雅虎hackday winner。 15年6月底,以前的mentor来berkeley开uist pc meeting,我就问他有没有兴趣,我可以做一个以前工作的followup。 那个时候我并不知道什么是真正的followup work,只是身边的人不停在告诉我工作要cohesive,我就似懂非懂地跟着走。 当时prototype的算法非常ad-hoc,并没有什么特别高级的视频分析技术。于是我拉了mit毕业的机器视觉同事,准备加入一些高级的机器视觉技术。
虽然组了队伍,因为自己是最junior的,所以基本还是我一个人干活。当时雅虎已经开始把研究员拉回产品线了,我上窜下跳也没能说服老板把这个项目变成我的正式项目,所以一般都是晚上和周末做这个项目。很多时候,其实自己也不知道为什么这么执着。回想起来,我就是想把这个厉害的工作发表出去。
这个状态持续到15年9月chi截止日期前一周。最后那一周,我住在公司里。我下午五点开始做这个项目,每天晚上做到3 4点钟,然后找个电话会议室关上门,在地上睡一觉。到第二天早上7点钟起床,去车库的自己车里继续睡。睡到9点,然后去公司食堂吃早饭,再去健身房洗澡,回工位干公司的活。之所以这么做,是因为觉得让同事知道在公司里熬夜是一件很丢人的事。
这是我第一次独立写论文,应该写得特别糟糕。最后以前的mentor截止日期前帮我熬夜改论文,我特别忐忑。 12月出来的论文结果在borderline上,审稿人嫌弃没有user study。 和两个coauthor商量一下以后,决定把这个topic做得更大,加入了很多新的内容,fancy的算法以及user study。这篇论文从4页短文变成了10页长文。
user study是最难的部分。公司里的人,时间是最贵的。卖尽脸皮,抓光了身边的朋友还是凑不足人数。我记得最后差的3个用户,是我在雅虎食堂里抓的陌生人。我看见落单吃晚饭的工程师,就上去问他愿不愿意帮我做个实验。
那段时间也是雅虎最艰难的时候,我被派去和几个加密学的研究员合作,写一些加密算法。因为已经打算要走了,我就提前和老板辞职了。交接工作的时间没那么忙,我就利用那段时间写代码。但依然是业余科研爱好者的节奏,持续到了uist的截止日期。
最后一周重复之前chi住公司的节奏。但是因为依然没有受过正经写论文的训练,最后论文还是写得磕磕巴巴。交完论文以后,两个合作者都发邮件指责我论文写得不好,说我的语法还不如高中生。我当时也是不服气,怒怼了回去。
我觉得 uist 版本要比之前的 chi 短文好很多,然而 reviewer 还是不喜欢我们的 user study。审稿人们想让我做一个我不认同的 recall test,而我觉得这个test是形式主义,并没有实际意义。因为之前的工作做了这个test,用户对他们看过的内容做判断。baseline是判断题50%的准确率,等于baseline里什么也没记住。我坚持不想做这个test。
这之后我从这个项目里放空了2个月,开始做别的项目。16年6月出uist review,我到16年8月开始继续做这个项目。8月里,我花了自己的 300美金在 mechanical turk 上做了一个deployed study。很开心,结果和数据都很好。觉得这些应该可以中chi了。最后交论文的时候有个小插曲,最后时刻觉得视频应该有配音,开车去学校找同学配音遇上堵车,我绕回小区,抓了小区健身房里的一个native小哥帮我录的音。
因为之前没中过chi,觉得第一篇chi还是很期待。而且这篇paper论文如果能中chi,想着对我也会是很大的鼓舞。因为是自己在drive整个项目,从idea到组队再到最后把握方向。
12月的chi结果很出乎意外,审稿人给了比uist更低的分,还是要求我做recall test。因为已经被拒过2次了,这一次 coauthor 也基本没什么大兴趣,并不想折腾rebuttal了,建议我可以找个差一点的会议。
我有点不甘心,第一次写了一个strong rebuttal,背着我的coauthor偷偷提交了。rebuttal里我challenge了一个应该很senior的reviewer。那个reviewer后来很生气,把分数从2分降到了1分。
收到最终review的那天,并不是特别开心。有无数个瞬间我觉得这个work可能再也发表不了了,我愤愤地和yaozheng说,有一天我要用这篇paper做一个startup,回来打这些审稿人的脸。
“把球还给我,我要回家了”
艹,老子不和你们这帮**玩了”。
写rebuttal的时候很沮丧,似乎连我的coauthor也觉得这是一个不好的work。而我因为背负了那么多的沉没成本,越是这样又越想往前走。
收拾起心情,我和 coauthor 说,我花了很多时间在这上面,我不想投二类会议,让我再试一次。 经过cmu一学期的学习,我开始有些摸到门道。这次投稿前,我才第一次知道应该怎么审视一篇论文。发现以前因为觉得自己写得不好,不敢去改coauthor写的内容,其实很多描述都和我自己想的pitch并不一样。
既然coauthor们都已经放任我做主了,我就把所有不合我心意的pitch全都换成了自己的想法。如果不中,那也全是自己的锅。不怨别人。
所幸,最后有了好的结果。谢谢acm multimedia,成全了一个小人物的梦想。