管家婆彩图自动更新,管家婆彩图100tk,管家婆彩图大全中特白小姐,www.819kj.com,www.4448889.com

管家婆彩图大全中特白小姐

坏论文都写不满 8 页?这位顶会主席训练了一个好坏论文“颜值”

发布日期:2019-10-02 15:19   来源:未知   阅读:

  最近几年,研究者往计算机视觉领域的顶会投的论文越来越多。下图就能明显看出这一趋势,尤其是从 2016 年开始,论文提交的数量成指数型增长。如此激烈的竞争也让很多研究者颇为焦虑,到底什么样的论文更容易被顶会收录呢?

  来自弗吉尼亚理工学院的 Jia-Bin-Huang 教授利用神经网络生成了一个识别好坏论文的分类器,通过输入论文的整体版面的视觉情况(就是看 脸 )来使分类器预测一篇论文应不应该被接收。

  简单来说就是,这位研究者希望告诉大家,在论文内容不变的情况下,如何排版和撰写更能写出一篇 好论文 。

  好论文的特点:第一页中都有预告图用于说明主要思想,有各种表格 / 图表均衡插入论文各处,来展示验证性实验,有重要的数学方程式,以及有彩色图像列表来量化数据集的基准。

  坏论文 的特点:通常都写不满 8 页;前两页缺少数字和插图会让读者看不懂。

  除了给研究者写论文的参考,作为 CVPR 2019、ICCV 2019 的领域主席,作者更希望通过论文中提到的 好坏论文分类器 ,来减轻论文审核人的工作量。

  最终得出的结论从数据上说值得一看。根据测试数据集的检验,此分类器允许 0.4% 容错率的情况下(拒绝 0.4% 好论文),能够准确的判断出 50% 的 垃圾 论文。总的来说,在论文数量庞大,审稿人有限的现实下,这个分类器能够大大减少工作量。

  作者还自嘲了一下,自己这篇论文拿给分类器审核,得出的结论是 97% 的概率会被拒稿。

  训练这个分类器所使用的训练数据集是 2013~2017 年 CVPR 和 ICCV 的会议论文,将这些数据丢进神经网络,根据论文的 颜值 ,输出论文的质量。用 2018 年 CVPR 的论文进行验证,准确率达到 92%。

  此外,Jia-Bin-Huang 还为广大的计算机视觉领域的研究者提供了一些建议,帮助他们提高论文美录用率。

  研究方法的创新之处,是在训练数据的过程中并不是直接学习图像的映射。而是通过端到端的训练过程,以深度学习的方式重新审视 颜值 问题,从而能够学习特定任务的表现形式。

  因为无法获取到被拒绝的论文,研究者用 workshop 的文章做一个近似。

  当然,作者也对这一 差论文 的数据集进行了说明,毕竟非常多的 workshop 论文也会被重要会议收录。

  同时,workshop 的文章被认作 hard negative,有很多文章被评论和复审标示出来从而得到了改进。

  文件分类:一些 workshop 对于主要会议文章的有其特定的版面要求,例如需要 6 页的内容是与数据来源相关。正版王中王玄机中特网,分类就变得不那么重要。我们因而只保留 7 页多一点就已足够。

  PDF2Image::我们用一种基于 python 的软件 -pdf2image- 把 pdf 文件转换成图片,然后剪裁成 2 × 4 网格大小。如果缺失第八页,我们就给它放一空页。原始转换后的图片有 2200 × 3400 像素那么大。

  预处理:避免数据落项,我们会把首页标题去掉。如果不做这一步,分类器很多时候就会出现故障,它就只关注标题部分而忽视了整篇文章可视化的内容。

  如何提高论文的录用率,当然颜值要过关啦,为此,作者利用 GAN 训练了一个好论文的生成器。数据集仍然采用 2013~2017 年的顶会数据集。训练硬件使用两个英伟达出品的芯片(NVIDIA Titan V100 GPU),整个训练过程大约需要一周的时间。

  训练结果如何?上图是生成器生成的 15 个随机样本,他们都有共同的特点:图表,方程平衡布局。但是看起来很费力气,尤其是在生成数字和表格方面。这个难怪,因为,训练集中的每个图形和表格都是独立的。

  用生成器修改过的文章看起来并不完美,所以它的利用效能还是很有限,尤其是它很难保持一个特定的模板来确定一个正要发表的文章的好坏。

  此外,我们也想把坏文章变得好一点。没那么多文章可以练手,就用神经转积神经网络,对不一样的两图进行匹配。这很像我们之前用 2013-2017 的会议和 workshop 文章所做的实验。

  好论文是什么样子,至少在正文第一页中要有让读者有看下去的冲动,例如在开头说明论文 性感 的主题思想,放上令人印象深刻的数学公式,以及用实验数据生成的漂亮的图像。

  不少同学评论, 有意思 ,毕竟这一研究结果可以为自己在顶会上发文章提供一些参考。

  但是也有非常多的质疑声。最大的问题就是,关于给好论文设指标这件事,本身就是个伪命题啊。

  在 reddit 有同学直接指出,一旦这个论文套路被所有人熟知,那么明年的论文评审规则必定跟这个规则不一样了。

返回