机器之心原创

英文:CZ、QW

中文:李亚洲、路雪


今年,就在夏威夷!


CVPR(计算机视觉与模式识别会议)是计算机视觉领域的三大顶级会议之一,它的举办让七月的火奴鲁鲁更加热情似火。


据大会第一天官方宣布的统计数据,CVPR 2017 已经收到 2620 份有效提交论文、783 份接受论文、215 份长和短口头报告、3 个并行议程,得到来自 127 位赞助商 85.9 万美元的赞助资金,大约 5000 位参会者参加会议。


经过一整天密集的学术讨论之后,学者们不得不再次进行艰难抉择:今晚该去哪场宴会?大会期间,包括谷歌、Facebook、英特尔在内的许多高科技公司都因为各自不同的目的举办招待会。其中一些是为了招聘人才,另一些则是为了得到合作伙伴的认可。


其中有一个极为独特的活动——IJCV Asia Night,这一活动的两大关键词是「IJCV」和「亚洲」。


IJCV 首位华人主编汤晓鸥教授主持 IJCV Asia Night


计算机视觉研究:三大顶级会议、两大顶级期刊和一个 arXiv 平台——该去哪里发表论文?


众所周知,计算机科学领域有三大顶级会议(CVPR、ICCV、ECCV)和两大顶级期刊(IJCV 和 TPAMI)。


CVPR 的举办地点在美国,ECCV 在欧盟内轮转,ICCV 则在欧洲、北美和亚洲轮流举办。不同于 CVPR 每年都会举办,ICCV 和 ECCV 两年一度,正好交替错开。


两大期刊中,国际计算机视觉期刊(IJCV)由 Springer 出版,而 TPAMI 则来自 IEEE。这两大期刊的影响因子都已经超过了 8,大多数工程学科期刊的影响因子通常在 1 或 2 左右。


为了更好地理解计算机视觉研究的发表情况,我们在 CVPR 2017 大会期间与 Springer 计算机科学编辑总监 Jennifer Evans、香港中文大学信息工程系主任汤晓鸥教授聊了聊。


汤晓鸥(Xiao'ou Tang)教授曾担任 ICCV 2009 的议程主席(Program Chair),也将于 2019 年担任 ICCV 的大会主席(General Chair)。目前汤晓鸥教授在 IJCV 担任主编,也是该期刊的首位华人主编。


汤教授表示:「计算机科学领域不同于其它大多数科学学科。在其它领域,期刊通常用来发表研究成果,而大会则主要是以交流为目的。但是,由于计算机科学领域的飞速发展,会议也变成了另一个发表成果的重要渠道。」


据汤教授介绍,计算机视觉期刊的评议过程更为严格,也因此会花费更长的时间,而会议能让作者们更快地发表自己观点。「但期刊发表更为稳健可靠」,Jennifer 补充道。


通常会议发表的论文最多只能有 8 页,而期刊可以接收更长的论文。汤教授说:「这一领域的许多综合研究论文可能会有 20 页左右。」期刊让研究者可以更加详细地发表他们的研究成果。研究者可以先在会议上发表一个「简短」版本,然后在研究更加成熟以后将扩展版提交给 IJCV。


在计算机科学领域的成果发表上,数字化也发挥了重要作用,尤其是在人工智能领域。「过去,大多数大学图书馆会订阅期刊,而我们必须参加会议才能及时接触到在会议上发表的论文。现在读者可以提前在线获取被接受的会议论文。arXiv 也成为一个分享研究的重要平台。」汤教授表示,「这三个渠道都有各自的优缺点。」


作为 IJCV 的现任主编,汤教授耐心地解释了他的职责。


首先主编会查看论文并将其分配给在这一研究领域经验丰富的副编辑,然后副编辑会邀请至少 3 位评议者来审阅这篇文章并给出是否录取建议。在考虑了这些评议者的意见之后,副编辑会决定是否请提交论文的作者进行修改。Jennifer 说:「修改是常事,有时候修改过程要进行好几轮。」最后,副编辑会向主编推荐接收或拒绝此论文。主编根据副编辑的推荐、评议者的意见,做出最后的决策。


主编的另一个重要职责是任命编委会的副编辑。保持高质量的副编辑团队是撑起期刊质量的关键。在计算机视觉领域,成为 IJCV 和 TPAMI 编委会的成员要有极高的声望。目前编委会中亚洲成员的数量占比,相比于亚洲研究员在这个领域中的比例,要小得多。


过去三年里,IJCV 有 1300 多位评议者,其中 50% 至少评议过两篇 IJCV 论文。Jennifer 强调了期刊主编的重要性:「主编必须谨慎选择,只有在领域内备受尊敬的研究者才能做这样的决定。」


作为 2009 年 ICCV 的议程主席,汤教授认为会议的双盲机制(double blind review mechanism)是会议论文发表保持公平公正的关键。


与传统的期刊和会议渠道不同,新兴的数字平台 arXiv 控制力度最小,同时也最有活力。通过 arXiv,有价值的工作可轻松获取和引用。也因此,arXiv 变得极为流行,每天有超过 20 篇论文在该平台发表。但是这也带来了过滤的问题——有价值的成果可能会被埋没。汤教授谈到了他所观察到的现象:「如果不太知名的研究者只在 arXiv 上发布论文,即使他的研究具有很高的价值,该论文也很难获得很多引用。」


IJCV 主编汤晓鸥教授,Springer 出版总监 Jennifer Evans


亚洲青年研究者的崛起:回望过去,展望未来


Kyoung Mu Lee 教授是 ICCV 2019 的大会主席,同时现任 TPAMI 的副总编,CVIU 的领域编辑,SPL、MVA 和 IPSJ 的副编辑。IJCV 宴会期间,Kyoung Mu Lee 发表的主题演讲谈到了人工智能在韩国的爆发,不仅有众多创业公司兴起,也有很多传统公司转向了人工智能技术领域。与此同时,包括 KCVS 和 KCCV 在内的学术活动也正在快速发展。


在 MIT 拿到博士学位之后,林达华教授回到中国并加入了香港中文大学。谈及中国政府 7 月份最新发布的人工智能规划,林教授表示,有了政府在资金、数据、人才与知识产权上的支持,中国的人工智能研究会得到进一步发展。


谷歌云人工智能与机器学习首席科学家,斯坦福人工智能实验室、斯坦福视觉实验室主任李飞飞也在本次宴会上发表了鼓舞人心的演讲。在演讲中,李飞飞教授提到了世界上正在发生的两大趋势:一是由智能机器引领的第四次工业革命,二是随着亚洲崛起而带来的一次地缘政治新洗牌。她提到,CVPR 2017 论文中大约一半的第一作者都是亚裔人士。


但这就意味着亚裔已经接管了这一研究领域吗?


汤教授给出了一个非常有趣的比喻:「如果你把做研究项目看作是做电影,那么前面的学生就像是演员,后面的教授或导师是制片人、导演。亚洲高质量的制片人和导演还是只占少数,谈论接管这一领域为时尚早。」


要取得研究事业的发展,亚裔还面临着一些文化方面的难题。


吴郢(Ying Wu)教授凭借其「在计算机视觉领域对视觉运动分析和视觉模式发现的基础性贡献」成为 IEEE Fellow。在 CVPR 2017 期间的这场 IJCV 活动中,吴郢教授讨论了西方人对亚洲研究者的「姓名失明(name-blindness)」问题。


亚洲人的名字姓在前,西方名字姓在后,依照西方的习惯,在论文引用中很难准确识别亚洲作者名字,因为许多亚洲作者有同样的姓,例如「何」姓就很常见。所以,在引用中使用作者的全名非常重要。对此,宴会的主持人汤晓鸥教授极其赞同。他开玩笑说,他已经把自己的名字缩写改为 XO,类似于很罗曼蒂克的 XO 白兰地,然而令他失望的是一些损友坚持认为「XO」是一种中国酱料「XO 酱」。此外,它还代表亲亲抱抱。


宴会上,除了让引用亚裔人士的研究论文更加容易这一点,众多德高望重的学者们在演讲中提出,亚裔研究员还可以为这个群体做出更多贡献。


沈向洋在演讲中表达了对黄煦涛教授作为前辈、良师的感谢。


很多学者也对黄煦涛(Thomas Huang)教授和金出武雄(Takeo Kanade)教授表达了自己的特别感谢——他们是伟大的榜样,也慷慨地帮助着新一代研究者。汤教授也表示上一代研究者的精神激励着这一代研究者,他希望新一代研究者也能将这种精神继续传递下去。


新一代的亚洲研究员还应该考虑什么?


李飞飞教授在她的演讲中引用了她最喜欢的哲学家香农·沃伦(Shannon Vallor)的话:「机器是没有独立的价值观的,机器的价值观就是人类的价值观。」


随后,她向所有人提出了一个开放问题:「人工智能将会改变世界,你如何改变人工智能?」


IJCV 亚洲之夜主题演讲总结


本次亚洲之夜的主题之一是「龙虾」,汤晓鸥教授以一个关于龙虾的玩笑作为晚宴开场,他回忆说,当年在麻省理工读博士学位时龙虾是物美价廉的食物,然而在今天的北京,即便是小龙虾也贵比当年的波士顿龙虾,因此决定请嘉宾们在夏威夷享受龙虾大餐,希望能把机票钱省回来,一个段子引燃了全场欢乐的氛围。


随后,汤教授介绍了将进行开场致辞的沈向洋博士,沈向洋博士是微软全球执行副总裁、人工智能与全球研发负责人,也是 IEEE、ACM 成员,美国国家工程院院士。


沈向洋博士曾在前一天的 CVPR 大会主题演讲后的 QA 环节被问及为什么一些优秀的学者从 MSR 跳槽去其他机构,汤晓鸥教授再次以幽默的答案回复了这一问题:因为 MSR 培养了整整一代优秀的学者,所以人才只能单方面向其他机构流动。


沈向洋博士


微软全球执行副总裁、人工智能与全球研发负责人发表演讲


沈向洋博士在演讲中回顾了他在微软亚洲研究院的时光,并且提到了他的许多同事。2005 年,沈向洋成为 MSRA 的负责人之后,汤晓鸥教授从他手中接管了计算机视觉组。许多目前亚洲顶级研究员都是出自该组。沈向洋也表达了他对黄煦涛的感谢与尊敬。


之后,沈向洋博士表达了他对新一代研究员的期许:向前辈看齐!当代研究员努力工作,下一代也会学习、尊敬他们。如此,这个群体就能持续发展、繁荣。微软亚洲研究员的科研人员和毕业生是这一领域的传奇,他们很多人对这一领域做出了卓越贡献,并且引领学术潮流。许多参与到计算机视觉研究中的亚洲人已经变成一股不可忽视的力量。


ICCV 是 1990 年才传播到亚洲的,第一次举办是在日本,并且将于 2019 年在韩国举行。2005 年,ICCV 由沈向洋博士和其他学者带到了中国。亚裔科学家参与 CVPR 的传统可回溯到 1983 年,当时金出武雄是 CVPR 的创始大会主席。如今,大量的中国公司都跳进了 AI 这一领域。对于计算机视觉来说,现在就是最好的时代了。正如人们所见,参会者的数量每年都在直线上升。


沈向洋博士说他很喜欢「享受做计算机视觉的乐趣,并且永远保持年轻」这句话。他鼓励年轻人要加紧步伐,成为成功的科研人员,并且帮助我们的下一代继续进行研究与学习。他呼吁大家互相团结,因为团结会使我们更强大。


池内克史教授


IJCV 前主编池内克史教授在 IJCV 宴会中演讲


池内克史(Katsushi Ikeuchi)教授是 IJCV 的前主编,他也是微软亚洲研究院(MSRA)的首席研究员、东京大学 Emeritus 教授。


在演讲中,池内克史教授谈到了 IJCV 的现状,它的影响因子已经达到了 8.22,这在工程领域是非常高的。IJCV 从论文提交到第一次决定是否接收平均需要 89 天,从接收到在线发表需要 23 天。此外,亚裔研究者在提交论文和下载论文方面都发挥了重要作用,大约占到了 50%。


另外,IJCV 也在亚裔社区发挥着关键性作用,池内克史教授鼓励大家通过亚裔社区支持 IJCV,当然也包括每两年举办一次的 ACCV。他也提议开发增强智能(Augmented Intelligence),而不只是人工智能(Artificial Intelligence)。


金出武雄教授


金出武雄教授在 IJCV 亚洲之夜中演讲


金出武雄教授是卡内基梅隆大学机器人和计算机科学研究所教授,该校最高荣誉 U.A. and Helen Whitaker University Professor 得主。他是计算机视觉领域的世界权威,IJCV 创始主编、CVPR 的创始主席。


金出武雄教授对计算机视觉领域众多先辈表示感谢,如傅京孙(King Sun Fu)教授、黄煦涛教授等。在模式识别和图像处理之前,图像理解是计算机视觉领域的主流。那时,他就与其他德高望重的学者一道创办了 CVPR 和 IJCV。演讲中,金出武雄教授回顾了 IJCV 如何成为计算机视觉领域顶级刊物,他们邀请最好的会议论文,设置非常严格的标准。最后,他号召更多有才能的研究者加入计算机领域。


Rama Chellapa 教授


CVPR 2017 大会主席 Chellapa 教授在 IJCV 宴会中演讲


Chellapa 教授是 TPAMI 前主编、CVPR 2017 大会主席,马里兰大学计算机科学系 Affiliate 教授和电气工程系教授。


他在演讲中特别称赞了他的老师、导师和启发者。和其他研究者一样,这样一位成功的学者也得到了计算机视觉界的帮助。Chellapa 教授对许多世界级的大师表达了感谢,如 R.L. Kashyap 教授、Azriel Rosenfield 教授、傅京孙教授、黄煦涛教授和金出武雄(Takeo Kanade)教授。


Kyoung Mu Lee 教授


Kyoung Mu Lee 教授,ICCV 2019 大会主席,在 IJCV 宴会中演讲


Kyoung Mu Lee 教授是 ICCV 2019 的大会主席,目前担任 TPAMI 的副总编、CVIU 的区域编辑,SPL、MVA 和 IPSJ 的副编辑。在演讲中,他谈到了人工智能在韩国的爆发,大量创业公司兴起,许多传统公司转向人工智能技术。与此同时,包括 KCVS 和 KCCV 在内的学术活动也正在快速发展。此外,ACM Multimedia 2018 将在 2018 年 10 月 26-28 日在韩国首尔举办,他是会议组织团队的主席。当谈到他在 TPAMI 中扮演的角色时,他提到 IJCV 和 TPAMI 的影响因子都超过了 8,而 TPAMI 的影响因子一直都很高,从 2015 年的 6.77 增长至今。


李飞飞教授


李飞飞教授在 IJCV 宴会中演讲


李飞飞教授是斯坦福大学计算机科学系的副教授。她也是谷歌云人工智能、机器学习部门的首席科学家,斯坦福人工智能实验室和斯坦福视觉实验室的主任。


现在是人工智能的历史性时期,也是人类的历史性时期。对于 CV 科研人员来说,李飞飞教授是计算机视觉界最著名的亚裔研究员之一。尽管李飞飞教授已经做了大量有影响力的工作,比如 ImageNet 和视觉识别挑战赛,她仍然谦逊地表示,自己不过是一名站在巨人肩膀上的普通科研人员。她表示很多亚裔背景的人对她的职业生涯产生了巨大的影响,并且分享了当她还是一名年轻的教授时,她的同事和朋友在一些特别时刻给予她的支持:她的「学术教父」加州大学伯克利分校的 Jitendra Malik、加州大学洛杉矶分校的 Song-Chun Zhu 教授、微软的沈向洋博士、普林斯顿大学的 Kai Li 教授。她还感谢了她的两名学生:决定全力支持 ImageNet 项目的 Jia Deng,和既是学生也是现在谷歌同事的李佳。她们的合作和友谊影响了她的日常工作方式。


「能力越大,责任越大。」李飞飞引用《蜘蛛侠》里的台词来诠释这一代研究人员能力与责任的关系。当今世界有两大主题:


  1. 我们正在经历由智能机器和快速发展的网络社区引领的第四次工业革命;

  2. 地缘政治洗牌,或者说「亚洲崛起」。许多科技公司的 CEO、CVPR 论文作者是亚洲人,更重要的是,中国是第一个意识到 AI 力量,并发布人工智能白皮书的国家。


但是,这也是一个对人类充满挑战的时代。拿聊天机器人来说:它们可以帮助偏远地区的人们获取医疗和教育机会,也可以成为网络暴力和虚假信息的来源。另一个例子是自动驾驶汽车。它们或许可以使我们免于交通事故,保护环境,但是我们还应该想到自动驾驶对劳动力市场的影响。技术巨头和创业公司正在追求 AI 的力量,但是这有助于构建更好的生活吗?AI 会使有钱有权的人拥有更多的财富、更大的权利,使世界变得更加两极化吗?历史已经证明人类与生俱来的创新欲望也会带来灾难。


在演讲最后,李飞飞引用了她最喜欢的当代哲学家香农·沃伦(Shannon Vallor)的一句话:「机器是没有独立的价值观的,机器的价值观就是人类的价值观。」然后,李飞飞留下了一个开放性问题:「AI 将改变世界。你将如何改变 AI?」


张正友博士


张正友博士在 IJCV 宴会中演讲


张正友(Zhengyou Zhang)博士是 CVPR 2017 大会主席,IEEE Fellow、ACM Fellow,现任微软研究院的首席研究员、研究经理。


和其他演讲者一样,张博士首先真挚地感谢了他的指导教授和导师。他的第一篇计算机视觉论文在 1989 年被第二届 ICCV 接收。那时候,他感觉论文写得很糟糕,但那时候的审查更加宽容。然后,他尝试提升自己的写作能力,并出版了自己的书。


他给年轻人的建议是:保持冷静,保持专注,把时间花在有意义的工作上。他自己的生产周期是两年一篇论文。他鼓励年轻人不要心急,如果要成大事,做出有影响力的成果,就必须专注。一旦工作达到了一定水平,其他人就能从中受益。


吴郢教授


CVPR 2017 议程主席吴郢教授


吴郢教授是 CVPR 2017 的议程主席,目前任教于美国西北大学电子工程与计算机科学系。


吴郢教授凭借其「在计算机视觉领域对视觉运动分析和视觉模式发现的基础性贡献」而成为了 IEEE Fellow。但这样一位备受尊敬的研究者却将自己看作是社区(尤其是亚裔社区)的服务者。我们知道,参会者的数量正在以惊人的速度增长,而且亚裔先驱和领袖正在这一领域发挥重要作用。


但是亚裔研究员仍然面临难题。例如,亚洲人姓在前,而西方语言姓在后。这导致在引用中难以准确识别名字。许多不同的作者有着同样的姓。例如,「何」姓就很常见,所以在引用中使用作者的全名非常重要。


Yanxi Liu 教授


CVPR 2017 的议程主席 Yanxi Liu 教授


Liu 教授是 CVPR 2017 的议程主席,也是宾夕法尼亚州立大学计算机科学工程和电子工程系教授。


Liu 教授发表了一个关于模式(pattern)的演讲。首先,她谈到很多定义模式的方法,比如运动、纹理和对称性。模式的基本属性是不断反复出现。我们可以通过无监督搜索、检测循环模式、寻找语义含义或聚类子空间来寻找模式。


在演讲中,她向我们展示了一段河鲀创造惊人的完美圆圈的视频。模式存在于任何地方,不只是人类社会。


机器之心英文网站文章链接:https://syncedreview.com/2017/07/31/one-night-at-cvpr-2017-exploring-ijcv-and-the-asia-research-force/