AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

作者 | 王冰

编辑 | Camel

人工智能顶级学术会议 AAAI 2020 (第 34 届 AAAI)已在美国纽约开幕,会议从 2 月 7 日持续到 2 月 12 日。 本次的 AAAI 大会投稿量创下了 8800 多份的纪录。其中 7737 篇被审查,接受 1591 篇论文,录取率为 20.6%。相比 2019 年,今年 AAAI 录取率同比上升 27%,投稿量同比增长 13.6%。
不过由于疫情原因,据估计至少有 800 多名华人学者无法出席本届 AAAI 2020,而大量来自中国地区的论文作者也无法到会议现场做报告。针对这种情况,组委会提出“云会议”的方案,论文作者可以录播视频 oral (现场播放)或远程在线报告。
本文为牛津大学王冰等人的 oral 内容,隶属于“Tech Session 7: Vision: Image Retrieval, Ranking, Recognition”,将于美东时间 2 月 12 日下午 3:50-4:50 在 Gramercy 报告厅进行演示。我们在此可以先睹为快~

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

论文:https://arxiv.org/abs/1909.03557
代码:https://github.com/BingCS/AtLoc

欲观看更多 AAAI 视频解读,可点击下方「阅读原文」进行访问。

同时 AI 科技评论 欢迎所有 AAAI 2020 作者分享自己的 oral 视频或 poster 图片。

论文简介:

深度学习在视觉定位方面取得了令人印象深刻的结果。然而基于图像的定位方法普遍缺乏鲁棒性,从而导致较大误差。当前算法多通过图像序列或添加几何约束方法,迫使网络在学习时拒绝动态目标和光照变化对定位的干扰,以获得更好的性能。本文提出了一种利用注意力机制使网络自动关注并提取具有几何意义的对象和特征,即使仅基于单张图像,也可以实现优于利用图像序列或几何约束方法的定位结果。通过室内和室外公开数据集上的定位结果和显著图,我们阐述了如何利用注意力机制提取环境中具有几何意义的特征,从而实现最优的相机姿态回归性能。算法细节和源代码可访问 https://github.com/BingCS/AtLoc 下载。

(或者到 AI 研习社官网观看更多 AAAI 2020 论文解读视频:https://www.leiphone.com/special/custom/meetingVideo.html

作者简介:

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

王冰,牛津大学计算机系 2018 级博士,研究方向为 Robotics & Computer Vision.


**
AAAI 2020 报道:**

新型冠状病毒疫情下,AAAI2020 还去开会吗?

美国拒绝入境,AAAI2020 现场参会告吹,论文如何分享?

AAAI 最佳论文公布

AAAI 2020 论文集:AAAI 2020 论文解读会 @ 望京(附 PPT 下载)
AAAI 2020 上的 NLP 有哪些研究风向?微软 6 篇精选 AAAI 2020 论文

AAAI 2020 论文解读系列:

01. [中科院自动化所] 通过识别和翻译交互打造更优的语音翻译模型02. [中科院自动化所] 全新视角,探究「目标检测」与「实例分割」的互惠关系03. [北理工] 新角度看双线性池化,冗余、突发性问题本质源于哪里?04. [复旦大学] 利用场景图针对图像序列进行故事生成05. [腾讯 AI Lab] 2100 场王者荣耀,1v1 胜率 99.8%,腾讯绝悟 AI 技术解读06. [复旦大学] 多任务学习,如何设计一个更好的参数共享机制?07. [清华大学] 话到嘴边却忘了?这个模型能帮你 | 多通道反向词典模型08. [北航等] DualVD:一种视觉对话新框架
09. [清华大学] 借助 BabelNet 构建多语言义原知识库10. [微软亚研] 沟壑易填:端到端语音翻译中预训练和微调的衔接方法11. [微软亚研] 时间可以是二维的吗?基于二维时间图的视频内容片段检测12. [清华大学] 用于少次关系学习的神经网络雪球机制

13. [中科院自动化所] 通过解纠缠模型探测语义和语法的大脑表征机制

14. [中科院自动化所] 多模态基准指导的生成式多模态自动文摘

15. [南京大学] 利用多头注意力机制生成多样性翻译

16. [UCSB 王威廉组] 零样本学习,来扩充知识图谱(视频解读)

17. [上海交大] 基于图像查询的视频检索,代码已开源!

18. [奥卢大学] 基于 NAS 的 GCN 网络设计(视频解读)19. [中科大] 智能教育系统中的神经认知诊断,从数据中学习交互函数20. [北京大学] 图卷积中的多阶段自监督学习算法21. [清华大学] 全新模型,对话生成更流畅、更具个性化(视频解读,附 PPT)22. [华南理工] 面向文本识别的去耦注意力网络23. [自动化所] 基于对抗视觉特征残差的零样本学习方法24. [计算所] 引入评估模块,提升机器翻译流畅度和忠实度(已开源)25. [北大 & 上交大] 姿态辅助下的多相机协作实现主动目标追踪26. [快手] 重新审视图像美学评估 & 寻找精彩片段聚焦点27. [计算所 & 微信 AI] 改进训练目标,提升非自回归模型翻译质量(已开源)28. [中科院 & 云从科技]:双视图分类,利用多个弱标签提高分类性能29. [中山大学] 基于树状结构策略的渐进强化学习30. [东北大学] 基于联合表示的神经机器翻译(视频解读)31. [计算所] 引入评估模块,提升机器翻译流畅度和忠实度(视频解读)32. [清华大学] 用于少次关系学习的神经网络雪球机制(视频解读)33. [计算所] 非自回归机器翻译,基于 n 元组的训练目标(视频解读)34. [清华大学] 司法考试数据集(视频解读,附下载链接)
35. [自动化所] 弱监督语义分割(视频解读)36. [自动化所] 稀疏二值神经网络,不需要任何技巧,取得 SOTA 精度(视频解读)37. [华科 & 阿里] 从边界到文本—一种任意形状文本的检测方法38. [上交大 & 云从科技] DCMN+ 模型:破解「阅读理解」难题,获全球领先成绩39. [自动化所 & 微信 AI] 双通道多步推理模型,更好解决视觉对话生成问题
40. [ETH Zurich] 反向 R?削弱显著特征为细粒度分类带来提升41. [中科大] RiskOracle: 一种时空细粒度交通事故预测方法42. [华为] 短小时序,如何预测?——基于特征重构的张量 ARIMA43. [清华大学] 棋盘游戏做辅助,进行跳跃式标注(视频解读)44. [商汤] 新视频语义分割和光流联合学习算法45. [商汤] 新弱监督目标检测框架

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

更多 AAAI 2020 信息,将在「AAAI 2020 交流群」中进行,加群方式:添加 AI 研习社顶会小助手(AIyanxishe2),备注「AAAI」,邀请入群。

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)

AAAI Oral 提前看:牛津大学利用注意力机制,实现最优相机定位(视频解读)点击“阅读 原文” 前往 AAAI 2020 专题页