English
邮箱
联系我们
网站地图
邮箱
旧版回顾



博天堂网上赌博平台:泰安高新区16个重点项目集中开工总投资约325亿元

文章来源:博天堂网上赌博平台    发布时间:2018年07月23日 03:55  【字号:      】

博天堂网上赌博平台推介会活动现场,海口推介团队通过有奖问答、微信摇一摇等方式,将现金红包、春光特产大礼盒以及“海口三天两晚奢华体验游”等丰厚的礼物送给现场嘉宾及市民游客。

“近年来,随着北部湾沿岸城市社会经济水平的较快发展,众多来自西南、西北地区的游客也将北海、钦州及湛江作为来海南旅游的中转站,所以在此举办推介会意义重大。”海口旅游委相关负责人表示,这次推介效果良好,扩大了海口在北部湾城市群中的影响,明年将继续在北部湾城市群进行更多推介。

继续传递母瑞山革命精神

“能获得这个荣誉,我十分激动,要感谢很多人。”王学广说,他很感谢定安当地政府各个部门对他的关怀和支持,而他所获得的荣誉也有他老伴黄德美的一半功劳。

原来在退休后,王学广发挥余热,在母瑞山革命根据地纪念园做义务讲解员,如今80岁高龄的王学广表示,他要以这次为新起点,不忘初心,勤奋工作,传播母瑞山火种,传递母瑞山革命精神,继续贡献自己的余热。(南国都市报记者 王燕珍)为什么我们要反对洗稿?

“差评”风波反思:要消灭洗稿,还得靠内容平台

正如我此前所言,电影、音乐、图书,许多内容产业从萧条到繁荣,无一不是在构建了相对完善的内容知识产权保护体系之后——并且都是最近几年的事情。现在,内容创业如火如荼,知识产权是根基。

当高云翔性侵事件曝光后,董璇站出来力挺高云翔,表示相信高云翔,认为高云翔是无辜的,被人陷害的。

董璇没有受到高云翔的性侵官司影响,回到家乡参加活动,心情大好的董璇,是否暗示高云翔真的快出狱了吗?

据悉,高云翔和董璇在2009年的一场晚会上相识,当时凑巧被安排在一起合唱了一首《生命中的每一天》。之后两年,高云翔董璇并没有什么进展。2011年,高云翔和董璇又碰面了,两人在经纪人的努力撮合下交往的,从确定恋爱到结婚,他们一共才交往4个月时间。结婚7年,一直很幸福。让人意外的是,董璇前脚刚离开悉尼,第二天高云翔就出事了。

都说“困境中的孩子早当家”,陈重丝、陈重宏两兄弟很早就学会帮母亲分担。

洗衣服、做饭,种菜、施肥,这些活兄弟俩上小学后就学会了。只要他们在家,基本都是兄弟俩做家务,不用母亲操劳。陈重丝作为老大,更是早早成熟。王茹仍记得,在陈重丝六七岁时,他每天放学后就开始捡瓶子、废纸等垃圾卖,卖来的钱也不会乱花,而是交给母亲买菜吃。

10多岁的陈重宏正是长身子的时候,然而,寄宿的他每个月只有50块钱的伙食费。“这点钱,孩子每天都吃不好,周五他基本都不吃饭了,饿到晚上回家再吃。”王茹眼圈红红地说,即便千辛万苦,孩子也没什么怨言。

本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。

4 免费参与活动至少一次(和记者一起实地采访和采写稿件,并有机会刊登在报纸、专属公众号等平台上);

5 一年期间择优在南国都市报习作版刊发一篇优秀作文;

6 南国都市报小记者将举行各种活动,小记者将优先享有报名参与免费活动权利,如有付费活动,则可享受最低折扣。




(责任编辑:张羽佳)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864