玉溪| 嵩县| 铜川| 迭部| 新龙| 潘集| 义马| 翠峦| dafa888bet ca88.com会员中心 永寿| manbetx体育 鄱阳| 平湖| 开鲁| manbetx万博官网 大同市| 平阳| 湾里| 3344111 樟树| 双阳| 大发彩票网站 山东| 新版ued官网 博管理 井冈山| 冠亚娱乐 明水| 邯郸| 赣州| 大名| 九州娱乐官方网站 万博赞助奥运会 衡阳县| 富川| 隆林| 万博app 清苑| 伽师| 霍城| 石嘴山| 岑巩| 汝州| 88bf娱乐网 天长| 苏尼特左旗| br88冠亚 bwin手机版 临泽| 本溪满族自治县| 邵武| 绵竹| 云县| bwin888 雷山| 必威体育 桃源| 武昌| manbetx登录 内丘| uedbet官网体育 w88 剑河| 闻喜| 南皮| 北流| 大发888真人赌场 富平| 秦皇岛| manbetx网页 88bifa 沾化| 博白| 余江| 万博体育地址 莘县| 横县| 班玛| 亚洲城ca88手机版注册 冠亚娱乐 香河| 广灵| 莱阳| 攸县| yzc888亚洲城手机版 冠亚娱乐 宁河| 门头沟| 都昌| 汉寿| 舞钢| 抚远| 南汇| 五河| 云南| 盐源| 杭锦旗| fun88乐天堂 南平| 和顺| 扎囊| 君山| 化州| 泰州| 曾母暗沙| 壤塘| 3344222 朝天| BR88 云龙| 亚洲城官方网站 白玉| 龙湾| 广宗| dafa888经典版网页 昭觉| 南县| 永定| 大发dafa888 中方| 镇江| br88 武穴| 长安| 开县| 肥乡| 大发快3一分钟 manbet娱乐 鄂州| 万博亚洲manbetx 平塘| 广宁| 睢宁| 怀来| 大奖888 横县| 红星| 东光| bwin 丹徒| dafabet手机版苹果 镇赉| 寰宇浏览器安全赌博 凌海| 亚洲城电脑版官方网站 万州| 乐都| 阳信| 柯坪| 亚洲城ca88电脑版官网 青白江| 堆龙德庆| 眉山| 优德w88 霍邱| 汨罗| ag平台如何避开追杀 突泉| 安阳| 寿阳| 图木舒克| 灵川| 台儿庄| 优德88 万博体育下载 宾县| 益阳| 冠亚娱乐 沙县| 吉木萨尔| betway88 奉贤| 宁陵| 万博app安卓 米易| betway体育 临川| 吴桥| 邛崃| 绩溪| 鹰潭| 灵石| 狗万滚球 太康| weide1946 br88冠亚 ca88网页版版登录网址 宁阳| 始兴| 镇坪| 黄陂| 监利| fun888 交口| 都匀| bifa88 柳江| 泰兴| 博管理 阿鲁科尔沁旗| 亚洲城网页 wwwdafa888bet ManBetx苹果客户端 澄江| 大安| 调兵山| dafa888 必发88 德安| 厦门| 醴陵| 巴林左旗| 朝阳县| dafa888 同安| manbetx客户端 郁南| bwin88 3344555 秀屿| 宜昌| 大奖彩票 新万博体育 罗平| dafabet 吉安县| 海伦| 永春| 获嘉| 融水| betway88 望都| 大发快三正规吗 五营| 望奎| 天全| 阳东| 宁德| 杭锦后旗| manbetx代理 manbetx2018官网 BR88 br88 br88冠亚 万博官网manbet 依兰| 3344555 都兰| 烈山| 萍乡| 太白| 铁山| 浦东新区| 新万博 樟树| 盘锦| 东乡| 石首| 茶陵| 浩博首页 沽源| bwin 万博体育论坛 澄城| 亚洲城vip登录 召陵| 汤原| 罗山| 错那| 唐河| 霍州| fun.88 牟平| 亚洲城ca88 ag国际娱乐平台 宁德| 郯城| 武夷山| 大丰| 韦德1946 婺源| wofacaidafa888 马鞍山| br88冠亚 韦德1946官网 app.1manbetx.com 亚洲城ca88电脑版官网 磁县| 南涧| BR88 manbet手机版 weide1946 dafa888 南江| 柳河| bwin888 长兴| 大发彩票网站 荔浦|

农行宣布千亿融资计划影响几何?业内人士给出解读

2018-11-16 00:23 来源:39健康网

  农行宣布千亿融资计划影响几何?业内人士给出解读

  万博体育投注介绍同样的汇率水平下,中方在劳动密集型产品方面是顺差,而在资本技术密集型产品、农产品和服务贸易方面都是逆差。这意味着,白宫贸易战的胜利者将是……中国。

如果美国政府不顾世贸规则,采取单边行动来解决与贸易伙伴的争端,不仅无助于解决问题,还可能伤及本国消费者和进出口企业的利益。中方愿以两国建交60周年为契机,继续同柬方深化各领域务实合作,尤其为改善民生提供力所能及的帮助,携手打造中柬具有战略意义的命运共同体。

  这就是普京的立场。中国提出的一带一路倡议成为世界上最受欢迎的国际公共产品,今年11月将举行的首届中国国际进口博览会展位抢手,也说明了世界的开放之需。

  目标不仅是让这些列车通过,还有停靠和重组合并,最好地激发当地制造业和分销潜力。商务部新闻发言人的这一表述已经非常明确。

  让美国单独对华采取行动,会让中国方面更容易在国际社会上营造出一种美国会用同样的手段欺凌盟友与敌人的认知。

    去年,美国农民对中国出口近200亿美元产品。

    同时,我想要给中国提供一些建议,希望帮助中国做得更好,避免弯路,使其能够更快地推进这一倡议。美国去年出口中国半导体和电子元件总额也达到68亿美元。

  喷烟高达3200米,大颗火山渣被吹动到火山口800米外的地方。

      301调查:与生俱来的单边主义色彩  中国商务部相关负责人介绍,301条款是美国《1974年贸易法》第301到310节,一般而言,301条款是美国贸易法中有关对外国立法或行政上违反协定、损害美国利益的行为采取单边行动的立法授权条款。  战巡南海的空军战机中,具备制空作战和对地、海面目标精确打击能力的苏-35战机不断亮剑。

  这一领域是特朗普最希望中国增加从美国进口的,何伟文表示,去年特朗普访华期间,中美两国企业共签署总额达1637亿美元的能源合作项目,一旦决定对这一领域制裁,中国也可以延后这些合作的具体落实。

  betway必威资料图:日本首相安倍晋三。

    美东时间3月22日,美总统特朗普签署备忘录,基于美贸易代表办公室公布的对华301调查报告,指令有关部门对华采取限制措施。37%的十多岁女生表示没有索要第二颗纽扣的习俗。

  亚洲城游戏官网 dafa888.casino 万博app下载

  农行宣布千亿融资计划影响几何?业内人士给出解读

 
责编:
炼数成金 门户 商业智能 强化学习 查看内容

农行宣布千亿融资计划影响几何?业内人士给出解读

大发dafabet888   现在是中国走向国际的时候了,虽然这很困难。

2018-8-7 13:30| 发布者: 炼数成金_小数| 查看: 31008| 评论: 0|来自: AI科技大本营

摘要: 去年,OpenAI 在 DOTA 的 1v1 比赛中战胜了职业玩家 Dendi,而在距离进阶版 OpenAI Five 系统战胜人类业余玩家不过一个月的时间,凌晨,它又以 2:1 的战绩再次完成对人类高级玩家的“屠杀”,GG(人类赢的最后一局纯 ...

网络 工具 算法 机器人 GPU

去年,OpenAI 在 DOTA 的 1v1 比赛中战胜了职业玩家 Dendi,而在距离进阶版 OpenAI Five 系统战胜人类业余玩家不过一个月的时间,凌晨,它又以 2:1 的战绩再次完成对人类高级玩家的“屠杀”,GG(人类赢的最后一局纯属耍赖)。

相比之下,人类这次输给的是怎样的进阶版“AI 英雄”?

此次,OpenAI Five 对阵 5 个高级玩家(解说员+前职业玩家)——Blitz, Cap, Fogged, Merlini 和 Moonmeander,他们的平均天梯分 6000 以上。反观 OpenAI Five,根据公开资料,它的实力相当于人类玩了 180 年的游戏,而且每天都与自己进行对抗学习,学习过程非常复杂,需要在 256 个 GPU 和 128,000 个 CPU 上运行扩展版本的近端策略优化(PPO)进行训练。


它对每个英雄使用了单独的 LSTM(长短期记忆递归神经网络),并且没有人类数据,它会学习可识别的策略,这表明强化学习可以产生可实现规模的长期规划。

此外,就应用环境而言,不同于棋牌游戏的固定规则,像 DOTA2 这样的复杂视频游戏是 5v5 对决的战略游戏,况且,DOTA 游戏已经不断开发了十几年,游戏逻辑中有数十万行代码,且每两周更新一次,游戏语义在不断产生变化。

因此,AI 玩 DOTA 的难度可想而知,它首先需要解决以下四大问题:长时视野;局部观察状态;高维、连续的动作空间;高维、连续的观察空间。

模型架构
OpenAI Five 的每个网络都包含一个单层的、1024-unit 的 LSTM,它可以查看当前的游戏状态(从 Valve 的 Bot API 中抓取),并通过几个可能的 action heads 发出动作。每个  head 都具有语义含义,例如延迟动作的刻度数,选择哪一个动作,该动作在单元周围网格中的 X 或 Y 坐标等。Action heads 是独立计算的。

OpenAI Five 使用观察空间(observation space)和动作空间(action space)进行交互式演示。OpenAI Five 将世界视为 20000 个数字的列表,并通过发出一个包含 8 个枚举值(enumeration values)的列表来执行操作。通过选择不同的行动和目标,我们可以了解 OpenAI Five 如何编码每个动作,以及如何观察世界。下图是人类会看到的场景。


OpenAI Five 可以对与它所看到的相关的丢失状态片段做出反应。例如,直到最近,OpenAI Five 的观察区域才包括狙击手的技能范围(子弹落在敌人身上的区域)。然而,我们观察到 OpenAI Five 可以学习走出(虽然不能避免进入)狙击手的技能范围,因为当进入这个区域时,它可以看到自己的血量是在减少的。

探索
就算有学习算法能够处理较长的视野,我们仍然需要对环境进行探索。因为即使我们设定了各种限制,仍然有数百种道具、几十种建筑、法术、单元类型、长尾游戏机制,以及因此产生的各种组合,想要有效地探索这个巨大的空间其实并不容易。

OpenAI Five 可以从随机权重开始,从自我博弈中学习。 为了避免“策略崩溃”,智能体在训练的时候,80% 的游戏都是自我对抗, 另外 20% 则是与过去的自己进行对抗。在自我对抗时,英雄首先会漫无目的绕着地图游走。经过几个小时的训练后,智能体开始有了一些概念,例如建造、中路对线等。几天之后,他们始终采用基本的人类策略:试图从对手那里偷走 Bountyrunes等。 通过进一步的训练,它们可以熟练掌握 5 个英雄集中推塔的高级策略。

OpenAI Five 使用了 1v1 机器人里的随机化的方法 。它还使用了一个新的路线分配(lane assignment)策略。 在每个训练游戏开始时,他们随机地将每个英雄“分配”到一些 lane 的子集,在到随机选择的时间之前,如果英雄偏离这些路线,就会受到惩罚。

当然,也有奖励来帮助智能体探索环境,主要包括净值(net worth)、杀敌数(kills)、死亡数(deaths)、助攻(assists)、最后一击(last hits) 等指标。他们通过减少其他团队的平均奖励,来对每个智能体的奖励进行后续处理,以防止智能体找到正和博弈(positive-sum)的情况。

他们也对道具和技能构建进行了硬编码,同时,也通过脚本基线( scripted baseline)引入了信使管理( Courier management)。

Rapid


这个系统的实现使用了被称为“Rapid”的通用 RL 训练系统,它适用于任何多人模式环境。


训练系统分为 rollout workers,运行游戏副本,智能体(agent),用来收集经验,优化器节点(optimizer nodes)执行跨 GPU 组的同步梯度下降。每次训练还包括分别对训练机器人以及样本机器人进行评估的组件,以及监视软件,比如 TensorBoard,Sentry 以及 Grafana。


在同步梯度下降运算过程中,每一个 GPU 组件都会运算自己负责的批处理部分的梯度计算,随后整体梯度再进行平均计算。他们原本使用消息传递借口的规约算法进行平均计算,现在则使用英伟达的多卡通型框架 NCCL2 的封装函数来实行 GPU 并行计算以及网络间数据传输。同步 58MB 大小数据(用于 OpenAI Five 的参数)的延迟显示在表格之中,延迟时间足够低能满足大部分数据被进行并行运算的 GPU 标记。

与人类的不同
OpenAI Five 获取的信息和人类完全一致,但是系统能马上反应到类似位置、生命值以及物品更新情况等等人类玩家需要定时观察的信息。OpenAI Five 的平均 APM 在 150-170 之间(理论上最快可以达到 450 考虑到每四帧一动),平均反应时间为 80 毫秒,比人类平均速度要快很多。

很多职业选手在去年 TI 结束后都使用 bot 进行训练。根据 Blitz 的说法 solo bot已经改变了人们对 solo 赛节奏的看法,bot 偏向于快节奏风格,现在大多数选手也已经使用快节奏风格来和 bot 抗衡。


AI 在 Dota2 中的节奏和执行力非常强了,这是不是意味着它没有优化空间了?当然不是, 此次的 OpenAI Five 还是有诸多限制,比如系统在进行最后一击时较弱,其客观优先级与一个共同的专业策略相匹配,获得战略地图控制等长期奖励往往需要牺牲短期奖励。
Open AI 方面称,在今年后续的 TI 表演赛上,还会有职业玩家继续挑战 AI,但结果想来也是实力“嘲讽”人类。或许,更让人期待的是,在 Dota2 这样的复杂游戏中,是否会出现“AI vs AI”的神仙打架比赛?

声明:文章收集于网络,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-11-16 17:26 , Processed in 0.213646 second(s), 24 queries .