yh86银河国际(中国)有限公司

核心技术
Core Technology

NashZero

面向决策智能的智能体分布式学习框架，集成多种SOTA多智能体算法（DQN、D4PG、DDPG、R2D3、QMIX等）的基础上，统一了深度强化学习算法开发范式和评估体系，并提供高效的分布式并行训练能力。
NashArena

面向博弈对抗的仿真内核，包括对抗引擎、地图引擎、对抗算子体系、态势体系、计算模型等，提供二次开发SDK，可以快速搭建不同场景的博弈对抗仿真环境。
NashStudio

提供仿真环境接入、智能体建模开发、训练发布、模拟对抗、复盘分析等全面的智能体研发、评估和服务能力。

产品优势
Product Advantage

易用的智能体开发工具集
提供了一整套完整的智能体开发与应用管理工具体系，旨在降低智能体开发的门槛。DataExa-Nash框架内置不同场景下丰富的智能体开发算法模板。借助平台模板，可以实现低代码甚至零代码开发。用户在新建项目时选择该模板，模板已提供好智能体代码和各配置信息，直接进行训练即可
丰富的自定义演算训练环境集成
通过仿真环境管理的适配模块，能够快速接入到不同的仿真环境，满足不同环境下智能体训练的需求，减少用户搭建部署复杂环境的成本。此外，用户也可以在系统提供的基础仿真环境上进行细致的配置，可支持仿真场景和规模自定义，智能体数量和种类自定义，智能体特征和属性自定义，智能体行为回报规则和回报值自定义等，满足不同场景下的开发需求
完备的智能体模型算法库
提供了丰富的多智能体模型算法库，包括算法库以及网络模型组件库。算法库包含了传统强化学习、深度强化学习及多智能体等算法。网络模型组件库包含多个粒度的网络结构组件，定义了丰富的网络组件结构和对应的通用连接。用户可调用模型算法库中的算法及网络模型，智能体通过算法库中的核心算法推算出对应的动作并执行，从而与仿真场景产生交互，得到环境观测值并计算出回报，并不断进行迭代训练
方便的先验策略嵌入设计
框架环境模块集成自定义先验策略（知识图谱等）嵌入接口，通过该方式让智能体拥有对应操作环境的先验知识，可以极大缩短训练时间，提高多智能体的策略学习效率，提供高质量的辅助决策方案

客户案例
Customer Case

某部智能仿真推演系统

客户名称：

某部队
所属行业：

国防
客户痛点：

面对瞬息万变的指挥控制环境，人为的策略制定需要高级的指挥人员具备丰富的相关经验，且人工的策略更新可能无法应付过多的复杂场景
应用成效：

围绕军种典型作战模式，构造作战想定场景和地图环境，面向旅级的红蓝对抗系统，建立聚合集兵力模型（最小到班）、平台型模型（通信、电抗、工程等）。结合多智能体强化学习进行不完备信息博弈，对战场环境作战单元的以往动作进行价值分析，自动生成最优策略以供指挥官参考，进行辅助决策，优化战术策略。通过对接作战仿真推演环境，支撑火力打击、情报侦察、态势感知等战场作战计划问题研究。
推荐产品：
知识图谱数模工坊建模训练