一些学习成果的分享。

《Cognitive Electronic Warfare An Artificial Intelligence Approach》读书笔记(二)——决策的目标函数

《Cognitive Electronic Warfare An Artificial Intelligence Approach》第二章的读书笔记。

目录

认知电子战中决策的过程,是构建一个认知控制器,在高度动态的环境中自动保持近似最佳的配置。组成部分包括:要完成的目标,实现目标的具体操作,状态评估方法。

使用数学上可优化的目标函数(效用函数)来分析任务目标和约束。 目标函数衡量评估决策的所有因素,以选择“最佳”解决方案。

对$N$​个节点的电子战系统; 每个节点$n∈N$​有:

• 描述射频环境的可观察参数$O_n$,(observable parameters);

• 决策者用来改变系统行为的一组控制参数$c_n$;

• 一个或多个指标$M_n$​提供有关其运行情况的反馈,以及相应的权重 $w_n$​;

• 一个效用函数$U$,它将反馈按权重组合成一个单一的标量值结果;

策略$s_n$是控制参数$c_n$的组合。 目标是让每个节点$n$选择其策略 $s_n $以最大化系统的效用$U_n$。 策略有助于 EP 目标或 EA 目标。

1. 描述射频环境的可观察参数$O_n$

$O$由 ES 模块计算。 每个节点 $n ∈ N$ 都有自己的一组可观测值$o_n$,并且与其他节点$ n' ∈ N $不同。$o_n$​参数主要描述以下内容:

• 原始接收器同相/正交 (I/Q) 值。

• 发射器的描述,包括噪声水平、错误率、重复性、地理定位信息、发射器能力和当前操作模式。

• 所有检测到的目标的描述,包括载波、脉冲统计和多普勒频率。

• 接收机状态的描述(例如,饱和度和天线特性)。

• 内部软件状态的描述。

• 任务描述,包括已知或预测的位置、任务、和指挥官的意图。

• 环境描述,例如温度、灰尘或地形。

通常,当不明显的的特征可以抽象或归一化时,决策者可以更容易地确定特征的变化。不可观察的参数是 ES 中建模错误的主要来源。

1.1 环境因素观察中的聚类分析

在电子战系统中使用机器学习的聚类来确定环境相似性。聚类是一种无监督的机器学习方法,它根据相似项目的特征对其进行分组。将观察到的特征向量聚类到射频环境中,然后绘制相应的树状图,可以显示每个环境之间的相似程度。文中提到多种聚类方法,只明白k聚类。

2. 用于更改行为的控制参数$C_n$​​

控制参数描述节点可控的任何动作。每个节点$n$都有一组可控对象$C_n$,策略$S_N$是控制参数的组合。最大策略数量是$Π_{∀_CV_C}$,其中$V_C$​是控制参数$C$​​​的可能值的数量。当可控对象可以采用连续值或许多离散值时,可能有无限数量的策略。

平台有意公开控制参数以进行调优;通过从多个组件中选择控制参数来隐式捕获跨层问题。(未理解)

将每个可用模块建模为二进制开关,每个可用模块都有一个控制参数$x$​,当模块被调用时$x=1$,当模块无操作时$x=0$​。

分层控制参数是指只有在启用所属参数或算法时才有效的参数。

一个多节点的电子战系统可能包括的控制参数:天线参数、物理层参数、媒体访问控制(MAC)层参数、网络层或多节点协调参数、加密参数等。(文中有各参数可能包括的内容

• 控制参数必须在指标中考虑的相关成本。

• 控制参数可能是互斥的。(例:合成孔径雷达可以控制积分时间或方位分辨率,但不能同时控制两者)。

• 控制参数并不总是在使用的(例:任务不同阶段)。

3. 决策评估指标$M$

在复杂系统中应确定适当指标,是创建有效自主选择操作的系统最困难的部分。每个指标必须涵盖可用操作和系统高级需求之间的联系。

最重要的指标是1、任务成功2、性能。任务成功的指标包括平台生存和被毁的概率,性能指标是评估各组件在不同操作条件下的性能。

指标量化了电子战系统满足需求的程度,每个节点有$m_n$​​​​个度量值,决策者的控制因素$C_n(T)$​​​​​​​会影响指标$M_{nk}(t'>t)$​​​​​。指标可以根据模型计算,也可以根据经验学习。

常见指标:有效性、成本、决策的灵活性等。

在构建系统时,通常的做法是从最容易得到的的指标开始,同时使用更复杂或推断出的特征作为观察值。一旦系统稳定下来,就可以将特征从可观测转换为指标。

4. 创建效用函数$U_n$​​

在自主选择系统中,效用函数衡量是否达到“最优”。其结构取决于系统的具体任务和能力,以可优化的方式组合指标。

在复杂系统中,需要选取合适的评估指标度量和相应的权重,并将它们以合适的方式组合

最简单的效用函数是计算指标的加权和。

$$U_n=\sum_{k=1}^{M_n}(w_{nk}×M_{nk})$$​​

其中,每个量化指标$M_{nk}$是由可观察参数$O_n$和控制参数$C_n$​决定的,即$M_{nk}=f(O_n,C_n)$​,这里的权重为常数。

当权重是$\lambda$​​函数时,常用的效用函数为:

$$U_n=\sum_{k=1}^{M_n}w_{nk}(M_{nk})$$​​

当指标M不是恒定(唯一)的时候,效用函数应该采取替代结构。$^*$

5. 效用函数设计注意事项

从架构设计和实现的角度:

• 选择易于测量的指标(如误码率)来测试决策流程。

• 构建功能,以便于添加新指标和新需求。

• 保持每个指标在计算上的独立,直到它们需要结合在一起。因为在运行期间,每个指标单独的变化可能会很大。

• 当指标取决于多节点时,确定节点高效共享信息的机制。共识传播是最小化测量延迟的有效方法,并且不需要系统知道网络中有多少节点。$^*$

6.总结

功能齐全、高效的电子战系统是建立在衡量系统性能的效用函数的基础上,效用函数可以为任务选择“最优”的策略。效用函数以数学上可优化的方法捕获用户目标、任务目标和环境约束。

添加新评论