罗克韦尔(AB)PLC讲解,创建串级PIDE控制策略
串级控制
串级控制在过程控制工业领域中有着广泛的应用。传统串级设计具有两个显著的特征:存在两个嵌套的反馈控制回路,一个次级控制回路嵌在另一个主控制回路中。本实验串级控制过程的控制策略将实现Logix功能块编辑器对反应器单元温度的控制。随着快速动作的夹套温度控制回路对反应器夹套传热液态系统内的扰动作出响应,串级PID控制
将采取矫正措施。最终结果是:具有缓慢响应特性的温度控制回路(主回路),其“偏离允许误差范围”的总体时间最小化。
本实验内容:
• 创建程序和功能块例程
• 使用RSLogix5000在串级控制组态界面创建新的PIDE模块。
• 使用SRTP指令创建分程输出。
应用过程指令进行过程模拟。
创建程序和串级PID功能块例程
创建“
1. 右击
2. 右击 REACTOR_01_TempLoops ,然后创建新例程。命名新程序为 ‘A1_R1_TIC_116AB ’
确保Type:的选择是Function Block Diagram ,In Program or Phase的选择是Reactor_01_TempLoops 。点击 OK 关闭例程属性窗口,然后再点击 OK 。
3. 双击 REACTOR_01_TempLoops 程序,打开属性窗口 ,然后点击Configuration,选择 A1_R1_TIC_116AB 作为主例程,点击OK 。
4. 双击控制器项目管理器中 A1_R1_TIC_116AB 例程,打开一个空例程。
5. 点击工具栏的Process 选项卡
出现Process指令的菜单栏。
6. 将鼠标移动到指令类型的PIDE指令
7.在工具栏的Process 选项卡上,点击“PIDE”功能块两次,在编辑区产生两个PIDE功能块。这两个PIDE功能块出现在图上(PIDE_01和PIDE_02)。
8. 在菜单栏上点击 View > Fit to Window ,调整编辑区大小。
9.点中后拖动PIDE_02,这样每个PIDE功能块周围都能留有一定的操作空间。
10.如果需要放大或缩小,点击工具栏上的缩放按钮。
11. 连接PIDE_01 的输出 CVEU 到PIDE_02 设定输入 SPCascade 如下所示:
点击PIDE_01的CVEU输出引脚,然后点击PIDE_02的 SPCascade 引脚,当变绿后就连接上了。
回顾串级PIDE指令的额外注意事项如下
过程应用注意事项
PIDE指令具有内嵌的功能,可以处理串级回路。
串级/ 比率模式:
次级回路可以设定成串级模式,也可以设定成自动模式。次级回路为串级模式时,主回路的输出作为次级回路的设定值;次级回路为自动模式时,我们可以直接为设备夹套输入温度设定值。
初始化:
若次级回路不用串级模式,主回路就要停止控制,因为它不再影响控制过程,同时应使它的输出等于次级回路的设定值,这样当次级回路恢复串级模式时,主回路可以平滑过渡启动控制。
Windup 饱和:
当次级回路达到输出或设定值的限度时,主回路应该在限度方向上停止合成。例如,如果次级回路达到了输出上限,主回路应当在正方向上不再合成。以本实验为例,如果次级回路已将冷却阀达到了100%,主回路再继续要求更多的冷却就没有意义了,因为次级回路不能再提供更多的冷却。
组态初始化和饱和参数
依据上面的叙述,我们需要进行附加参数的设定。首先对于主回路,需要设定CVInitReq 和CVInitValue 引脚的可见性。当次级回路不采用串级模式时,这些将用来设定主回路的初始化。
1. 通过点击PIDE-01的
按钮,显示主回路的参数 ,点击 Parameters 选项卡, 向下滚动鼠标找到
CVInitReq 和CVInitValue 参数,选中参数的可见性复选框 ,如下所示:
点击 Apply 和 OK ,关闭PIDE 属性对话框。
13. 显示次级回路 PIDE_02 的 InitPrimary 参数,选中该参数的可见性复选框,操作同上。
14. 连接初始参数。点击次级回路设定输出引脚PIDE_02.SP ,再点击主回路CVInitValue 引脚PIDE_01.
CVInitValue ,连接初始值。点击次级回路InitPrimary 引脚 PIDE_02.InitPrimary ,再点击主回路CVInitReq 引脚 PIDE_01.CVInitReq ,连接初始请求。在任意空白区域点击,此时编辑区类似下图所示:
注意InitPrimary到CVInitReq的连接是布尔量连接(虚线),SP到CVInitValue的连接是实数连接(实线)。
这些连接使次级回路(PIDE_02)准备好,向主回路(PIDE_01)发出请求进行初始化,主回路利用当前次级回路设定值自行初始化。这可使自动模式到串级模式平滑过渡。
下一步,使能PIDE模块的Anti-Windup抗饱和复位特性。
15. 点击PIDE_02 的按钮,显示次级回路的参数,点击 Parameters 选项卡,滚动鼠标找到 WindupHOut 和
WindupLOut 参数,点击复选框选中以显示他们。
16. 重复上述操作显示PIDE_01 的 WindupHIn 和 WindupLIn 参数。
17. 将PIDE_02的WindupHOut引脚连接到PIDE_01的WindupHIn引脚,PIDE_02.WindupLOut引脚连接到PIDE_01的WindupLIn引脚。
现在配置情况如下图所示:
同样当次级回路达到限度时,这些连接会限制主回路的动作。
18. 点击主工具栏上的
图标,校验例程。
在结果窗口将看到下面的错误提示:
检查功能块图,您会注意到在主回路PIDE模块和次级回路PIDE模块上都有“X”标记。
过程应用注意事项
功能块中,执行流程是从次级回路到数据流,这是至关重要的。实际上,执行流程是由数据流决定的。如下
所示,功能块图展示了在输出过程对数据的中间计算和操作。
实际执行指令次序只是与数据流路径相关的。当操作(指令)是从‘上游’到‘下游’执行时,明确指令的实际执行次序就不再重要。
“X ”是模块上存在错误的指示标记。在这种情况下,出错原因是数据流方面出现了一些问题。每当以数据流中“下游”模块的反馈量作为输入时,您必须确定依照执行次序的规则哪个输入量应当首先被解决处理,以此决定哪个模块要最先执行。
19. 右击从 PIDE_02.InitPrimary 到 PIDE_01.CVInitReq 的反馈线,选择Assume Data Available.
20. 对连接到 PIDE_01 上的其余3条连线重复上述操作 这就解决了执行次序的问题,也对例程进行了校验。 完成后,每条线上都有了箭头,如下:
一些基本操作参数需要在PIDE 指令中设置。PIDE_02的串级设定功能要通过设置AllowCasRat参数才能激活。
21.点击PIDE_02 的查看模块属性的省略号按钮打开属性界面,点击Cascade/Ratio 选项卡。点中复选框AllowCascade/Ratiomode ,激活此模式。
22.现在要把I/O连接添加到例程中。点击工具栏的输入参考值符号和输出参考值符号,插入两个输入参考值和一个输出参考值。每点击工具栏一次,参考值添加一次。
23. 按下图所示拖动模块重新布置,将输入连接到PIDE_01的PV引脚和PIDE_02的PV引脚,输出连接到PIDE_02的CV引脚。
该项目的标签已经作为控制器作用域标签而创建了,但它们在例程中被引用。
24. 为PIDE_01的 PV input reference 键入 ‘TT_116’ ,或者双击后从下拉菜单中查找。
25. 为 PIDE_02的 PV input reference 键入‘TT_117 ’ ,或者双击后从下拉菜单中查找。
26. 从 PIDE_02的 CV output reference 类型中查找’Product_Temp_Dmd ’ 或者双击后从下拉菜单查找。 组态效果当如下所示:
1. 在PIDE_01 指令上点击查看模块属性的省略号按钮
,打开属性界面,点击Tag 选项卡后,重命名
PIDE_01指令的标签。
将PIDE_01标签名称改为‘TIC_116 。
28. 在PIDE指令上设定工程单位标定,点击EUs/Limit s选项卡,输入下列数值:
• 100%时PV最大值的跨度设置为‘250 ’
• 0%时PV最小值的跨度设置为‘0 ’
• SP上限值设置为‘250 ’
• SP下限值设置为‘0 ’
因为这个PID的输出用于创建PIDE_02 的串级设定点输出,所以按照如下信息设定CV工程单位范围,以使夹套温度控制器的“串级模式 “的设定点范围达到预设值:
• 100%输出时CV 最大值设置为‘200’
• 0%输出时CV最大值设置为‘0’
29. 点击General Configuration选项卡,设置PID初始比例积分增益,获得一定初始位移。在后面实验中的自动调整功能将代替这些操作,点击Ok 。
30. 在PIDE_02 指令上点击查看模块属性的省略号按钮,打开属性界面,点击Tag选项卡,重命名PIDE_02指令的标签。
将PIDE_02标签名称改为‘TIC _117 。
31. 在PIDE指令上设定工程单位标定,点击EUs/Limits选项卡,输入下列数值:
• 100%时PV最大值的跨度设置为‘250 ’
• 0%时PV最小值的跨度设置为‘0 ’
• SP上限值设置为‘250 ’
• SP下限值设置为‘0 ’
该PID的输出作为输出需求CV工程单位%输出,如下:
• 100%输出时的CV 最大值设置为‘100 ’
• 0%输出时的CV最大值设置为‘0 ’
32. 点击General Configuration选项卡,设定PID初始比例积分增益,获得一定初始位移。在后面实验中自动调整功能将代替这些操作,点击OK 。
33.双击PIDE模块右下角的Autotune ? 标签输入框,为两个PIDE指令分配自动调整标签。
34. 点击下拉框,双击菜单中的 AUTOTUNE 选项卡。
35.点击主菜单栏上的
图标,校验该例程。在结果窗口中,将看到下面的错误提示:
使用分程时间比例(SRTP) 指令
在我们的示例应用中,有一个必须控制反应器温度的典型场景。其中包括从周围环境温度加热到想要的运行温度,并在反应过程中进行冷却。该实例中反应过程是放热的,因此,在反应过程中,用冷却的办法来维持想要的反应器的温度是很关键的。
我们的应用实例使用了通常的分程控制方案,其中单一控制器的输出分开两个调节阀。在分程控制策略中,如果夹套温度控制器输出量在0到50%之间,冷却的CTW阀会打开;如果夹套温度控制器输出量在50到100%之间, Dowtherm阀会打开。
Logix5000分程时间比例(SRTP)指令采用百分比输入值(0%~100%)并转换为占空比离散输出。例如如果输入值设定为50%,指令周期设定为5秒,离散输出将有2.5秒时间为开通2.5秒时间为关断。在以总周期时间的百分比输入作为开通时间的场合,这个周期将会重复。SRTP指令的一般应用在大功率电热丝的温度控制中。在这些应用中,功率的模拟量控制要么不切实际,要么成本太高。时间比例继电器或类似设备可以把功率应用于不带连续模拟量调节的加热器。同样,通常用脉冲电磁阀控制冷却液流量实现冷却作用。
该指令也有模拟量输出。可以将模拟量输入信号分程为两个不同的模拟量输出,其范围由时间比例决定。这种功能可用于某些应用场合,同一个模拟量信号控制两个执行机构,且这两个执行机构要求有不同的比例尺度。(例如反应器温度控制应用中,既有加热阀执行机构又有冷却阀执行机构)。
通常,输入(%)到输出(%)的映射如下所示:
注意‘MaxXXXXIn’可以小于或大于‘MinXXXXIn’参数。这对于在一端或两端进行反向控制是很有用的。(例如: 加热/冷却配对控制中的冷却控制的输入数值下限比较高)
过程应用注意事项
‘MaxXXXXIn’可以小于或大于‘MinXXXXIn’的特性使该指令可以用于粗略/精细控制策略。一个粗略/精细控制策略使用两个控制阀(CV),一个大的一个小的,在过程中具有补充作用。大的CV能对需求变化快速响应,
但通常分辨率较低。小的CV可以提高分辨率,增强可调性。
组态SRTP
现在看一下如何组态SRTP指令。SRTP指令参数确定了输入值和每个输出值的最小值和最大值,确定了离散输出的周期(循环时间)。
本实验Reactor_01_TempLoops程序位于执行缓慢的任务中,因为过程变量是容器温度,不能进行快速物理变化。通常SRTP指令在较快速高优先级的周期型任务中执行,以便保持高分辨率和精确的脉冲输出。即使在本实验中没有用到脉冲输出,SRTP指令已应用在了快速的10ms周期型任务中,该任务包含需要有快速执行时间的例程。
36 在控制器项目管理器打开Area _01_10ms_Fast _Control 任务中的REACTOR_01_Fast_Control 程序。
37. 双击打开SRTP 例程 。
在该例程工具栏的过程功能指令集中包含了用于多回路的SRTP指令。
38.在表单工具栏的描述框内输入‘PIC_118Split Range ’,确定当前活动表单(Sheet1of2)。
39。在下拉菜单中点击Sheet 2,选择表单2。
40.在表单工具栏的描述框内输入‘TIC_116 Split Range ’,确定当前活动表单(Sheet 2 0f 2)。输入对该表单的描述内容。
41. 点击SRTP模块上的省略号按钮,访问其参数。
42. 点击Insert Factory Defaults 按钮,
复位指令参数。理想的运行情况图形描绘如下:
将下面的‘映射’关系用于SRTP参数:
• MinHeatIn = 50% 当 PIDE.CV=50%, Heat%=0%
• MaxHeatIn = 100% 当 PIDE.CV=100%, Heat%=100%
• MinCoolIn = 50% 当 PIDE.CV=50%, Cool%=0%
• MaxCoolIn = 0% 当 PIDE.CV=0%, Cool%=100%
• 如果需要脉冲输出,则下面的参数也要满足:
• MinHeatTime = 0 sec 0秒的最小加热时间相应于0%加热
• MaxHeatTime = 10 sec 10秒的最大加热时间相应于100%加热
• MinCoolTime = 0 sec 0秒的最小冷却时间将相应于0%冷却
• MaxCoolTime = 10 sec 10秒的最大冷却时间将相应于100%冷却
SRTP功能块必须有下列定义参数才能运行: CycleTime, MinHeatIn, MaxHeatIn, MaxHeatTime。
如果必须分程控制,那么运行前还需要有下列参数:MinCoolIn, MaxCoolIn, MaxCoolTime。
不管何种应用,要实现模块功能,CycleTime参数必须为非零值。
其余参数可以保持其默认值。
因为‘null’点(不加热不冷却)位于PIDE.CVEU=50%时,所以通过使用PIDE中的PIDE.CVInitValue参数,在程序中将PIDE设置为在50%时初始化。
43.在上述必备参数基础上,既然周期参数、MaxHeatTime 和MaxCoolTime 参数都是必需的,参数值都输入‘10’。依照下面图表设定MaxHeatIn,MinHeatIn, MaxCoolIn, MinCoolIn 参数。
44.确保EnableOut参数设定为1,点击OK ,关闭属性对话框。SRTP指令将单一PIDE输出分为两个模拟量范围,如下所示:
仿真实验概述
下面部分将展示一些功能块指令,着重说明Logix平台和其编程语言的灵活性。
本实验的仿真是基本的,但它为工程师提供了在许多复杂应用和过程解决方案中用到的各种工具。由于在本实验中没有I/O,为此,我们为仿真逻辑创建了专门的任务和带有例程的程序,生成输入输出标签数据、闭环、反应过程变化和仿真设备,如电机、阀门及泵类。
大多数非积分控制过程可由一系列死区延迟和一阶滞后环节模拟。在我们实验中,模拟的两个回路是动作较迟缓的“Primary”, Product Temperature回路和响应快速的“Secondary”, Jacket Temperature回路。
用于仿真的功能块指令有“死区”(DEDT)模块,超前-滞后(LDLG)模块和函数发生器(FGEN)。死区(DEDT)指令提供了延迟并反映了过程死区时间或迟滞时间。超前-滞后(LDLG)指令提供了一个过程滞后时间。函数发生器(FGEN)指令用于描绘输出特性并将信号转换到过程工程单元。
回顾并编辑温度仿真逻辑
1. 点击Simulation Task ,然后选择Simulation Program
2. 右击All_Simulation 功能模块例程,然后点击open ,打开例程逻辑。
3. 在表单工具栏上点击next sheet ,进入例程的下一页。
4. 确保表单工具栏的指示框内容为TIC116ab S Range simulation ,以校验该温度模拟仿真。
您将会看到下面的功能块逻辑。
由于SRTP提供了两个独立的输出,并且它们的“过程特性”是独立的,分别为加热过程和冷却过程创建了一套死区和迟滞指令。本实验中我们规定它们是相同的。两者的联合作用传到用于描绘输出特性和设定温度范围比例尺度的函数信号发生器,模拟快速响应的“次级”夹套温度TT_117。然后这又反馈到另一套死区和迟滞指令,模拟动作较缓慢的主反应器温度TT_116。
5. 点击省略号按钮并在属性对话框中选择Parameters Tab ,打开SRange DEDT_01 死区模块参数对话框。
6. 确保该模块的死区时间为‘3.0 ’,增益为‘1.25 ’,点击OK 。
7. 双击省略号按钮,在属性对话框选择 Parameters 选项卡,然后对SRange_DEDT_02 死区模块参数重复上述操作步骤。使死区时间为‘3.0 ’秒,增益为‘1.25 ’。
8. 点击省略号按钮并在属性对话框中选择Parameters 选项卡,打开SRange_LDLG_02 超前-滞后模块参数对话框。
9. 确保滞后值为15秒,增益为1.0。
10. 对SRange_LDLG_01 模块重复上述操作步骤。
函数信号发生器指令给出了独立输入变量(X_In)并通过XY图形定义了‘曲线拟合’输出(Y_Out)。图形是通过数组与指令的联合获得的。X值包含在单维数组中(X_数组),相对应的Y值包含在另一个单维数组中(Y_数组)。这些数组在指令前被确定。当输入一个输入值,函数发生器将在X_数组(或在输入框中添加)中找到该数值,并在Y_数组中返回相应的值(或添加)作为输出。
11. All_Simulation例程中在过程指令组内包含了函数信号发生器指令。
12. 点击省略号按钮打开SRange_FGEN_02函数信号发生器模块参数对话框。
13.滚动鼠标指针指向XY1Size参数描述说明,并保持指向状态。
该参数值指示了输出曲线上能够显示的分段数量。点击OK 关闭对话框。
14. 右击输出标签数组SRange_FGEN_02Y1
15.选择监视 “SRange_FGEN_02Y1 ”,打开标签编辑器
1. 在监控标签窗口中点击
,展开SRange_FGEN_02Y1 输出。
该数组定义了函数信号发生器输出曲线分段以及仿真输出范围。
17. 在监控标签窗口,向上查找标签,展开SRange_FGEN_02X1 输出数组。
该数组定义了函数信号发生器相应于输入曲线分段的输入范围。
18. 双击All_Simulation 功能块例程,返回原例程。
19. 点击省略号按钮并在属性对话框中选择Parameters 选项卡,打开SRange DEDT_03 死区模块参数对话框。注意死区时间大于次级或夹套温度.。这是从夹套到反应器产品传热的休整延迟时间。
20. 点击OK 关闭对话框。
21. 点击主工具栏上的
图标,校验该例程。在结果窗口中将看到下面错误提示:
22. 点击工具栏上的Save 图标,保存该项目。
23. 保存项目后,点击控制器状态栏上的控制器图标然后选择下载,将项目下载到控制器上。
24. 当出现用于确认项目和目标控制器的下载提示对话框时,选择Download 。
25.项目下载完成后,返回控制器状态栏点击控制器图标并在下拉菜单中选择Run Mode ,将控制器设置为运行模式。
26. 然后在确认对话框中点击Yes 。
状态和例程窗口边沿变为绿色
PLC:自动纠正数据集噪声,来洗洗数据集吧 ICLR 2021 Spotlight
论文提出了更通用的特征相关噪声类别PMD,基于此类噪声构建了数据校准策略PLC来帮助模型更好地收敛,在生成数据集和真实数据集上的实验证明了其算法的有效性。论文提出的方案理论证明完备,应用起来十分简单,值得尝试
来源:晓飞的算法工程笔记 公众号
论文: Learning with Feature-Dependent Label Noise: A Progressive Approach
Introduction
在大型数据集中,由于标签的歧义以及标注者的大意,错误的标注是不可避免的。由于噪声对有监督训练的影响很大,所以在实际应用中研究如何处理错误的标注是至关重要的。 一些经典方法对噪声进行独立同分布(i.i.d.)的假设,认为噪声与数据特征无关,有其自身的规律。这些方法要么直接预测噪声分布来分辨噪声,要么引入额外的正则项/损失项来分辨噪声。而另外一些方法则证明,常用的损失项本身就能够抵抗这些独立同分布的噪声,不需要关心。 这些方法虽然有理论保证,但实际中表现都不佳,因为独立同分布的噪声假设是不真实的。这意味着,数据集的噪声是多样的,而且与数据特征相关,比如外表模糊的猫有可能被误认为狗。在光线不足或遮挡的情况下,图片失去了重要的视觉分辨线索,很容易被误标注。为了应对这个现实中的挑战,应对噪声的处理方法不仅需要有效,其通用性也是十分必要的。 SOTA方法多数采用数据重新校准(data-recalibrating)的策略来适应各种各样的数据噪声,该策略逐步确认可信的数据或逐步校正标签,然后使用这些数据进行训练。随着数据集更加准确,模型的准确率也会逐渐提高,最终收敛到高准确率。该策略很好地利用了深度网络的学习能力,在实践中获得不错的效果。 但目前这些策略的内在机制都没有完备的理论证明,解释为何这些策略可以使得模型收敛到理想的状态。这意味着这些策略都是case by case的,需要很小心地调整超参数,难以通用。
基于上面的分析,论文定义了更为常见的PMD噪声族(Polynomial Margin Dimishing Noise Family),包含除了显而易见的错误之外的任意类型噪声,更符合现实场景。基于PMD噪声族,论文提出了有理论保证的数据校准方法,根据噪声分类器的置信度逐步校准数据的标签。流程如图1所示,先从高置信度的数据开始,使用噪声分类器的预测结果校准这些数据,然后使用校准后的数据提升模型,交替进行标签校准和模型提升直到模型收敛。
Method
先定义一些数学符号,这里以二分类任务为例:
定义特征空间,数据均从分布采样而来。定义为后验概率,值越大代表正标签越明显,而值越小则代表负标签越明显。定义噪声函数和,其中为错误标签。假设数据的真实标签为,则有概率错误地标注为1。定义为噪声后验概率。定义为贝叶斯最优分类器,当A为真时,否则为0。定义为分类器打分函数,一般是网络的softmax输出。Poly-Margin Diminishing Noise
PMD噪声只将噪声函数约束在特定的中间区域,区域内的噪声函数的值多大都无所谓。这样的形式不仅能够覆盖特征无关的场景,也能泛化到之前的一些噪声研究的特定场景中。
PMD噪声的定义如上所示,可认为是左右两边的间隔(margin)。PMD条件只要求的上界是多项式的并且在贝叶斯分类器置信的区域单调递减,而和在区域内可为任意值。
前面的PMD噪声描述可能比较抽象,论文提供了可视化图片来帮助大家理解:
图a是贝叶斯最优分类器的结果,即正确标签。从下面的曲线可以看出,两边数据的二分类概率差别较大,是容易区分的。而中间的数据的二分类概率比较接近,有较大的误标注的可能,也是我们需要重点关注的。图b是均匀噪声,该噪声认为误分概率与特征无关,每个数据点都有相同的概率被误分。上图中黑色的是被认为是正确的数据,红色则是被认为属于噪声的数据,可以看到,经过均匀噪声处理后,数据分布比较乱。图c是BCN噪声,噪声值随着的置信而下降。从上图可以看出,处理后的噪声数据基本都落在中间区域,也就是容易误识别的地方。但由于BCN噪声的边界与高度相关,而实践中一般要用模型的输出来近似,在噪声程度较大的场景显然会有较大的出入。图d是PMD噪声,约束噪声在的中间区域,区域内的噪声值随意。这样做的好处在于,可以通过调控区域大小来应对不同的噪声程度,只要不是显而易见的错误都可以(即在较高和较低的地方标注错误)适用。从上图可以看出,处理后的干净数据基本都分布在两边,也就是比较置信的地方。The Progressive Correction Algorithm
基于PMD噪声,论文提出逐步训练和纠正标签的PLC(Progressive Label Correction)算法。该算法首先使用原数据集进行warm-up阶段的训练,得到一个尚未拟合噪声的初步网络。接着,使用warm-up得到的初步网络对高置信度的数据进行标签的纠正,论文认为(也理论证明了)噪声分类器的高置信度预测能与贝叶斯最优分类器保持一致。 纠正标签时,先选择一个高阈值。如果预测标签跟标注标签不同且预测置信度高于阈值,即,则将纠正为的预测标签。重复进行标签的纠正以及用纠正的数据集进行模型的重新训练,直到没有标签被纠正为止。 接着,稍微降低阈值,使用降低的阈值进重复上述的步骤,直到模型收敛。为了方便后面的理论分析,论文定义了一个连续递增阈值,让,具体逻辑如算法1所示。
Generalizing to the multi-class scenario上面的描述都是二分类的场景,在多分类场景中,先定义为分类器对标签的预测概率,为分类器预测的标签。将的判断修改为|,当结果大于阈值时,将标签修改为标签。在实践过程中,将差值判断加上对数会更加鲁棒。
Analysis
这一块是论文的核心,主要从理论的角度验证论文提出方法的通用性和正确性。这里我们就不继续讲解了,有兴趣的可以去看看原文,我们只需要知道这个算法的用法就够了。
Experiment
数据集噪声问题目前还没有公开的数据集,所以需要生成数据集进行实验,论文主要在CIFAR-10和CIFAR-100上进行数据生成和实验。先在原数据上训练一个网络,用该网络的预测概率近似真实的后验概率。基于重新采样数据的标签作为干净数据集,前面训练得到的网络作为贝叶斯最优分类器,其中为类别数。需要注意的是,多类别场景中,输出为向量,对应向量的第个元素。 对于噪声的生成,有特征相关噪声和独立同分布噪声(i.d.d)两种:
对于特征相关噪声,为了增加噪声的挑战难度,每个数据根据噪声函数均可能从最高置信分类变为第二置信分类,其中噪声函数与的概率相关。对于是混淆度最高的类别,最能影响模型的性能。另外,由于是从采样而来的,是置信度最高的类别,所以可认为就是。总体而言,对于数据,生成数据时要么变为,要么保持。特征相关噪声有以下三种PMD噪声族内的噪声函数: 由于是无法修改的,为了能够控制噪声程度,唯一能做的就是为噪声函数加上常量因子,使得最终的噪声比例符合预期。对于PMD噪声,35%和70%的噪声程度即代表35%和70%的干净数据被修改成噪声。独立同分布噪声通过构建噪声转换矩阵来进行标签的修改,其中为真实标签转换为标签的概率。对于标签为的数据,将其标签修改为从矩阵的第行的概率分布采样而来的标签。论文采用了常见两种独立同分布噪声:1)均匀噪声(Uniform noise),真实标签转换成其它标签的概率相同,即,其中,,为噪声程度。2)非对称噪声(Asymmetric noise),真实标签有概率概率转换成标签,或概率保持不变。在实验的时候,部分实验会组合特征相关噪声和独立同分布噪声进行噪声数据集生成和实验,最后的验证标准取模型在验证集上的准确率。训练时,采用128 batch size、0.01学习率和SGD优化器,共训练180周期保证收敛,重复3次取均值和标准差。
PMD噪声测试,在35%和70%噪声程度下的性能对比。
混合噪声测试,在50%-70%噪声程度下的性能对比。
超参数对比实验。
在真实数据集上的性能对比。
Conclusion
论文提出了更通用的特征相关噪声类别PMD,基于此类噪声构建了数据校准策略PLC来帮助模型更好地收敛,在生成数据集和真实数据集上的实验证明了其算法的有效性。论文提出的方案理论证明完备,应用起来十分简单,值得尝试。
如果本文对你有帮助,麻烦点个赞或在看呗~更多内容请关注 微信公众号【晓飞的算法工程笔记】
work-life balance.
相关问答
s7-200用pid控制阀门开度变化怎么做呢-阿拉蕾和猫的回答-...
流量计将流量变送为4~20mA电流信号,输入至PLC的模拟量输入模块。控制阀又称阀门,是流体运送系统中的控制部件,具有导流、截流、调节、节流、防止倒...
久远气体灭火现场设备要编程吗?
久远气体灭火现场设备需要编程来对其进行控制和监测。该设备的编程主要包括两个部分:1.控制系统编程:久远气体灭火现场设备采用可编程逻辑控制器(PLC)作为...
哪些基础科学能够支撑第四次工业革命?
更为广阔的计算机编程领域是工业软件领域,是云计算领域。我们熟悉的CAD,PS,SolidWorks都是工业类软件的一种。还有更为庞大的工业软件家族和体系。这些软件才...
求职业技能培训数控加工中心试题?
一.单项选择题(满分40分,每题1分)1.在用硬质合金刀具铣削下列材料时,()所选用的切削速度最高。A.铝镁合金B.合金钢C.低、中碳钢D.灰铸铁2.数...
现在标普500成分股有哪些?-汇财吧专业问答test
[回答]你没说买入时标普500指数的位置,无法判断是否能够盈利选择基金的投资品种不可一概而论,取决于个人对风险和收益的偏好。现在市场上可供选择的业绩...
水平仪的精度一般能达到多少,有距离的限制吗..._报检水平_帮...
一.单项选择题(满分40分,每题1分)1.在用硬质合金刀具铣削下列材料时,()所选用的切削速度最高。A.铝镁合金B.合金钢C.低、中碳钢D.灰铸铁...