前已有实验表明,当训练集只有一列的时候,收敛迭代次数与训练集分布的标准差成反比。分布越均匀迭代次数越大。如果可以把多列问题化简为单列问题,比较迭代次数的大小顺序就会变得很简单。
( A, B )---3*30*2---( 1, 0 )( 0, 1 )
做一个网络来分类A和B,网络输入只有3个节点,每个训练集只有4张图片。让B全为0,固定收敛误差观察迭代次数平均值的变化。这一实验得到几组数据
A-B |
迭代次数 |
|||
0 |
0 |
0 |
0*7*7*0-0*0*0*0 |
27534.18 |
1 |
1 |
1 |
0*7*7*0-0*0*0*0 |
27534.18 |
1 |
1 |
1 |
0*7*7*0-0*0*0*0 |
27534.18 |
0 |
0 |
0 |
0*7*7*0-0*0*0*0 |
27534.18 |
0 |
0 |
0 |
0*7*0*7-0*0*0*0 |
29228.99 |
1 |
1 |
1 |
0*7*0*7-0*0*0*0 |
29228.99 |
0 |
0 |
0 |
0*7*0*7-0*0*0*0 |
29228.99 |
1 |
1 |
1 |
0*7*0*7-0*0*0*0 |
29228.99 |
0 |
0 |
0 |
0*3*3*0-0*0*0*0 |
30993.99 |
0 |
1 |
1 |
0*3*3*0-0*0*0*0 |
30993.99 |
0 |
1 |
1 |
0*3*3*0-0*0*0*0 |
30993.99 |
0 |
0 |
0 |
0*3*3*0-0*0*0*0 |
30993.99 |
0 |
1 |
1 |
3*0*3*0-0*0*0*0 |
33074.65 |
0 |
0 |
0 |
3*0*3*0-0*0*0*0 |
33074.65 |
0 |
1 |
1 |
3*0*3*0-0*0*0*0 |
33074.65 |
0 |
0 |
0 |
3*0*3*0-0*0*0*0 |
33074.65 |
0 |
0 |
0 |
0*2*2*0-0*0*0*0 |
38579.88 |
0 |
1 |
0 |
0*2*2*0-0*0*0*0 |
38579.88 |
0 |
1 |
0 |
0*2*2*0-0*0*0*0 |
38579.88 |
0 |
0 |
0 |
0*2*2*0-0*0*0*0 |
38579.88 |
|
||||
0 |
0 |
0 |
0*2*0*2-0*0*0*0 |
41118.84 |
0 |
1 |
0 |
0*2*0*2-0*0*0*0 |
41118.84 |
0 |
0 |
0 |
0*2*0*2-0*0*0*0 |
41118.84 |
0 |
1 |
0 |
0*2*0*2-0*0*0*0 |
41118.84 |
结果很直观,如果不考虑全0列,如果各行分布完全一致的情况下,确实可以当做一列去比较。
A-B |
迭代次数 |
|||
0 |
0 |
0 |
0*0*3*6-0*0*0*0 |
35068.68 |
0 |
0 |
0 |
0*0*3*6-0*0*0*0 |
35068.68 |
0 |
1 |
1 |
0*0*3*6-0*0*0*0 |
35068.68 |
1 |
1 |
0 |
0*0*3*6-0*0*0*0 |
35068.68 |
|
||||
0 |
1 |
1 |
3*0*6*0-0*0*0*0 |
35888.4 |
0 |
0 |
0 |
3*0*6*0-0*0*0*0 |
35888.4 |
1 |
1 |
0 |
3*0*6*0-0*0*0*0 |
35888.4 |
0 |
0 |
0 |
3*0*6*0-0*0*0*0 |
35888.4 |
0 |
0 |
0 |
0*0*2*1-0*0*0*0 |
52696.67 |
0 |
0 |
0 |
0*0*2*1-0*0*0*0 |
52696.67 |
0 |
1 |
0 |
0*0*2*1-0*0*0*0 |
52696.67 |
0 |
0 |
1 |
0*0*2*1-0*0*0*0 |
52696.67 |
|
||||
0 |
0 |
1 |
1*0*2*0-0*0*0*0 |
52823.69 |
0 |
0 |
0 |
1*0*2*0-0*0*0*0 |
52823.69 |
0 |
1 |
0 |
1*0*2*0-0*0*0*0 |
52823.69 |
0 |
0 |
0 |
1*0*2*0-0*0*0*0 |
52823.69 |
更有比较特殊的情况,即便两行分布不一致,但有对称性,也可以把整个形态按照单列去处理。通过比较标准差去比较迭代次数的大小顺序。文章来源:https://www.toymoban.com/news/detail-410622.html
所以这种所谓的标准差的现象是普遍存在的,并不限于单列问题,那这个标准差表达的到底是什么?比如假设1是一种微观粒子,0是环境。如果粒子1彼此之间存在一种排斥力,那两个粒子间隔分布就是要比连在一起的势能要低些。所以所谓的标准差体现的可能是粒子之间的一种排斥现象。文章来源地址https://www.toymoban.com/news/detail-410622.html
到了这里,关于把多列的迭代次数问题化简为单列问题的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!