关于NIST随机数测试软件报错问题的补充

关于NIST随机数测试软件报错问题的补充
关于NIST随机数测试软件报错问题的补充
NIST随机数测试算法相关测试软件的下载、安装、Cygwin环境配置等等已经有很多博客反复讲述过了,这⾥不再多说。
但是我发现在我的实际使⽤过程中遇到了很多意想不到的bug,我也留意到,在相关博客的评论区⾥,有很多朋友提到了相似的报错内容、相同的困惑。可问题在于CSDN甚⾄全⽹都⽆法到详细的关于这个算法报错内容的解析。所以这⾥我尝试总结⼀下避免错误使⽤NIST测试软件的Tips,以及部分报错信息的解析。
待测试⽂件的格式与内容
张叶帆关于⽂件格式
Cygwin运⾏sts-2.1.2算法包时 选择⽂件格式的提⽰语如下
Input File Format:
[0] ASCII - A sequence of ASCII 0’s and 1’s
[1]Binary - Each byte in data file contains 8 bits of data
这⾥主要谈论⼤家⽐较常⽤的[0]ASCII⽂件
1. ⼀般来说,⽤python或matlab写的算法,导出txt⽂件是⽐较⽅便快捷的。
2. UTF-8编码的txt⽂档兼容ASCII。
3. “A sequence of ASCII 0’s and 1’s”指的不是⼆进制编码,这个描述指的是所有数据都是⼆进制数。
4. 如果采⽤的是⼆进制编码⽂件,请选择第⼆个选项:Binary。
关于⽂件内容
1. ⼆进制编码的数组可以保证超⾼精度,不需要担⼼⼗进制数值超过matlab/python的整数⼤⼩上限以后变为双精度数、导致精度降
低。所以⽣成的随机数数值即使是超级⼤数也不会影响随机性的判定和测试。
2. 特殊要求(1):所有⼆进制数要保证长度相同,如果位数不够,在前⾯⽤0补齐。
3. 特殊要求(2):所有⼆进制数连续排列,中间不能有空格。
4. 这⾥⽤matla例。假设已经⽣成了⼀个随机数数组,基于上述要求,导出时不能使⽤⾮常快捷的save函数,我们需要⼿动将数组中
的每⼀个数转为⼆进制形式后连续写⼊txt⽂件。下⾯我放⼀段⾃⼰的代码,使⽤的时候请⾃⾏更改参数。
fid = fopen('E:/','w');
%E:/是待检测⽂件的绝对路径
for i = 1:1000000
fprintf(fid, '%s',dec2bin(X(i),32));
end
%1000000是数组长度,32是这个数组中最⼤的⼆进制数的长度
fclose(fid);
5. ⼀个⼩建议:⽣成txt⽂件以后,可以先打开、缩⼩来看⼀看,如果你能看到明显的0、1规律,如下
图,那证明你的数组随机性极差,
这个算法包⽆法对你的数组进⾏测试,最后⽣成的Finalreport可能是空的0kb,也有可能参数全0。这也是不断报错“igamc
underflow”的两⼤原因之⼀。
这样可以⽬测随机性极差的⽂件就不需要浪费时间了,建议直接检查算法的正确性。
运⾏算法时的参数
选择bit流⼤⼩和数量
1. bit流的⼤⼩和数量,在很⼤程度上决定了最后Finalreport能否正常⽣成。
2. ./assess 后数值⼩于1000000时可能⽆法产⽣finalreport(即0kb空txt),或是产⽣全0报告,如下图
可持续发展的基本内涵其实我这⾥是有⼀部分数据的,并不是全0。可以看到明显的对⽐,下半部分的测试师通过了的。不过数据不够、全0的⽂件即为上半部分的样⼦。
3. 如果数据量不够,./assess 输⼊较⼩数值,⽐如10000,则建议参照此博客的下个部分,采⽤分段部分测试的⽅式逐步完成15项检
验。
4. bit流的数量⼀般要求在10以上⽐较合理。
5. 注意:单条bit流的长度 * bit流数量 不能超过你txt⽂件的数据量,否则同样会不断报错“igamc underflow”!(即第⼆⼤报错原
因)
选择测试项
根据我个⼈的尝试,要想⼀次性完成全部⼗五项测试,⾄少需要数量为⼗万级的随机数,达到百万级更好。
但是部分算法(⽐如时间戳优化的LCG算法)运算速率很低,产⽣百万个随机数所需时间太长。那么假设我们只有不到⼗万个随机数,如果强⾏跑程序,反⽽会导致最后报告产⽣错误。
这⾥我们建议将15个测试分开为⼏组来进⾏测试。
输⼊⽂件绝对地址以后你会看到如下指⽰:
S T A T I S T I C A L T E S T S
woman 日剧
_________________________________
[01] Frequency [02] Block Frequency
[03] Cumulative Sums [04] Runs
[05] Longest Run of Ones [06] Rank
[07] Discrete Fourier Transform [08] Nonperiodic Template Matchings
[09] Overlapping Template Matchings [10] Universal Statistical
[11] Approximate Entropy [12] Random Excursions
误码率
[13] Random Excursions Variant [14] Serial
[15] Linear Complexity
INSTRUCTIONS
Enter 0 if you DO NOT want to apply all of the
statistical tests to each sequence and 1 if you DO.
Enter Choice:
这⾥选择0,看到以下指⽰:
INSTRUCTIONS
Enter a 0 or 1 to indicate whether or not the numbered statistical
test should be applied to each sequence.西门子s2000
123456789111111
仿生      012345
这⾥的两⾏数字表⽰的是1到15,后半段上⾯的1是⼗位,下⾯是个位。在下⽅对应输⼊1表⽰执⾏该测试,0则表⽰不执⾏。
最后,在以下的各个⽂件夹中查看各部分报告。总的finalreport是没有详细内容的。
⽬前想到的就是这些,欢迎将漏洞和疑问补充在评论区。我会尝试完善这个回答。

本文发布于:2024-09-22 01:54:21,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/279414.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   测试   进制   报错   部分   测试软件
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议