zzh
|
8f3cb79d6f
|
在avx2中加入了一些特殊判断,保证了和串行的sw结果保持基本一致
|
2024-03-01 18:45:09 +08:00 |
zzh
|
5cd4c10858
|
减少了频繁开辟释放内存,基本是所有优化手段都加上了,只是simd版本的准确性还有待进一步完善
|
2024-02-27 16:10:52 +08:00 |
zzh
|
198fe34ddb
|
做了一些代码清理,目前结果应该是完全一致的
|
2024-02-22 01:26:57 +08:00 |
zzh
|
57a6ff7b07
|
解决了sa的bug,现在结果和原版一模一样
|
2024-02-21 15:21:56 +08:00 |
zzh
|
c288e1b285
|
实现了seed过程的所有加速想法,seed部分实现了3倍左右加速比
|
2024-02-20 01:12:02 +08:00 |
zzh
|
95fd6e018b
|
修改一些注释疏忽的问题
|
2024-02-16 21:23:55 +08:00 |
zzh
|
e9022723e6
|
seed三个步骤,全部用fmt实现,而且结果一致
|
2024-02-16 20:59:59 +08:00 |
zzh
|
980588a9ac
|
添加了bit过滤,解决了一些bug,现在seed1和seed2都没问题了
|
2024-02-16 00:18:14 +08:00 |
zzh
|
44b7c62715
|
将smem1函数用fmt结构实现了,结果基本正确
|
2024-02-07 22:08:51 +08:00 |
zzh
|
e18e60c0b5
|
实现了用33bit表示sa,间隔为4,释放内存的时候会崩溃
|
2023-12-27 10:42:12 +08:00 |
zzh
|
ed01396d73
|
添加了运行时间计算代码,用来分析性能
|
2023-12-25 13:58:15 +08:00 |
zzh
|
d304f030fb
|
添加了fmt_idx文件,开始改进seed过程
|
2023-12-25 11:11:19 +08:00 |