zzh
|
8f3cb79d6f
|
在avx2中加入了一些特殊判断,保证了和串行的sw结果保持基本一致
|
2024-03-01 18:45:09 +08:00 |
zzh
|
5cd4c10858
|
减少了频繁开辟释放内存,基本是所有优化手段都加上了,只是simd版本的准确性还有待进一步完善
|
2024-02-27 16:10:52 +08:00 |
zzh
|
198fe34ddb
|
做了一些代码清理,目前结果应该是完全一致的
|
2024-02-22 01:26:57 +08:00 |
zzh
|
c288e1b285
|
实现了seed过程的所有加速想法,seed部分实现了3倍左右加速比
|
2024-02-20 01:12:02 +08:00 |
zzh
|
980588a9ac
|
添加了bit过滤,解决了一些bug,现在seed1和seed2都没问题了
|
2024-02-16 00:18:14 +08:00 |
zzh
|
44b7c62715
|
将smem1函数用fmt结构实现了,结果基本正确
|
2024-02-07 22:08:51 +08:00 |
zzh
|
e18e60c0b5
|
实现了用33bit表示sa,间隔为4,释放内存的时候会崩溃
|
2023-12-27 10:42:12 +08:00 |
zzh
|
ea9e707238
|
添加了一些注释
|
2023-12-24 17:23:14 +08:00 |