zzh
|
338c56e6ed
|
完成avx2的align代码
|
2025-09-18 15:09:48 +08:00 |
zzh
|
845a1156b8
|
sw benchmark,对extend部分做了全部的优化,去除target倒序,减少FIND_MAX次数
|
2024-04-11 13:29:28 +08:00 |
zzh
|
d16f8487ce
|
sc消融实验版本
|
2024-04-08 20:00:48 +08:00 |
zzh
|
78f791f3f2
|
解决了读数据的bug,和avx2的bug,保留了一些调试代码
|
2023-08-27 01:01:57 +08:00 |
zzh
|
2aeb566bf7
|
添加了debug打印信息
|
2023-08-26 03:00:15 +08:00 |
zzh
|
b53569db63
|
代码重构,总共7个kernel
|
2023-08-26 00:38:38 +08:00 |
zzh
|
b95e622e7a
|
添加了内存对齐,性能提升5%,解决了对齐内存引入的bug
|
2023-08-25 14:47:30 +08:00 |
zzh
|
775297a813
|
加了对find_max剪枝的优化
|
2023-08-20 02:16:25 +08:00 |
zzh
|
ede75a66fa
|
测试不同数据
|
2023-08-11 00:36:14 +08:00 |
zzh
|
2904e87dee
|
初始化仓库,已经实现了normal和avx2的sw,并进行了性能测试
|
2023-08-10 15:28:45 +08:00 |