zzh
|
b38214edd9
|
同上
|
2026-01-06 14:40:04 +08:00 |
zzh
|
90f6bc5cc0
|
测试过了5.1GB的数据,串行和多线程结果一致
|
2026-01-06 14:39:48 +08:00 |
zzh
|
4f9fecf078
|
实现了并行,小数据上结果一致,大数据还没测试
|
2026-01-05 02:17:36 +08:00 |
zzh
|
022e70e1f3
|
解决了bug,现在apply bqsr结果一致了,原因是读取bqsr table的时候,并没有将table中的empiricalQuality赋值给Datum,是后续在计算质量分数的时候重新计算的empiricalQuality
|
2026-01-04 16:27:50 +08:00 |
zzh
|
94e06338cd
|
实现了apply bqsr的单线程版本,结果还有点错误,继续调试
|
2026-01-03 22:10:46 +08:00 |
zzh
|
985875ebac
|
调整了计算read group的方式,当read group只有一个时,不需要计算
|
2026-01-01 09:40:46 +08:00 |
zzh
|
745963831d
|
完善了统计时间
|
2026-01-01 00:41:55 +08:00 |
zzh
|
95c4a16151
|
终于解决了最后的bug,并行结果与串行结果一致,与gatk一致。是index的search interval函数导致的,之前这个函数搜索的区间是包含大于等于start,而且大于等于end,正确的搜索应该是变异的end大于等于start
|
2025-12-31 23:01:16 +08:00 |
zzh
|
65878bbf96
|
对5.1G的数据,串行结果正确了,并行结果还没测试
|
2025-12-31 11:16:13 +08:00 |
zzh
|
81cbd6831c
|
又解决了一个bug,忽略了有些read的过滤,把过滤函数放到append_one_bam里就好了,现在发现串行和并行结果还是有点不一致,正在调试
|
2025-12-30 19:27:28 +08:00 |
zzh
|
f915461205
|
解决了两个问题,1. clip导致两端的cigar可能成为D,需要处理,2. start_pos要加上contig,否则导致knowsites计算错误,大数据还是有点问题,得继续调试
|
2025-12-30 18:04:12 +08:00 |
zzh
|
d56d926b6e
|
找到并行的问题了,是kt_for的steal策略,会导致处理的数据的idx小于已经处理过的。保留调试信息,并行结果和串行一致了
|
2025-12-30 12:48:59 +08:00 |
zzh
|
84463ede19
|
初步并行实现,还没完全
|
2025-12-30 03:14:05 +08:00 |
zzh
|
3815a67618
|
修改多维数组实现方式,更有利于连续访存,修改reclatable的索引次序
|
2025-12-30 01:21:13 +08:00 |
zzh
|
b526306e87
|
继续重构,小数据结果一致,大数据还是有问题
|
2025-12-29 23:18:46 +08:00 |
zzh
|
1e5a291eb7
|
重构了一下,大数据问题还没解决
|
2025-12-29 19:36:38 +08:00 |
zzh
|
1864736509
|
改了一些问题,小数据集结果没问题,但是对于5G的稍微大一些的数据集还是错误
|
2025-12-29 16:48:55 +08:00 |
zzh
|
1cd1a72760
|
修复了一个bug,把结果代码移除round循环,对于大文件(5G的fastdup-mini)结果不对,差挺多
|
2025-12-28 23:43:58 +08:00 |
zzh
|
6662435948
|
上一个commit为啥没有包含所有更改文件
|
2025-12-28 23:06:03 +08:00 |
zzh
|
8e3388a494
|
在小数据集上结果与gatk一致(版本gatk-package-4.6.2.0-17)
|
2025-12-28 23:04:45 +08:00 |
zzh
|
146055fc01
|
bqsr第一阶段完成了,结果还有点错误,得调试一下
|
2025-12-28 14:33:45 +08:00 |
zzh
|
25f079b936
|
串行版本还差最后一步,将信息合并到数据汇总表中
|
2025-12-24 12:47:26 +08:00 |
zzh
|
1e9b58fac1
|
到了读取和解析known vcf部分了,性能还需优化
|
2025-12-20 16:35:45 +08:00 |
zzh
|
0fca937fab
|
搭建串行框架
|
2025-12-04 22:26:13 +08:00 |
zzh
|
14f1611ab6
|
FastBQSR Init and Merge
|
2025-11-23 23:07:13 +08:00 |
zzh
|
e4d26486ef
|
FastBQSR Init
|
2025-11-23 23:03:37 +08:00 |
zzh
|
f496edb5be
|
Initial commit
|
2025-04-15 16:48:36 +08:00 |