gatk-3.8/public/c++/VectorPairHMM/pairhmm-1-base.cc

//#define DEBUG 1
//#define DEBUG0_1 1
//#define DEBUG3 1
#include "headers.h"
#include "utils.h"
#include "LoadTimeInitializer.h"
using namespace std;
#define RUN_HYBRID

int main(int argc, char** argv)
{
#define BATCH_SIZE 5
  if(argc < 2)
  {
    cerr << "Needs path to input file as argument\n";
    exit(0);
  }
  do_compute(argv[1]);
#if 0
  bool use_old_read_testcase = false;
  if(argc >= 3 && string(argv[2]) == "1")
    use_old_read_testcase = true;
  unsigned chunk_size = 100;
  if(argc >= 4)
    chunk_size = strtol(argv[3],0,10);

  std::ifstream ifptr;
  FILE* fptr = 0;
  if(use_old_read_testcase)
  {
    fptr = fopen(argv[1],"r");
    assert(fptr);
  }
  else
  {
    ifptr.open(argv[1]);
    assert(ifptr.is_open());
  }
  vector<double> results_vec;
  vector<testcase> tc_vector;
  tc_vector.clear();
  tc_vector.resize(BATCH_SIZE+4);
  results_vec.clear();
  vector<double> baseline_results;
  baseline_results.clear();

  bool all_ok = true;
  uint64_t total_time = 0;
  uint64_t baseline_time = 0;
  unsigned total_count = 0;
  unsigned num_testcases = 0;
  //unsigned curr_batch_size = rand()%BATCH_SIZE + 4;     //min batch size
  unsigned curr_batch_size = BATCH_SIZE;
  uint64_t product = 0;

  testcase tc_in;
  int break_value = 0;
  tc_vector.clear();
  g_load_time_initializer.open_sandbox();
  while(1)
  {
    break_value = use_old_read_testcase ? read_testcase(&tc_in, fptr) :
      read_mod_testcase(ifptr, &tc_in, true);
    tc_vector.push_back(tc_in);
    if(break_value >= 0)
      ++num_testcases;
    if(break_value < 0)
      break;
  }
  if(num_testcases == curr_batch_size || (break_value < 0 && num_testcases > 0))
  {
    results_vec.resize(tc_vector.size());
    baseline_results.resize(tc_vector.size());

    get_time();
#pragma omp parallel for schedule(dynamic,chunk_size)  num_threads(12)
    for(unsigned i=0;i<num_testcases;++i)
    {
      float result_avxf = g_compute_full_prob_float(&(tc_vector[i]), 0);
      double result = 0;
      if (result_avxf < MIN_ACCEPTED) {
        double result_avxd = g_compute_full_prob_double(&(tc_vector[i]), 0);
        result = log10(result_avxd) - log10(ldexp(1.0, 1020.0));
      }
      else
        result = (double)(log10f(result_avxf) - log10f(ldexpf(1.f, 120.f)));
      results_vec[i] = result;
      product += (tc_vector[i].rslen*tc_vector[i].haplen);
    }
    total_time +=  get_time();
#if 0
#pragma omp parallel for schedule(dynamic,chunk_size)
    for(unsigned i=0;i<num_testcases;++i)
    {
      testcase& tc = tc_vector[i];
      float result_avxf = compute_full_prob<float>(&tc);
      double result = 0;
      if (result_avxf < MIN_ACCEPTED) {
        double result_avxd = compute_full_prob<double>(&tc);
        result = log10(result_avxd) - log10(ldexp(1.0, 1020.0));
      }
      else
        result = (double)(log10f(result_avxf) - log10f(ldexpf(1.f, 120.f)));
      baseline_results[i] = result;
    }
    baseline_time += get_time();
    for(unsigned i=0;i<num_testcases;++i)
    {
      double baseline_result = baseline_results[i];
      double abs_error = fabs(baseline_result-results_vec[i]);
      double rel_error = (baseline_result != 0) ? fabs(abs_error/baseline_result) : 0;
      if(abs_error > 1e-5 && rel_error > 1e-5)
      {
        cout << "Line "<<total_count+i<< " " << std::scientific << baseline_result << " "<<results_vec[i]<<"\n";
        all_ok = false;
      }
    }
#endif
    for(unsigned i=0;i<num_testcases;++i)
    {
      delete tc_vector[i].rs;
      delete tc_vector[i].hap;
      delete tc_vector[i].q;
      delete tc_vector[i].i;
      delete tc_vector[i].d;
      delete tc_vector[i].c;
    }
    total_count += num_testcases;
    num_testcases = 0;
    //curr_batch_size = rand()%BATCH_SIZE + 4;     //min batch size
    curr_batch_size = BATCH_SIZE;
  }

  baseline_results.clear();
  results_vec.clear();
  tc_vector.clear();
  if(all_ok)
    cout << "All outputs acceptable\n";
  cout << "Total  vector time "<< (total_time*1e-9) << " baseline time "<<baseline_time*1e-9<<"\n";
  cout << "Product "<<product<<"\n";
  cout.flush();
  fflush(stdout);
  if(use_old_read_testcase)
    fclose(fptr);
  else
    ifptr.close();
  g_load_time_initializer.close_sandbox();
#endif
  return 0;
}