gatk-3.8/java/src/org/broadinstitute/sting/gatk/executive/MicroScheduler.java

package org.broadinstitute.sting.gatk.executive;

import edu.mit.broad.picard.reference.ReferenceSequenceFile;
import org.apache.log4j.Logger;
import org.broadinstitute.sting.gatk.dataSources.shards.ShardStrategy;
import org.broadinstitute.sting.gatk.dataSources.shards.ShardStrategyFactory;
import org.broadinstitute.sting.gatk.dataSources.shards.Shard;
import org.broadinstitute.sting.gatk.dataSources.simpleDataSources.SAMDataSource;
import org.broadinstitute.sting.gatk.dataSources.providers.ShardDataProvider;
import org.broadinstitute.sting.gatk.traversals.TraversalEngine;
import org.broadinstitute.sting.gatk.traversals.TraverseByReads;
import org.broadinstitute.sting.gatk.traversals.TraverseLociByReference;
import org.broadinstitute.sting.gatk.walkers.TreeReducible;
import org.broadinstitute.sting.gatk.walkers.Walker;
import org.broadinstitute.sting.gatk.walkers.ReadWalker;
import org.broadinstitute.sting.gatk.refdata.ReferenceOrderedDatum;
import org.broadinstitute.sting.gatk.refdata.ReferenceOrderedData;
import org.broadinstitute.sting.utils.GenomeLoc;
import org.broadinstitute.sting.utils.StingException;
import org.broadinstitute.sting.utils.fasta.IndexedFastaSequenceFile;

import java.io.File;
import java.io.FileNotFoundException;
import java.util.List;

/**
 * Created by IntelliJ IDEA.
 * User: mhanna
 * Date: Apr 26, 2009
 * Time: 12:37:23 PM
 * To change this template use File | Settings | File Templates.
 */

/**
 * Shards and schedules data in manageable chunks.
 */
public abstract class MicroScheduler {
    private static long SHARD_SIZE = 100000L;    

    protected static Logger logger = Logger.getLogger(MicroScheduler.class);

    protected final TraversalEngine traversalEngine;
    protected final IndexedFastaSequenceFile reference;

    private final SAMDataSource reads;

    /**
     * MicroScheduler factory function.  Create a microscheduler appropriate for reducing the
     * selected walker.
     * @param walker Which walker to use.
     * @param nThreadsToUse Number of threads to utilize.
     * @return The best-fit microscheduler.
     */
    public static MicroScheduler create( Walker walker, List<File> reads, File ref, List<ReferenceOrderedData<? extends ReferenceOrderedDatum>> rods, int nThreadsToUse ) {
        if( walker instanceof TreeReducible && nThreadsToUse > 1 ) {
            logger.info("Creating hierarchical microscheduler");
            return new HierarchicalMicroScheduler( walker, reads, ref, rods, nThreadsToUse );
        }
        else {
            logger.info("Creating linear microscheduler");
            return new LinearMicroScheduler( walker, reads, ref, rods );
        }
    }

    /**
     * Create a microscheduler given the reads and reference.
     * @param reads The reads.
     * @param refFile File pointer to the reference.
     */
    protected MicroScheduler( Walker walker, List<File> reads, File refFile, List<ReferenceOrderedData<? extends ReferenceOrderedDatum>> rods ) {
        if (walker instanceof ReadWalker) {
            traversalEngine = new TraverseByReads(reads, refFile, rods);
        } else {
            traversalEngine = new TraverseLociByReference(reads, refFile, rods);
        }

        this.reads = getReadsDataSource( reads );
        this.reference = openReferenceSequenceFile( refFile );
    }

    /**
     * A temporary getter for the traversal engine.  In the future, clients
     * of the microscheduler shouldn't need to know anything about the traversal engine.
     * @return The traversal engine.
     */
    public TraversalEngine getTraversalEngine() {
        return traversalEngine;
    }

    /**
     * Walks a walker over the given list of intervals.
     * @param walker Computation to perform over dataset.
     * @param intervals A list of intervals over which to walk.  Null for whole dataset.
     */
    public abstract void execute( Walker walker, List<GenomeLoc> intervals);

    /**
     * Get the sharding strategy given a driving data source.
     * @param drivingDataSource Data on which to shard.
     * @param intervals Intervals to use when limiting sharding.
     * @return Sharding strategy for this driving data source.
     */
    protected ShardStrategy getShardStrategy( ReferenceSequenceFile drivingDataSource, List<GenomeLoc> intervals ) {
        ShardStrategy shardStrategy = null;
        if( intervals != null )
            shardStrategy = ShardStrategyFactory.shatter( ShardStrategyFactory.SHATTER_STRATEGY.LINEAR,
                                                          drivingDataSource.getSequenceDictionary(),
                                                          SHARD_SIZE,
                                                          intervals );
        else
            shardStrategy = ShardStrategyFactory.shatter( ShardStrategyFactory.SHATTER_STRATEGY.LINEAR,
                                                          drivingDataSource.getSequenceDictionary(),
                                                          SHARD_SIZE );

        return shardStrategy;
    }

    /**
     * Gets an window into all the data that can be viewed as a single shard.
     * @param shard The section of data to view.
     * @return An accessor for all the data in this shard.
     */
    protected ShardDataProvider getShardDataProvider( Shard shard ) {
        return new ShardDataProvider( shard, reads, reference );
    }

    /**
     * Gets a data source for the given set of reads.
     * @return A data source for the given set of reads.
     */
    private SAMDataSource getReadsDataSource( List<File> reads ) {
        List<File> unpackedReads = null;
        try {
            unpackedReads = TraversalEngine.unpackReads(reads);
        }
        catch( FileNotFoundException ex ) {
            throw new StingException( "Cannot unpack list of reads files", ex );
        }

        SAMDataSource dataSource = new SAMDataSource( unpackedReads );

        // Side effect: initialize the traversal engine with reads data.
        // TODO: Give users a dedicated way of getting the header so that the MicroScheduler
        //       doesn't have to bend over backward providing legacy getters and setters.
        traversalEngine.setSAMHeader(dataSource.getHeader());

        return dataSource;
    }

    /**
     * Opens a reference sequence file paired with an index.
     * @param refFile Handle to a reference sequence file.  Non-null.
     * @return A thread-safe file wrapper.
     */
    private IndexedFastaSequenceFile openReferenceSequenceFile( File refFile ) {
        IndexedFastaSequenceFile ref = null;
        try {
            ref = new IndexedFastaSequenceFile(refFile);
        }
        catch( FileNotFoundException ex ) {
            throw new RuntimeException("File not found opening fasta file; please do this check before MicroManaging", ex);
        }
        GenomeLoc.setupRefContigOrdering(ref);
        return ref;
    }
}
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`package org.broadinstitute.sting.gatk.executive;`

Added code to the schedulers, one step closer to turning on the new reads traversals git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@613 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-07 06:36:25 +08:00			`import edu.mit.broad.picard.reference.ReferenceSequenceFile;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`import org.apache.log4j.Logger;`
			`import org.broadinstitute.sting.gatk.dataSources.shards.ShardStrategy;`
			`import org.broadinstitute.sting.gatk.dataSources.shards.ShardStrategyFactory;`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`import org.broadinstitute.sting.gatk.dataSources.shards.Shard;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`import org.broadinstitute.sting.gatk.dataSources.simpleDataSources.SAMDataSource;`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`import org.broadinstitute.sting.gatk.dataSources.providers.ShardDataProvider;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`import org.broadinstitute.sting.gatk.traversals.TraversalEngine;`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`import org.broadinstitute.sting.gatk.traversals.TraverseByReads;`
			`import org.broadinstitute.sting.gatk.traversals.TraverseLociByReference;`
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00			`import org.broadinstitute.sting.gatk.walkers.TreeReducible;`
Added code to the schedulers, one step closer to turning on the new reads traversals git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@613 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-07 06:36:25 +08:00			`import org.broadinstitute.sting.gatk.walkers.Walker;`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`import org.broadinstitute.sting.gatk.walkers.ReadWalker;`
First stage of ROD plumbing for MicroScheduler. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@614 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-07 07:26:21 +08:00			`import org.broadinstitute.sting.gatk.refdata.ReferenceOrderedDatum;`
			`import org.broadinstitute.sting.gatk.refdata.ReferenceOrderedData;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`import org.broadinstitute.sting.utils.GenomeLoc;`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`import org.broadinstitute.sting.utils.StingException;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`import org.broadinstitute.sting.utils.fasta.IndexedFastaSequenceFile;`

			`import java.io.File;`
Added code to the schedulers, one step closer to turning on the new reads traversals git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@613 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-07 06:36:25 +08:00			`import java.io.FileNotFoundException;`
			`import java.util.List;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00
			`/**`
			`* Created by IntelliJ IDEA.`
			`* User: mhanna`
			`* Date: Apr 26, 2009`
			`* Time: 12:37:23 PM`
			`* To change this template use File \| Settings \| File Templates.`
			`*/`
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00
			`/**`
			`* Shards and schedules data in manageable chunks.`
			`*/`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`public abstract class MicroScheduler {`
			`private static long SHARD_SIZE = 100000L;`

More cleanup. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@539 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:46:52 +08:00			`protected static Logger logger = Logger.getLogger(MicroScheduler.class);`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`protected final TraversalEngine traversalEngine;`
			`protected final IndexedFastaSequenceFile reference;`
Cleanup LinearMicroScheduler in preparation for TraverseByLoci inclusion. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@634 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-08 08:58:37 +08:00
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`private final SAMDataSource reads;`
Cleanup LinearMicroScheduler in preparation for TraverseByLoci inclusion. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@634 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-08 08:58:37 +08:00
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00			`/**`
			`* MicroScheduler factory function. Create a microscheduler appropriate for reducing the`
			`* selected walker.`
			`* @param walker Which walker to use.`
			`* @param nThreadsToUse Number of threads to utilize.`
			`* @return The best-fit microscheduler.`
			`*/`
First stage of ROD plumbing for MicroScheduler. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@614 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-07 07:26:21 +08:00			`public static MicroScheduler create( Walker walker, List<File> reads, File ref, List<ReferenceOrderedData<? extends ReferenceOrderedDatum>> rods, int nThreadsToUse ) {`
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00			`if( walker instanceof TreeReducible && nThreadsToUse > 1 ) {`
			`logger.info("Creating hierarchical microscheduler");`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`return new HierarchicalMicroScheduler( walker, reads, ref, rods, nThreadsToUse );`
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00			`}`
			`else {`
			`logger.info("Creating linear microscheduler");`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`return new LinearMicroScheduler( walker, reads, ref, rods );`
Placeholder for parallel MicroManager. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@542 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 07:08:12 +08:00			`}`
			`}`

Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`/**`
			`* Create a microscheduler given the reads and reference.`
			`* @param reads The reads.`
			`* @param refFile File pointer to the reference.`
			`*/`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`protected MicroScheduler( Walker walker, List<File> reads, File refFile, List<ReferenceOrderedData<? extends ReferenceOrderedDatum>> rods ) {`
			`if (walker instanceof ReadWalker) {`
			`traversalEngine = new TraverseByReads(reads, refFile, rods);`
			`} else {`
			`traversalEngine = new TraverseLociByReference(reads, refFile, rods);`
			`}`

			`this.reads = getReadsDataSource( reads );`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`this.reference = openReferenceSequenceFile( refFile );`
			`}`

			`/**`
			`* A temporary getter for the traversal engine. In the future, clients`
			`* of the microscheduler shouldn't need to know anything about the traversal engine.`
			`* @return The traversal engine.`
			`*/`
Cleanup LinearMicroScheduler in preparation for TraverseByLoci inclusion. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@634 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-08 08:58:37 +08:00			`public TraversalEngine getTraversalEngine() {`
			`return traversalEngine;`
			`}`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00
			`/**`
			`* Walks a walker over the given list of intervals.`
			`* @param walker Computation to perform over dataset.`
			`* @param intervals A list of intervals over which to walk. Null for whole dataset.`
			`*/`
			`public abstract void execute( Walker walker, List<GenomeLoc> intervals);`

			`/**`
			`* Get the sharding strategy given a driving data source.`
			`* @param drivingDataSource Data on which to shard.`
			`* @param intervals Intervals to use when limiting sharding.`
			`* @return Sharding strategy for this driving data source.`
			`*/`
			`protected ShardStrategy getShardStrategy( ReferenceSequenceFile drivingDataSource, List<GenomeLoc> intervals ) {`
			`ShardStrategy shardStrategy = null;`
			`if( intervals != null )`
			`shardStrategy = ShardStrategyFactory.shatter( ShardStrategyFactory.SHATTER_STRATEGY.LINEAR,`
			`drivingDataSource.getSequenceDictionary(),`
			`SHARD_SIZE,`
			`intervals );`
			`else`
			`shardStrategy = ShardStrategyFactory.shatter( ShardStrategyFactory.SHATTER_STRATEGY.LINEAR,`
			`drivingDataSource.getSequenceDictionary(),`
			`SHARD_SIZE );`

			`return shardStrategy;`
			`}`

Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`/**`
			`* Gets an window into all the data that can be viewed as a single shard.`
			`* @param shard The section of data to view.`
			`* @return An accessor for all the data in this shard.`
			`*/`
			`protected ShardDataProvider getShardDataProvider( Shard shard ) {`
			`return new ShardDataProvider( shard, reads, reference );`
			`}`

Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`/**`
			`* Gets a data source for the given set of reads.`
			`* @return A data source for the given set of reads.`
			`*/`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`private SAMDataSource getReadsDataSource( List<File> reads ) {`
			`List<File> unpackedReads = null;`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`try {`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`unpackedReads = TraversalEngine.unpackReads(reads);`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`}`
			`catch( FileNotFoundException ex ) {`
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`throw new StingException( "Cannot unpack list of reads files", ex );`
Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`}`
Cleanup LinearMicroScheduler in preparation for TraverseByLoci inclusion. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@634 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-08 08:58:37 +08:00
Cleanup in preparation for ByLoci traversal. Also did some work minimizing unit tests. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@643 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-09 05:27:54 +08:00			`SAMDataSource dataSource = new SAMDataSource( unpackedReads );`

Cleanup LinearMicroScheduler in preparation for TraverseByLoci inclusion. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@634 348d0f76-0448-11de-a6fe-93d51630548a 2009-05-08 08:58:37 +08:00			`// Side effect: initialize the traversal engine with reads data.`
			`// TODO: Give users a dedicated way of getting the header so that the MicroScheduler`
			`// doesn't have to bend over backward providing legacy getters and setters.`
			`traversalEngine.setSAMHeader(dataSource.getHeader());`

Documentation and cleanup work in preparation for parallelism. git-svn-id: file:///humgen/gsa-scr1/gsa-engineering/svn_contents/trunk@538 348d0f76-0448-11de-a6fe-93d51630548a 2009-04-27 01:42:00 +08:00			`return dataSource;`
			`}`

			`/**`
			`* Opens a reference sequence file paired with an index.`
			`* @param refFile Handle to a reference sequence file. Non-null.`
			`* @return A thread-safe file wrapper.`
			`*/`
			`private IndexedFastaSequenceFile openReferenceSequenceFile( File refFile ) {`
			`IndexedFastaSequenceFile ref = null;`
			`try {`
			`ref = new IndexedFastaSequenceFile(refFile);`
			`}`
			`catch( FileNotFoundException ex ) {`
			`throw new RuntimeException("File not found opening fasta file; please do this check before MicroManaging", ex);`
			`}`
			`GenomeLoc.setupRefContigOrdering(ref);`
			`return ref;`
			`}`
			`}`