2012年5月14日星期一

TopHat - Parallel mapping of transcriptomes to detect indels, gene fusions, and more

http://tophat.cbcb.umd.edu/index.html


Version 2.0.0 is a major release adding  Bowtie 2 support,  better parallelization and theability to align RNA-Seq reads across potential fusion points.
  • TopHat now uses Bowtie2 by default (if found in the systemalthough it can also fallback on Bowtie 1 (which is still required for SOLiD reads). 
  • Bowtie 2 integration features:
    • most of the optional SAM fields (ASMDNMand etc.) generated by Bowtie 2 arenow reported by TopHat as well (reconstructed as necessary)
    • many of the Bowtie 2 options can now be directly given as TopHat options using --b2-These apply to initial read mappingsnot to segmentmappings - please see the corresponding manual section.
    • TopHat 2 maps reads against transcriptome (optional), genomeand novel/known splicesites using Bowtie 2 (or 1) in a fashion meant to increase the overall mapping sensitivityand accuracyIn the case of Bowtie 2, reads poorly mapped in the initial stages (withlower scoring alignments due to indels etc.) will be made available for re-mapping indownstream stagesAlignments obtained in all participating stages are pooled and thebest alignments will be finally reported for each readPlease note that this TopHatversion requires the installation of Bowtie version 2.0.0-beta5 or lateralso note thatBowtie1 and Bowtie2 indexes are differentso  it is necessary to use the new Bowtie 2indexes with TopHat 2 (unless --bowtie1 option is used or bowtie 2 is not found in thesystem). Since the iGenome Bowtie indexes do not include Bowtie 2 indexesyou maywant to download Bowtie 2 indexes from the Bowtie2 website or build them using bowtie2-build.
    • Most of the time-consuming steps in the TopHat 2 pipeline are now parallelizedreducingthe total running time substantially on multi-processor systems.
    • In addition to mapping across splice sitesTopHat 2 can now align reads across fusionpointswhich usually occur due to genomic translocationsread-through transcriptionortrans-splicingTophat 2 integrates the fusion discovery engine previously found inTopHat-Fusion  (fusion mapping is optionalplease see the separate page for fusion mapping and the --fusion-... options in the manual).
    • Colorspace (SOLiD) reads require the older version of Bowtie, since Bowtie 2 does not provide support for this kind of reads.
    • --closure-search and --butterfly-search options have been deprecated
    • In addition to reporting the best (or primaryalignments (the original TopHat behavior),TopHat 2 can report the secondary alignments up to 20 (the defaultpaired or singlealignments (see --report-secondary-alignments and -g/--max-multihits)
    • The installation of the Boost package is now required in order to build TopHat 2 from source (see  Installation).
    • New options affecting TopHat's output:
      •  --keep-fasta-order (for those who prefer the order of reference sequences in the SAM output to match the order of the sequences in the genome fasta file) 
      • --report-discordant-pair-alignments
    • If you had some older versions of TopHat and TopHat-Fusion installed on your system,we suggest that you remove both programs before installing the new version and makesure that your system PATH includes the new version but does not include the otherones.

    没有评论:

    发表评论