利用公共数据库中果蝇F1代和栽培水稻基于高通量Illumina测序平台的RNASeq短序列数据,比较了8个 (ABySS, Velvet, SOAPdenovo, Oases, Trinity, Multiplek, TIDBA and TransABySS) 转录组从头组装软件。结果显示,在基于单一kmer和多重kmer方法的两类软件中,Trinity和TransABySS分别表现出最好的组装性能,而其它软件性能比较接近。我们还发现基于多重kmer比单一kmer可以组装获得更多的总碱基数目,但是即使利用最好的多重kmer组装软件,所获得的数据质量也比研究人员所期望的要低。鉴于此,我们提出了“ETM”优化方法,将多重kmer方法组合到Trinity中,使其在具有最好的组装性能的基础上兼具了多重kmer的优势,测试结果显示了该方法具有一定的优越性。我们的研究结果为用户选择合适的软件提供了依据,对推动基于高通量Illumina测序的转录组研究具有重要意义。