1、2021 年深度行业分析研究报告 主要内容主要内容1. 基因测序行业概况2. 基因测序产业链分析3. 基因测序行业重点公司分析 1.11.1 基因及基因测序基本概念基因及基因测序基本概念 基因:基因是由一段DNA构成的具有一定功能的核苷酸序列,一部分基因用于指导蛋白质合成;还有一部分非编码DNA用于基因表达调节。DNA是一种生物大分子,在空间结构上呈双螺旋结构,由脱氧核糖和磷酸交替连接外列在外侧构成骨架,碱基排列在内侧,两条链上的碱基连接成碱基对。组成脱氧核糖核酸的碱基,分别是腺嘌呤(adenine,A)、胞嘧啶(cytosine,C)、鸟嘌呤(guanine,G)与胸腺嘧啶(thymine,
2、T)。带有蛋白质编码的DNA片段称为基因(gene)。 基因测序:基因检测是通过血液、其他体液、或细胞对DNA进行检测的技术,是取被检测者外周静脉血或其他组织细胞,扩增其基因信息后,通过特定设备对被检测者细胞中的DNA分子信息作检测(主要是DNA碱基序列信息),分析它所含有的基因类型和基因缺陷及其表达功能是否正常的一种方法,从而使人们能了解自己的基因信息,明确病因或预知身体患某种疾病的风险。 1.2 1.2 基因测序发展历史基因测序发展历史 基因测序技术已经发展至4代,目前二代测序应用最为广泛最早实现商业化应用的测序技术是一代测序,由Sanger所发明,1977年,WalterGilbert和
3、Frederick Sanger发明了第一台测序仪,并应用其测定了第一个基因组序列,噬菌体X174,全长5375个碱基。该技术直到现在依然被广泛使用,但是其一次只能获得一条长度在7001000个碱基的序列,无法满足现代科学发展对大通量的生物基因序列获取的需求。后续在高通量测序上,目前已经发展到四代测序技术,在测序通量、测序长度以及测序成本上不断优化,使得基因测序大范围使用成为可能。图1. 基因测序技术发展历史 1.3 1.3 四代基因测序技术一览四代基因测序技术一览测序技术典型测序平台测序原理读长通量准确率测序时间成本优点缺点应用场景一代测序ABI/LIFE3730 ABI/LIFE3500S
4、anger测序/长片段测序400-900bp0.2Mb/run99%1.6个月成本高,但对于少数靶标而言,成本相对较低读长较长,准确率高通量小,测序时间长法医鉴定、亲子鉴定、基因检测二代测序Illumina HiSeq/MiSeq边合成边测序法,可逆链终止法50-150bp(x2)750-1500Gb/run99%2h-3d高昂的维护和启动成本,中等运行成本高通量,低成本读长较短,需PCR扩增,无法识别成簇碱基,序列组装难,后端数据分析要求高NIPT、科研服务、肿瘤基因检测Life Tech SOLiD连接测序法50bp30-50Gb/run99%2h-3dNIPT、科研服务、肿瘤基因检测Ro
5、che 454焦磷酸测序法200-600bp0.45Gb/run99%2h-3d个体化用药基因检测、肿瘤基因检测三代测序PacBio SequelDNA单分子测序/半导体测序10-15kp,最长读长超过40kb0.5-9Gb/run90%2h中等成本超长读长,均一覆盖度无需PCR扩增,出错率较高全基因检测四代测序Oxford、Nanopore Technologies纳米孔测序平均读长5400bp,最长读长300kb30-400bp/秒90%1.2h-2h无需维护,启动成本相对较低,中等运行成本超长读长出错率较高,边缘位点检测易出错全基因检测 应用范围最广泛的是二代测序,三代、四代测序是对二代
6、测序的补充二代测序具有通量高、成本低的特点,但读长短的缺点导致测序过程中含量较少的序列信息可能会丢失,且PCR过程中有一定概率会引入错配碱基;想要得到准确和长度较长的拼接结果,需要测序的覆盖率较高,导致结果错误较多和成本增加。三代和四代具有超长读长的特点,因此对二代测序是一个很好的补充,但成本及准确率原因,目前还未得到广泛使用。资料来源:2019目标的SARS-CoV-2表1. 四代基因测序参数对比 1.3.1 1.3.1 一代测序一代测序SangerSanger测序技术测序技术 测序原理链终止法测序ddNTP(双脱氧核苷酸)的2和3端都不含羟基,无法形成磷酸二酯键,从而导致DNA合成反应中断