2020.8.26丨全长转录组测序产品概述
知识点梳理
- 全长转录组
- 测序发展史
- 测序原理
- Sanger测序:毛细管电泳测序
- illumina测序:制备文库、桥式PCR、可逆终止边合成边测序
- SMRT测序:边合成边测序
- 二代拼接与组装
- 二代测序:更多关注基因表达情况
- 弊端:
- 多倍体或杂合物种(无参)转录本拼接难
- 无参转录组的定量准确性偏低
- 无法准确检测可变剪接位点(假阳性较高)、APA、融合基因,基因家族
- 可变剪接
- 概念:一个mRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体。
- 特点:时间和空间性 在不同的组织、不同细胞,不同生理阶段或不同 生理状态下均产生不同的剪接体 95%的人类基因可发生可变剪切
- 形式: 外显子跳跃、5'末端和3'末端可变剪 切、内含子保留等 植物中主要的剪接形式为内含子保留 动物中则多为外显子跳跃
- 重点:
- 推广客户时,区分二代和三代测序的分析侧重
- 二代测序注重差异基因的表达
- 三代测序鉴定差异表达的转录本,更加精细
- 可变多聚腺苷酸化(APA)
- 经典APA位点:AAUAAA
- 影响:一个基因上有多个APA,可以产生多条不同长度3'UTR的mRNA,或产生不同编码序列的转录本
- 特点:
- 转录后修饰和调控方式
- 不同物种间polyA尾的长度差异很大,如人平均250-300 个A,酵母平均70-80个A,拟南芥平均51个A
- polyA太短的mRNA很容易被酶解或者处于翻译休眠状态
- 融合基因
- 两个或多个基因的编码区首尾相连,置于同一套调控序列(包括启动子、增强子、核糖体结 合序列、终止子等)控制之下,构成的嵌合基因。
- 融合基因是由染色体重排产生的,包括染色体的易位,插入,颠倒,缺失等。
- 融合基因的产生改变了基因的蛋白编码序列或调控序列,使得基因功能发生变化,对机体的 影响较大:转录调控失调、生产嵌合体蛋白、基因截短等
- 三代全长概述
- 利用三代测序平台对某一物种的mRNA进行测序研究
- 可直接获得从5'端到3'端的高质量转录组信息而称为全长转录组测序 全长转录组测序无需组装,直接获得单分子全长mRNA信息,同时可准确鉴定基因的可变剪接、可 变多聚腺苷酸化( APA)、融合基因、基因家族和非编码RNA等信息。
- 三代测序平台
- PB、Nanopore
- 测序发展史
- PB概述
- PB建库原理
- 芯片纳米孔决定了测序效率
- 带荧光信号的dNTP在孔中合成序列,同时荧光信号完成测序功能
- PB平台比较
- 仪器试剂更新
- 测序读长长
- 产出数据量提升
- 准确性提高
- 支持barcode
- Sequel Ⅱ引进
- 测序读长长
- 产出数据量提升:~300 Gb
- 准确性提高
- 支持barcode,12个
- 价格降低
- PB建库原理
- Nanopore概述
- 发展历程
- 中国大陆首家ONT官方认证——RNA测序资质
- 也是中国大陆唯一一家通过ONT官方认证
- 全球通过ONT官方认证的共15家,分布在美国、法国、荷兰、 日本、新加坡、台湾等。
- 测序原理
- Oxford Nanopore Technology(ONT)概念于上世纪80年代便被提出
- 2014年,ONT对外提供MinION试用项目计划
- 2016年,Nanopore平台通量提升,错误率显著降低
- DNA/RNA分子上接马达蛋白(解旋酶)并附 着在纳米孔蛋白上 u Oxford Nanopore Technology(ONT)概念于上世纪80年代便被提出
- 2014年,ONT对外提供MinION试用项目计划
- 2016年,Nanopore平台通量提升,错误率显著降低 l 纳米孔蛋白插入由人工合成的多聚物形成的膜中, 薄膜的两侧浸没在含有离子的水溶液
- 产生电势,形成特征性离子电流变化信号
- 碱基判读
- uNanopore的碱基判读是依据其电流信号产生
- 蛋白Pore狭窄处的纵向长度为大约5个碱基,某时间点测到的电流信号,为5个碱基共同作 用的结果
- Nanopore平台下机数据格式为FAST5格式,需要转化为FASTA和FASTQ格式再进行后续 分析
- 通过“递归神经网络(Recurrent Neural Network)”的复杂算法对碱基进行判读。使用 MinKnow进行数据处理
- 三种RNA建库测序方式区别
- Direct RNA:针对RNA测序
- 用于修饰研究,如RNA甲基化
- 不足:成本较高
- cDNA-PCR
- 建库更加稳定,适合差异基因,定量研究
- 基于cDNA测序
- Direct RNA:针对RNA测序
- 优势
- GC含量偏好性较低
- 发展历程
- 产品分类
- Nanopore要求有参物种
- 已测序物种(species): 人、鼠
- 动物(animals): 鸡、牛、羊、猪等
- 植物(plants): 拟南芥、小麦、茶树、水稻等
- 水产(aquatic products): 仿刺参、鱼、虾等
- ONT全长转录组优势
- 定量更准
- GC偏好性低
- 转录本水平定量(二代是基因水平定量???)
- 数据饱和(与PB相比,PB的饱和度低,无法定量)
- 定量和定性到的转录本种类更多,有利于后期深入验证,发表多篇文章
- 发表文章速度快,IF至少4分以上(PNAS、BMC Genomics、J MOL DIGNA、Frontiers系列,SR等)
- 目前还没有成功案例
- 定量更准
- PB产品
- 有参纯三代,有参2+3
- 无参纯三代,无参2+3(Only PB)
- 技术比较
- ONT不包括SNP和Index分析
- 可推广客户
- 对三代测序比较了解 此类客户之前有类似研究,或是同课题组或同院系有类似研究,对三代研究内容比较了解
- 1) 定量和定性到的转录本种类更多,有利于后期深入验证,发表多篇文章
- 2) 单样品的可变剪接、APA、融合转录本等结构鉴定更准确,可准确鉴定到不同时期不同状态下单个 样品特异和差异的结构
- 3) 单样品的转录本定量更为准确。Pacbio的2+3,使用二代辅助定量,存在多比对效率问题(ONT,0%; 二代约20%),而ONT可直接对转录本进行定量,结果更准
- 对三代测序只是泛泛了解,听过但未接触过
- 1) 新技术,蓝海,可发挥的内容多,适合短平快发文章,不需功能验证
- 2) 发表文章速度快,IF至少4分以上(PNAS、BMC Genomics、J MOL DIGNA、Frontiers系列,SR等)
- 3) 有二代测序技术项目经验
- 对三代测序比较了解 此类客户之前有类似研究,或是同课题组或同院系有类似研究,对三代研究内容比较了解
- 不做客户
- 无参物种不接; ONT辅助注释基因组,做二代测序
- 样品送样量 最低起始量在1μg以下
- 科研经费 测序经费有限
- 只关心表达量 仅单纯利用少数的科研经费,发表期刊论文,不追求高分
- 科研水平较差 只做过普通转录组,且售后一堆问题;未曾接触过其他二代测序技术,未曾听过或了解过
- 生产应用团队 生理生化指标测定、表型研究团队,未接触过任何二代测序技术
- 客户定位
- PB
- 无参客户 (植物、水产等)
- 混样研究,二代和三代联合分析
- 对碱基准确性特别关心的
- 关注SNP和Indel
- 保守派,不喜欢挑战的
- PB
- Nanopore要求有参物种
- 应用方向
- 三代能做结构分析
- AS、融合基因(农学较少)、lncRNA、基因家族、APA
- 方案设计
- 背景调研
- 确定物种是否有参考基因组;
- 出现什么性状(抗旱、耐盐、颜色、产量);
- 研究进展,进一步引出本项目的研究意义和创新之处
- 实验设计
- 通过文献调研,推荐样品取材部位、处理方式或发育阶段的选择;
- 前期验证实验、生理指标的测定方案等;
- 生物学重复确认、测序策略;
- 绘制技术路线
- 背景调研
- 三代能做结构分析