2020.8.26丨全长转录组测序产品概述

知识点梳理

  • 全长转录组
    • 测序发展史

      2020.8.26丨全长转录组测序产品概述

    • 测序原理
      • Sanger测序:毛细管电泳测序
      • illumina测序:制备文库、桥式PCR、可逆终止边合成边测序
      • SMRT测序:边合成边测序
    • 二代拼接与组装
      • 二代测序:更多关注基因表达情况
      • 弊端:
        • 多倍体或杂合物种(无参)转录本拼接难
        • 无参转录组的定量准确性偏低
        • 无法准确检测可变剪接位点(假阳性较高)、APA、融合基因,基因家族
    • 可变剪接
      • 概念:一个mRNA前体通过不同的剪接方式产生不同的mRNA剪接异构体。
      • 特点:时间和空间性 在不同的组织、不同细胞,不同生理阶段或不同 生理状态下均产生不同的剪接体 95%的人类基因可发生可变剪切
      • 形式: 外显子跳跃、5'末端和3'末端可变剪 切、内含子保留等 植物中主要的剪接形式为内含子保留 动物中则多为外显子跳跃
      • 重点:
        • 推广客户时,区分二代和三代测序的分析侧重
        • 二代测序注重差异基因的表达
        • 三代测序鉴定差异表达的转录本,更加精细
    • 可变多聚腺苷酸化(APA)
      • 经典APA位点:AAUAAA
      • 影响:一个基因上有多个APA,可以产生多条不同长度3'UTR的mRNA,或产生不同编码序列的转录本
      • 特点:
        • 转录后修饰和调控方式
        • 不同物种间polyA尾的长度差异很大,如人平均250-300 个A,酵母平均70-80个A,拟南芥平均51个A
        • polyA太短的mRNA很容易被酶解或者处于翻译休眠状态
    • 融合基因
      • 两个或多个基因的编码区首尾相连,置于同一套调控序列(包括启动子、增强子、核糖体结 合序列、终止子等)控制之下,构成的嵌合基因。
      • 融合基因是由染色体重排产生的,包括染色体的易位,插入,颠倒,缺失等。
      • 融合基因的产生改变了基因的蛋白编码序列或调控序列,使得基因功能发生变化,对机体的 影响较大:转录调控失调、生产嵌合体蛋白、基因截短等
    • 三代全长概述
      • 利用三代测序平台对某一物种的mRNA进行测序研究
      • 可直接获得从5'端到3'端的高质量转录组信息而称为全长转录组测序 全长转录组测序无需组装,直接获得单分子全长mRNA信息,同时可准确鉴定基因的可变剪接、可 变多聚腺苷酸化( APA)、融合基因、基因家族和非编码RNA等信息。
      • 三代测序平台
        • PB、Nanopore
      •  
  • PB概述
    • PB建库原理
      • 芯片纳米孔决定了测序效率
      • 带荧光信号的dNTP在孔中合成序列,同时荧光信号完成测序功能
    • PB平台比较

      2020.8.26丨全长转录组测序产品概述

    • 仪器试剂更新
      • 测序读长长
      • 产出数据量提升
      • 准确性提高
      • 支持barcode
    • Sequel Ⅱ引进
      • 测序读长长
      • 产出数据量提升:~300 Gb
      • 准确性提高
      • 支持barcode,12个
      • 价格降低

        2020.8.26丨全长转录组测序产品概述

  • Nanopore概述
    • 发展历程
      • 中国大陆首家ONT官方认证——RNA测序资质
      • 也是中国大陆唯一一家通过ONT官方认证
      • 全球通过ONT官方认证的共15家,分布在美国、法国、荷兰、 日本、新加坡、台湾等。
    • 测序原理
      • Oxford Nanopore Technology(ONT)概念于上世纪80年代便被提出
      • 2014年,ONT对外提供MinION试用项目计划
      • 2016年,Nanopore平台通量提升,错误率显著降低
      • DNA/RNA分子上接马达蛋白(解旋酶)并附 着在纳米孔蛋白上 u Oxford Nanopore Technology(ONT)概念于上世纪80年代便被提出
      • 2014年,ONT对外提供MinION试用项目计划
      • 2016年,Nanopore平台通量提升,错误率显著降低 l 纳米孔蛋白插入由人工合成的多聚物形成的膜中, 薄膜的两侧浸没在含有离子的水溶液
      • 产生电势,形成特征性离子电流变化信号
    • 碱基判读
      • uNanopore的碱基判读是依据其电流信号产生
      • 蛋白Pore狭窄处的纵向长度为大约5个碱基,某时间点测到的电流信号,为5个碱基共同作 用的结果
      • Nanopore平台下机数据格式为FAST5格式,需要转化为FASTA和FASTQ格式再进行后续 分析
      • 通过“递归神经网络(Recurrent Neural Network)”的复杂算法对碱基进行判读。使用 MinKnow进行数据处理
    • 三种RNA建库测序方式区别
      • Direct RNA:针对RNA测序
        • 用于修饰研究,如RNA甲基化
        • 不足:成本较高
      • cDNA-PCR
        • 建库更加稳定,适合差异基因,定量研究
      • 基于cDNA测序
    • 优势
      • GC含量偏好性较低
  • 产品分类
    • Nanopore要求有参物种
      • 已测序物种(species): 人、鼠
      • 动物(animals): 鸡、牛、羊、猪等
      • 植物(plants): 拟南芥、小麦、茶树、水稻等
      • 水产(aquatic products): 仿刺参、鱼、虾等
    • ONT全长转录组优势
      • 定量更准
        • GC偏好性低
        • 转录本水平定量(二代是基因水平定量???)
        • 数据饱和(与PB相比,PB的饱和度低,无法定量)
      • 定量和定性到的转录本种类更多,有利于后期深入验证,发表多篇文章
      • 发表文章速度快,IF至少4分以上(PNAS、BMC Genomics、J MOL DIGNA、Frontiers系列,SR等)
      • 目前还没有成功案例
    • PB产品
      • 有参纯三代,有参2+3
      • 无参纯三代,无参2+3(Only PB)
    • 技术比较

      2020.8.26丨全长转录组测序产品概述

      • ONT不包括SNP和Index分析
    • 可推广客户
      • 对三代测序比较了解 此类客户之前有类似研究,或是同课题组或同院系有类似研究,对三代研究内容比较了解
        • 1) 定量和定性到的转录本种类更多,有利于后期深入验证,发表多篇文章
        • 2) 单样品的可变剪接、APA、融合转录本等结构鉴定更准确,可准确鉴定到不同时期不同状态下单个 样品特异和差异的结构
        • 3) 单样品的转录本定量更为准确。Pacbio的2+3,使用二代辅助定量,存在多比对效率问题(ONT,0%; 二代约20%),而ONT可直接对转录本进行定量,结果更准
      • 对三代测序只是泛泛了解,听过但未接触过
        • 1) 新技术,蓝海,可发挥的内容多,适合短平快发文章,不需功能验证
        • 2) 发表文章速度快,IF至少4分以上(PNAS、BMC Genomics、J MOL DIGNA、Frontiers系列,SR等)
        • 3) 有二代测序技术项目经验
    • 不做客户
      • 无参物种不接; ONT辅助注释基因组,做二代测序
      • 样品送样量 最低起始量在1μg以下
      • 科研经费 测序经费有限
      • 只关心表达量 仅单纯利用少数的科研经费,发表期刊论文,不追求高分
      • 科研水平较差 只做过普通转录组,且售后一堆问题;未曾接触过其他二代测序技术,未曾听过或了解过
      • 生产应用团队 生理生化指标测定、表型研究团队,未接触过任何二代测序技术
    • 客户定位
      • PB
        • 无参客户 (植物、水产等)
        • 混样研究,二代和三代联合分析
        • 对碱基准确性特别关心的
        • 关注SNP和Indel
        • 保守派,不喜欢挑战的
  • 应用方向
    • 三代能做结构分析
      • AS、融合基因(农学较少)、lncRNA、基因家族、APA
    • 方案设计
      • 背景调研
        • 确定物种是否有参考基因组;
        • 出现什么性状(抗旱、耐盐、颜色、产量);
        • 研究进展,进一步引出本项目的研究意义和创新之处
      • 实验设计
        • 通过文献调研,推荐样品取材部位、处理方式或发育阶段的选择;
        • 前期验证实验、生理指标的测定方案等;
        • 生物学重复确认、测序策略;
        • 绘制技术路线