分子描述符和分子相似性

分子描述符

数字化的产物,数值指标
比如性别 必须要用1代表男,2代表女
分子结构不是数值也不是数值的集合 分子结构必须要变换成数字的形式才是分子描述符

一、按种类分类:定量描述符和定性描述符

     唯一的一种定性描述符是分子指纹:是对分子的结构性质分子片段或子结构信息使用某种编码进行表示 有很多分子指纹
     除了分子指纹全部是定性描述符

二、数据类型:

     布尔值、整数、实数、向量、标量场、向量场、张量
所有的物理量都可以转化成张量

三、按照需要的分子结构维数分类:

     一维(化学式)
     二维(苯环的数量,通过化学式得不到,几个氢键的受体)
     三维(分子的表面积 因为需要知道每一个原子的坐标)、

四、按照物理意义分类

只是列举、还有很多

A 组成描述符

表示分子组成或相对组成数量
必不可少,单独使用不行,需要和更复杂的描述符结合到一起使用

B 拓扑描述符

通常是二维的分子描述符
Wiener指数:距离矩阵 计算机存储 行和列分别代表5个原子 2号原子和三号原子通过一个化学键链接 1和4之间是通过三个化学键链接
分子描述符和分子相似性
另外一半是对称的 维纳指数看起来比较奇怪 物理意义不明确
具体怎么用没考虑

C 亲脂性、亲水性描述符

油水分配剂
分子描述符和分子相似性

正辛醇
化合物在油相和水相之中都会有溶解,测量浓度去对数得到油水分离系数
亲脂性/疏水性的大小 logP的大小来反应

常见的logP 计算方法

除了实验以外还有很多

其他的亲脂性亲水性描述符

LogS
LogD
难度更大一些

D 几何描述符

     根据分子的性状计算出来
     转动惯量
     回旋半径
     分子表面积
          范德华表面积
          溶剂及可及表面积
               探针分子球心形成的表面积
          溶剂排除表面积
               探针分子球面形成的表面积
Es立体参数       表示立体效应 两个反应速率的差值
取代基如果越大 空间位阻越大 越难形成中间产物 反应速率越慢 得到的Es值负值越大
分子描述符和分子相似性

E 电性描述符

F 热力学参数

G 构象描述符

H 量子化学描述符

有热力学参数 生成热

I 分子场参数

探针和分子相互作用
标量场 每一个点有一个标量值

J 受体相互作用描述符

K

L

分子描述符计算软件
Dragon软件可以计算5270+描述符
优秀的分子描述符的要求:
分子描述符和分子相似性

定量构效关系

分子相似性