29 超大表与超小表HASH JOIN优化方法--优化主题系列

select * from a,b where a.id=b.id;

a表100GB b表50MB 如何优化？？

select *,(select * from b wherea.id=b.id) from a; --标量子查询

A表100GB 是不是几十亿的数据？？如果是标量子查询 A返回一条 B就会扫描1次相当于B被扫描几十亿次

即使B走索引走索引至少读3个块然后回表一个块至少读四个快几十亿*4 逻辑读很大吧是不是要搞挂

B的索引是热点块是吧？？如果发现索引热点块不要盲目去反键索引keep索引最好办法是从SQL+业务去优化

select * from a,b where a.id=b.id(+);

这个sql如果走NL 去死吧 A做驱动表是不是B表被扫描几十亿次同上如果走HASH如何优化呢？？开并行

超大表和小表之间做HASHJOIN 一般会启用并行 ORACLE在并行HASHJOIN的时候会用到很多技术比如HASHHASH 或者BROADCAST 对于超大表和小表做HASHJOIN 一定要让小表进行广播(Broadcast) 通常情况下CBO会选择正确但是如果统计信息不准或者基数计算错误CBO选择了HASHHASH join 这个时候就很慢观察现象就是它在做directpath write temp 此时可以用HINTPQ_DISTRIBUTE进行调整 PQ_DISTRIBUTE(驱动表None,Broadcast) 如果外层表很小(HASH_AJ)此时可以用 PQ_DISTRIBUTE(驱动表Broadcast,None)