【Hibernate】性能优化之缓存管理

1.缓存概述

缓存(cache)在java应用程序中是一组内存中的集合示例，它保存着永久性存储源(如硬盘上的文件或数据库)中数据的备份，它的读写速度比读写硬盘的速度快。应用程序在运行时直接读写缓存中的数据，只在某些特定时刻按照缓存中的数据来同步更新数据存储源。如果缓存中存放的数据量非常大，也会用硬盘作为缓存的物理介质

缓存的作用就是降低应用程序直接读写永久性数据存储源的频率，从而增强应用的运行性能

缓存的实现不仅需要作为物理介质的硬件（内存），同时还需要用于管理缓存的并发访问和过期等策略的软件

2.缓存范围分类

缓存的范围决定了缓存的声明周期以及可以被谁访问。总共分三类

1）事务范围

事务范围的缓存只能被当前事务访问,每个事务都有各自的缓存,缓存内的数据通常采用相互关联的对象形式.缓存的生命周期依赖于事务的生命周期,只有当事务结束时,缓存的生命周期才会结束.事务范围的缓存使用内存作为存储介质,一级缓存就属于事务范围.

2）应用范围（也叫进程范围）

应用程序的缓存可以被应用范围内的所有事务共享访问.缓存的生命周期依赖于应用的生命周期,只有当应用结束时,缓存的生命周期才会结束.应用范围的缓存可以使用内存或硬盘作为存储介质,二级缓存就属于应用范围.

3）集群范围

在集群环境中,缓存被一个机器或多个机器的进程共享,缓存中的数据被复制到集群环境中的每个进程节点,进程间通过远程通信来保证缓存中的数据的一致,缓存中的数据通常采用对象的松散数据形式.

对大多数应用来说，应该慎重地考虑是否需要使用集群范围的缓存，因为访问的速度不一定回避直接访问数据库数据的速度快很多

3.缓存的并发访问策略

当多个并发的失误同时访问持久化层的缓存的相同数据时，会引发起并发问题，必须采用必要的失误隔离措施

在进程范围或集群范围的缓存，会出现并发问题，因此可以设定一下四种类型的并发访问策略，每一种策略对应一种事务隔离级别。事务型并发访问策略是事务隔离级别最高，只读型的隔离级别最低。事务隔离级别越高，并发性能就越低

　1）事务型：仅仅在受管理环境中适用。它提供了Repeatable Read事务隔离级别。对于经常被读但很少修改的数据，可以采用这种隔离类型，因为它可以防止脏读和不可重复读这类的并发问题。

　2）读写型：提供了Read Committed事务隔离级别。仅仅在非集群的环境中适用。对于经常被读但很少修改的数据，可以采用这种隔离类型，因为它可以防止脏读这类的并发问题。

　3）非严格读写型：不保证缓存与数据库中数据的一致性。如果存在两个事务同时访问缓存中相同数据的可能，必须为该数据配置一个很短的数据过期时间，从而尽量避免脏读。对于极少被修改，并且允许偶尔脏读的数据，可以采用这种并发访问策略。　　

4）只读型：对于从来不会修改的数据，如参考数据，可以使用这种并发访问策略。

Hibernate中的缓存

hibernate中提供两级缓存，第一级别是Session级别的缓存，它是属于事务范围的缓存，第二级别的缓存是SessionFactory级别的缓存，它是属于进出呢个范围或集群范围的缓存。这一级别的缓存可以进行配置和更改，并且可以进行动态的加载和卸载。Hibernate还为查询结果提供了一个查询缓存，它依赖于第二级缓存

一级缓存的管理:

Hibernate的一级缓存是由Session提供的，因此它只存在于Session的生命周期中，当程序调用save(),update(),saveorupdate()等方法及调用查询接口list,filter,iterate时，如session缓存中还不存在相应的对象，Hibernate会把该对象加入到一级缓存中，

当Session关闭的时候该Session所管理的一级缓存也会立即被清除

Hibernate的一级缓存是Session所内置的，不能被卸载，也不能进行任何配置

一级缓存采用的是key-value的Map方式来实现的，在缓存实体对象时，对象的主关键字ID是Map的key，实体对象就是对应的值。所以说，一级缓存是以实体对象为单位进行存储的，在访问的时候使用的是主关键字ID

虽然，Hibernate对一级缓存使用的是自动维护的功能，没有提供任何配置功能，但是可以通过Session中所提供的方法来对一级缓存的管理进行手工干预。Session中所提供的干预方法包括以下两种

●evict() ：用于将某个对象从Session的一级缓存中清除

evict()方法适用于以下二种情况：

１）不需要该对象进行同步的数据更新

２）在批量进行更新与删除时，当更新删除每一个对象后，要释对此对象所占用的内存．

●clear() ：用于将一级缓存中的所有对象全部清除。</p>

<p class=MsoNormal> 在进行大批量数据一次性更新的时候，会占用非常多的内存来缓存被更新的对象。这时就应该阶段性地调用clear()方法来清空一级缓存中的对象，控制一级缓存的大小，以避免产生内存溢出的情况。

Hibernate大批量更新时缓存的处理方法:

(假设我们user表的age有5000条大于0的记录,)

Session session =SessionFactory.openSession();  

Transaction tx =session.beginTransaction();  

Itertaor users=session.find("from User u where u.age>0").itertaor();//HSL语句就不做解释了  

while(user.hasNext()){  

User user =(User)users.next();  

user.setAge(user.getAge()+1);  

//将本批插入的对象立即写入数据库并释放内存  

session.flush();  

session.clear();  

}  

tx.commit();  

session.close();

用Hibernate处理大批数据时..都必须先执行5000次的update语句,然后才能更新5000个user 对象..

这样就影响到了操作上的性能....在项目当我们遇到性能与空间的问题时,,,要以性能为主..这也就是说要牺牲空间

所以程序最好跳过Hibernate API 而直接通过JDBC API来执来...

我们改一下上面的代码:

Session session=SessionFactory.openSession();  

Transaction tx =session.beginTransaction();  

Connection conn =session.connection();  

PreparedStatement  pstmt = conn.prepareStatement("update users set age=age+1 "+"where age >0");  

pstmt.executeUpdate();  

tx.commit();

虽说这是通过JDBC API搞作的..但本质上还是通过Hibernater Transaction的事务这个接口来声明事务的边界的...

其实最好的解决方法就是以创建存储过程,,用底层的数据库运行..这样性能好,速度快....

我就简单的以Oracle数据库为例子.创建一个名为UserUpdate的存储过程...然后在程序中进行调用...

UserUpdate的存储过程代码:

create or  replace procadure UserUpdate(u_age in number) as 
 
     begin 
 
         update users set age=age+1 where age>u_age;  
 
     end;

下面的是在程序中如何调用我们命名的存储过程

Session session =SessionFactory.openSession();  

ransaction tx =session.beginTransaction();  

Connection conn=session.connection();  

String str="{call UserUpdate(?)}";  

CallableStatement cstmt= conn.prepareCall(str);  

cstmt.setInt(1,0);  

cstmt.executeUpdate();  

tx.commit();   //注意.开源的MySQL中不支持存储过程的..

用JDBC API的好处是这样的..

它不用把大批量的数据事先加载到内存中,然后再进行更新与修改..所以不会消耗大量内存....

(小程序中是看不出什么差别的..当数据的记录达到一定的数据量的时候自然会发现用Hibernate API 与JDBC API的差别)

在一个就是只能一条记录进行批量更新..不像Hibernate中更新每一条的..

第一级是Session的缓存。由于Session对象的生命周期通常对应一个数据库事务或者一个应用事务，因此它的缓存是事务范围的缓存。第一级缓存是必需的，不允许而且事实上也无法比卸除。在第一级缓存中，持久化类的每个实例都具有唯一的OID。

二级缓存管理

　　第二级缓存是一个可插拔的的缓存插件，它是由SessionFactory负责管理。由于SessionFactory对象的生命周期和应用程序的整个过程对应，因此第二级缓存是进程范围或者集群范围的缓存。这个缓存中存放的对象的松散数据。第二级对象有可能出现并发问题，因此需要采用适当的并发访问策略，该策略为被缓存的数据提供了事务隔离级别。缓存适配器用于把具体的缓存实现软件与Hibernate集成。第二级缓存是可选的，可以在每个类或每个集合的粒度上配置第二级缓存。

　　Hibernate的二级缓存策略的一般过程如下：

　　1) 条件查询的时候，总是发出一条select * from table_name where …. （选择所有字段）这样的SQL语句查询数据库，一次获得所有的数据对象。

　　2) 把获得的所有数据对象根据ID放入到第二级缓存中。

　　3) 当Hibernate根据ID访问数据对象的时候，首先从Session一级缓存中查；查不到，如果配置了二级缓存，那么从二级缓存中查；查不到，再查询数据库，把结果按照ID放入到缓存。

　　4) 删除、更新、增加数据的时候，同时更新缓存。

　　Hibernate的二级缓存策略，是针对于ID查询的缓存策略，对于条件查询则毫无作用。为此，Hibernate提供了针对条件查询的Query缓存。

　　Hibernate的Query缓存策略的过程如下：

　　1) Hibernate首先根据这些信息组成一个Query Key，Query Key包括条件查询的请求一般信息：SQL, SQL需要的参数，记录范围（起始位置rowStart，最大记录个数maxRows)，等。

　　2) Hibernate根据这个Query Key到Query缓存中查找对应的结果列表。如果存在，那么返回这个结果列表；如果不存在，查询数据库，获取结果列表，把整个结果列表根据Query Key放入到Query缓存中。

　　3) Query Key中的SQL涉及到一些表名，如果这些表的任何数据发生修改、删除、增加等操作，这些相关的Query Key都要从缓存中清空。

适合存放到二级缓存中的数据有以下四种：

1）很少被修改的数据

2）不是很重要的数据，允许偶尔并发的数据

3）不会被并发反问的数据

4）参考数据，指的是供应用参考的常量数据，它的实例数目有限，它的实例会被许多其他类的实例引用。它的实例极少或从来不会被修改

对于那些常被修改的数据，如财务数据（绝对不允许出现并发）和其他应用共享的数据，这些都不能放到第二级缓存中

常用的缓存插件

Hibernate的二级缓存是一个插件，下面是几种常用的缓存插件

1）EhCache:可作为进程访问的缓存，存放的物理介质可以是内存或硬盘，对hibernate的查询缓存提供了支持

2）OSCache:可作为进程范围的缓存，存放数据的物理介质可以使内存或硬盘，体统丰富的缓存数据过期策略，hibernate的查询缓存提供了支持

3）SwarmCache:可作为集群范围内的缓存，但不支持hibernate查询缓存

4）TreeCache:可作为集群范围内的缓存，支持事务性并发访问策略，对hibernate的查询缓存提供了支持

二级缓存示例

配置一：

hibernate.cfg.xml文件中增加

<!--开启二级缓存-->    
<property name="cache.provider_class">org.hibernate.cache.EhCacheProvider</property>    

<!--启用查询缓存-->    

<property name="hibernate.cache.use_query_cache">true</property>

配置二：

工程项目src文件下新建一个ehcache.xml文件，其内容为

<?xml version="1.0" encoding="UTF-8"?>    

    <ehcache>    

    <diskStore path="java.io.tmpdir" />    

    <defaultCache maxElementsInMemory="10000" eternal="false" overflowToDisk="true" timeToIdleSeconds="300" timeToLiveSeconds="180" diskPersistent="false" diskExpiryThreadIntervalSeconds="120" />    

    </ehcache>

配置三：

为了缓存某类的对象，其hbm文件中需添加<cache usage="read-only"/>属性例如：

Xml代码

<?xml version="1.0"?>    

    <!DOCTYPE hibernate-mapping PUBLIC "-//Hibernate/Hibernate Mapping DTD 3.0//EN"    

    "http://hibernate.sourceforge.net/hibernate-mapping-3.0.dtd">    

    <!--    

        Mapping file autogenerated by MyEclipse - Hibernate Tools   

    -->    

    <hibernate-mapping>    

       <class name="com.vogue.bbsphoto.entity.Forum"     

       table="cdb_forums">    

            <cache usage="read-only"/>    

            <id name="ID" column="fid" unsaved-value="null">    

                <generator class="increment" />    

           </id>    

           <property name="name" column="name" type="string" />    

           <property name="type" column="type" type="string" />    

        </class>    

    </hibernate-mapping>

配置四：

为了使用查询缓存，Query必须设置cacheable为true,query.setCacheable(true);

例如dao父类中用于hql查询的方法修改后为：

         /**   
 
           * 执行hql语句的查询   
 
          * @param sql   
 
          * @return   
 
          */    
 
        public List executeQuery(String hql){    
 
             List list = new ArrayList();    
 
             Session session =   HibernateSessionFactory.currentSession();    
 
            Transaction tx = null;    
 
             Query query = session.createQuery(hql);    
 
           query.setCacheable(true);    
 
            try {    

                 tx = session.beginTransaction();    
 
                 list = query.list();    
 
                tx.commit();    
 
             } catch (Exception ex) {    
 
                ex.printStackTrace();    
 
                 HibernateSessionFactory.rollbackTransaction(tx);    
 
             } finally {    
 
                 HibernateSessionFactory.closeSession();    
 
            }    
 
             return list;    
 
       }

补充一下：当要缓存的对象处于级联关系中时。如果和他存在级联关系的对象都有属性 <cache usage="read-only"/>那么，在第一次get后该对象所处的对象图中的所有对象都会保存到hibernate的二级缓存中，在第二次get该对象时，直接从二级缓存中找到所有级联的对象；如果其中某个级联对象没有<cache usage="read-only"/>属性，则不会被保存到二级缓存中，以后每次get时仍然会执行sql去数据库中找该级联对象

【Hibernate】性能优化之缓存管理

猜你喜欢