配置Websphere挂起检测策略

配置挂起检测策略

缺省情况下,WebSphere Application Server 的挂起检测选项打开。您可以配置符合应用程序和环境的挂起检测策略,来报告潜在的挂起,从而达到及早发现服务器故障的目的。检测到挂起线程时,WebSphere Application Server 将通知您,以使您可以对问题进行故障诊断。

在您开始之前

J2EE 应用程序中的一个常见错误是挂起线程。挂起线程可能由于简单软件缺陷(例如,无限循环)或更复杂的原因(例如,资源死锁)导致。当线程运行未绑定的代码路径时(例如,当代码在无限循环中运行时),系统资源(例如,CPU 时间)可能由此挂起事务消耗。另一方面,因为处于死锁状态,所以即使所有资源都空闲,系统也可能变得不应答。除非最终用户或监视工具报告该问题,否则系统可能无限期地保持此退化状态。

使用挂起检测策略,您可以指定对于完成工作单元来说过长的时间。线程监视器检查系统中的所有受管线程(例如,Web 容器线程和对象请求代理(ORB)线程)。非受管线程(由应用程序创建的线程)不受监视。有关更多信息,请参阅J2EE 应用程序中的挂起线程

关于本任务

缺省情况下,启用了线程挂起检测选项。要调整挂起检测策略值,或者要完全禁用挂起检测:

过程

  1. 从管理控制台,单击服务器 > 应用程序服务器 > server_name
  2. 在“服务器基础结构”下,单击管理 > 定制属性
  3. 单击新建
  4. 添加以下属性:
    名称:com.ibm.websphere.threadmonitor.interval
    值:询问所选应用程序服务器中的受管线程的频率(以秒计)。
    缺省值:180 秒(三分钟)。
    
    名称:com.ibm.websphere.threadmonitor.threshold
    值:线程被认为挂起前可以活动的时间长度(以秒计)。检测到活动时间比此时间长度长的任何线程将被报告为挂起。
    缺省值:缺省值是 600 秒(十分钟)。
    
    名称:com.ibm.websphere.threadmonitor.false.alarm.threshold
    值:自动增加阈值前,失败警报可以发生的次数(T)。可能是报告为挂起的线程最终完成了它的工作,从而导致失败警报。大量这些事件表明阈值太小。挂起检测工具可以自动响应这种情况:对于每个 T 失败警报,阈值 T 将乘以系数 1.5。将该值设置为零(或更小)以禁用自动调整。缺省值:100
    
    要禁用挂起检测选项,将 com.ibm.websphere.threadmonitor.interval 属性设置为小于等于零。
  5. 单击应用
  6. 单击确定
  7. 保存更改。 在重新启动服务器前确保已执行文件同步。
  8. 重新启动应用程序服务器以使更改生效。

猜你喜欢

转载自bkhh.iteye.com/blog/1874809