본문 바로가기

IBM/HACMP

HACMP_PD교육

HACMP v5.4.1limits

  • Cluster limits
     - 32 nodes in a cluster
     - 64 resource groups per cluster
     - 256 IP addresses known to HACMP
     - 128 application monitors
     - Two sites
  • RSCT limit
     - 48 heartbeat rings for both IP adn non-IP networks combined

 

 

clcomdES(커뮤니케이션 데몬, 커뮤니케이션 함) V5에서는 rsh이 필요 없다?

Topology - networing-centric

Resources -

Resources Group

Resources Group polocies

Customization : Process of augmenting HACMP

 

node 이름에 제일 맨 앞에 숫자를 주면 않됨!!!

 

HACMP path 설정 하기(.profile)

/usr/es/sbin/cluster

/usr/es/sbin/cluster/utilities

/usr/es/sbin/cluster/etc

/usr/es/sbin/cluster/diag

 

명령어들

디스크 Heartbeat test

#/usr/sbin/rsct/bin/dhb_read -p hdisk4 -r : 첫번째 노드에서 실행

#/usr/sbin/rsct/bin/dhb_read -p hdisk4 -t : 두번째 노드에서 실행

#lssrc -ls topsvcs

 NIM's PID: 524472
diskhb_0       [ 2] 2     2     S    255.255.10.0    255.255.10.1  
diskhb_0       [ 2] rhdisk5          0x84dd646a      0x84dd649e
HB Interval = 2.000 secs. Sensitivity = 4 missed beats
Missed HBs: Total: 0 Current group: 0
Packets sent    : 37 ICMP 0 Errors: 0 No mbuf: 0
Packets received: 43 ICMP 0 Dropped: 0

 

 HA가 구동 되었는지 확인(5.3이상 부터)
# lssrc -ls clstrmgrES | grep state

Cluster states :

ST_INIT : cluster configured and down

ST_JOINING : node joining the cluster

ST_VOTING : Inter-node decision state for an event

ST_RP_RUNNING : cluster running Recovery program

ST_BARRIER : clstrmgr waiting at the barrier statement

ST_CBARRIER : clstrmgr is exiting recovery program

ST_UNSTABLE : cluster unstable

NOT_CONFIGURED : HA installed but not configured

RP_FAILED : event script failed

ST_STABLE : Cluster Services are running with managed resources(stable cluster) or Cluster Services have been "forced" down with resource groups potentially in the UNMANAGED state(HACMP 5.4 and later)

 

리소스 그룹 정보 확인

#clRGinfo

 -----------------------------------------------------------------------------
Group Name     State                        Node          
-----------------------------------------------------------------------------
webApp_group   ONLINE                       node3         
                        OFFLINE                      node4

 

메이져 넘버가 남았는 정보 확인

#lvlstmajor (the numbers listed are available)

 

HACMP Sync 명령

#cldare -rtV normal(DARE : Dynamic Automatic Reconfigureation Event)

DARE requires three copies of the ODM
 - DCD /etc/objrepos
 - SCD /usr/es/sbin/cluster/etc/objrepos/staging
 - ACD /usr/es/sbin/cluster/etc/objrepos/active

 

System monitoring via RMC(IBM 관리하는 여러가지 리소스들을 모니터링 하기 위해 만들어 논것)

#lsrsrc -A p(persistent) d(dynamic) b(both)

 p : Persistent(static) attributes describe enduring

 d : Dynamic attributes represent changing characteristics

 b : To list both Persistent and Dynamic attributes

 

HA가 스크립트 실행도 중 에러가 발생하여 더 이상 진행되지 않고 멈춰있을 때 문제를 해결하고 반대편 노드로 리소스를 넘길 때 사용

 #clruncmd node_name

 

SnapShot

#clsnapshot -c -i -n' snapshot_name' -d 'descripsion'

경로 변경하고 싶을 때 SNAPSHOT=some_other_directory

 

/usr/es/sbin/cluster/netmon.cf : 한 노드에 네트워크 카드가 하나 일 때 구성, 네트워크 장애시 네트워크 카드가 어떤 것이 문제 인지 판별하기 위해 (게이트웨이 IP 하나만 넣어주면 됨)

 

/usr/es/sbin/cluster/events : HA 기본적으로 사용하는 스크립트들의 모음

 

HACMP의 로그 파일들

hacmp log는 /etc/syslog.conf가 만들어 준다

clcycle 명령으로 만들어 지는 매일 백업 파일은 /usr/es/sbin/cluster/history/cluster.mmddyyyy로 만들어 진다

/usr/es/adm/cluster.log v5.3 : cluster로그

/var/hacmp/adm/cluster.log v5.4 : cluster로그

/usr/es/adm/cluster.log : records start and stop information for every cluster event generated in a running cluster

/var/hacmp/clverify/clverify.log : Contains the verbose messages outpup by the cluster verification utility

/tmp/cspoc.log : Contains time-stamped, formatted messages generated by HACMP C-SPOC commands. The file resides on the node where the C-SPOC command was invoked

/var/hacmp/log/clutils.log
 - Automatic cluster configuration verification
 - File collection utility
 - Two-node cluster configuration assistant
 - Cluster Test Tool(CTT)
 - OLPW conversion tool 
/var/adm/clavan.log : Contains the uptime state of applications managed by HACMP

 

PV 만드는 스크립트

for i in A B C D(where A B C D are the appropriate hdisk numbers for your system)

do

chdev -a pv=yes -l hdisk$i

done

 

for i in A B C D

do

rmdev -dl hdisk$i

done

 

concurrent 모드로 만들면 failover 시 빨리 넘어 간다

enhanced concurrent 볼륨 그룹 생성시 디스크에 rsct가 들어 가는 작은 영역이 만들어 진다

 

lv이 생성시 로그를 따로 만들면 퍼포먼스가 좋아진다.

 

로그 만드는 명령

#logform /dev/web_log_lv

 

가짜 디스크 생성

#mkdev -c disk -t 1000mb -s scsi -p scsi0 -w 9,0 -d

 

 Fast failure detection on NIC failure and node halt

 

Heartbeating over IP Aliases

  • 같은 대역의 IP만을 사용 할 수 밖에 없는 경우에 이걸 사용 할 수 있다

 

IZ26020를 적용하면 IPAT를 사용 할 때 부트 IP와 같은 대역의 서비스 IP를 사용 할 수 있다

http://www-01.ibm.com/support/docview.wss?uid=isg1IZ26020

 

 멀티노드 디스크 핫빗

 

Tuning the Failure Detection Rate(FDR) for NIM(Network Interface Module)

  Failure Detection Rate 를 slow로 변경하면 네트워크가 불안정한 환경에서는 적합

Extended Topology -> Configure HACMP Network Modules -> Change a Network Module using Predefined Values -> ether

  Network Module Name                                 ether
  Description                                         Ethernet Protocol
  Failure Detection Rate                              Normal  -> slow로 변경

 

heartbeat 체크 주기 확인

Extended Topology -> Configure HACMP Network Modules -> Change a Network Module using Custom Values -> ether

  Failure Cycle                                      [10]       -> 10번
  Interval between Heartbeats (seconds)              [1.00] -> 1초 주기로

#lssrc -ls topsvcs | more

 

Enabling Fast Failure Detection(FFD) on node halt(HACMP 5.4 이사, diskhb network 필요

 Extended Topology -> Configure HACMP Network Modules -> Change a Network Module using Custom Values -> diskhb

Network Module Name                                 diskhb
  Description                                        [Disk Heartbeating Pro>
  Address Type                                        Device                 +
  Path                                               [/usr/sbin/rsct/bin/ha>  /
  Parameters                                         [FFD_ON] -> 시스템이 패닉 상태 일때 핫빗 체크 주기 상관 없이 테이크 오버
  Grace Period                                       [30]                     #
  Supports gratuitous arp                            [false]                 +

 

Configuring parent/child resourece group dependencies(v5.2 부터) : AppServer 설정에서 parent로 설정된 AppServer가 먼저 실행 되지 않으면 Child로 설정된 AppServer는 실행 되지 않음

 Extended Resource Configuration -> Configure Resource Group Run-Time Policies -> Configure Dependencies between Resource Groups -> Configure Parent/Child Dependency

 

 

HACMP event 설명

for f in `ls /usr/es/sbin/cluster/events | grep -v "[a-z}*.rp"`

do

cat /usr/es/sbin/cluster/events/$f | grep -p -i "desc"

done >> ./events.txt

 

rsct command

 #lsrsrc

 #lsrsrc -A b IBM.FileSystem

 #lsrsrc -A b IBM.Host

 #lssrc -g rsct_rm

 #lssrc -s IBM.FSRM

 

Cross-site LVM Mirroring

 

hacmp는 /var 파일 시스템이 풀 나면 가동 되지 않는다

 

forced down : 서비스는 그대로 두고 HACMP만 내리는 것

 

업그레이드 하기 위해

 cluster가 stable이고 synchronize cleanly

 snapshot은 다른 디렉토리에 저장 (SNAPSHOTPATH=some_other_directory)

 customization files은 다른 디렉토리에 저장

업그레이드 중에 하지 말아야 할 것

 /usr/sbin/cluster, /usr/es/sbin/cluster, /usr/lpp/cluster은 건들지 말것

 Do not synchronize the cluster

 Do not stop a node and place resource groups in an UNMANAGED state

 Do not attempt a DARE or a C-SPOC command

 

 #varyonvg -b(breake reservation) -u vg_name : 볼륨그룹 리저베이션이 깨지기 때문에 양쪽에서 베리온이 가능

 

로우 디바이스가 -TO(오대문자) 옵션을 썻는지 확인

#lslv raw_system

Devicesubtype = DS_LVZ

 

big volume에서 -T 옵션을 주고 로우 디바이스를 만들고 싶을 때
먼저 mklv -y lv_name -TO(오대문자) 으로 먼저 만들고 C-SPOC 으로 아무 LV나 만들면  기존 볼륨 작업들이 모두 반영 되어 들어 간다

 

network configuration rules

 IPAT via Aliasing subnetIPAT via Replacement subnet
 boot interfaces diffrerentdifferent
 service different from boot subnetsSame as One boot subnet
 persistent different from boot subnetsdifferent to boot subnets or same as service
 Heartbeating over IP Aliasing Private SubnetPrivate Subnet
 HWAT(지금은 사용하지 않음) not supportedyes
 Netmask same for allsame for all
 Etherchannel yesnot supported
 Vitual Adapter support yesnot supported

 

AIX와 HACMP 업그레이드 버전 호환성

 AIX 5.2AIX 5.3AIX 6.1End of SUPPORT
 HACMP 5.3 YESYESYES30 Sep 2009
 HACMP 5.4 / 5.4.1 YESYESYES N/A

 


'IBM > HACMP' 카테고리의 다른 글

바뀐LUN사이즈를VG에적용할때  (0) 2012.11.09
PowerHA7.1교육  (0) 2012.11.09
PowerHA6.1 구성 절차  (0) 2012.11.09
How to synchronize timestamp  (0) 2012.11.09
zero-off-set  (0) 2012.03.24
Understanding_active_and_passive_varyon_in_enhanced_concurrent_mode  (0) 2011.08.24
Fast_disk_takeover  (0) 2011.08.24
Enhanced_concurrent_mode  (0) 2011.08.24
clstat 실행 시 error 날 때 해결책  (0) 2011.07.21
PowerHA 7.1 vs Veritas Cluster erver (VCS)  (0) 2011.07.20