HP ProLiant: Verktøy for informasjon og konfigurasjon

Forfatter: Trond Hasle Amundsen
Kontakt: unix-drift@usit.uio.no
Dato: 2011-10-06

Notat

Dette dokumentet inneholder informasjon om verktøy som kan gjøres tilgjengelig på tjenermaskiner av typen HP ProLiant. Dette gjelder med andre ord ikke arbeidsstasjoner, bærbare maskiner eller lignende.

1   Installasjon av HP-verktøy

Verktøyene fra HP kommer i form av RPM-pakker. USIT har samlet disse RPM-pakkene i et eget repositories til bruk for UiO-maskiner. For å installere og konfigurere disse verktøyene på en HP-server som kjører RHEL5, kjør følgende:

maskin.uio.no# /local/sbin/usit-config-hpserver

Tilsvarende for en maskin som kjører RHEL6:

maskin.uio.no# uio-config-hpserver

Scriptet usit-config-hpserver / uio-config-hpserver vil legge inn det man trenger av RPM-pakker og programvare, og starte tjenestene. Under kjøring av usit-config-hpserver / uio-config-hpserver vil man etterhvert komme inn i et interaktivt program for konfigurasjon av hp-health, en av de essensielle programvarebitene. Under denne interaktive konfigurasjonen, svar standard-svaret (dvs. trykk ENTER) for alt bortsett fra spørsmålet om man skal bruke en eksisterende SNMP-konfigurasjonsfil. På dette spørsmålet skal man svare "yes".

Installasjonsscriptet vil starte tjenestene automatisk, og man kan begynne å bruke HP-verktøyene straks installasjonen er ferdig.

2   Automatic Server Recovery (ASR)

ASR er funksjonalitet som ligger i alle moderne servere fra HP. Hensikten er å oppdage en situasjon der operativsystemet henger, samt forsøke å fikse problemet med en reboot. Denne funksjonaliteten oppnås ved at en del av maskinvaren snakker med en del av HP-verktøyene (en av daemonene). Dersom daemonen ikke svarer på forespørsler fra maskinvaren, vil maskinvaren tolke dette som et OS-heng, og reboote maskinen etter en timeout som pr. default er 10 minutter.

Det har vist seg, ved spesielle omstendigheter, at ASR ikke fungerer etter hensikten. Problemer som har vært observert er at daemonen som snakker med maskinvaren har dødd pga. feil i daemonen. Dette tolker maskinvaren som et OS-heng og ASR trer inn. Dersom slikt skjer, og det ikke er mulig å oppgradere programvaren til en versjon som fungerer, er det best å skru av ASR:

hpasmcli -s 'disable asr'

Dersom ASR virker etter hensikten, noe som er tilfelle for de fleste servere, er ASR etter USITs vurdering en funksjonalitet i serveren som vi ønsker skal være skrudd på. Det er derfor ikke vanlig å skru av ASR med mindre man opplever problemer med det.

3   Vise hardware-loggen (IML)

HP har et enkelt verktøy som gir deg informasjon om maskinvarens tilstand, hplog. IML er "Integrated Management Log". Når det skjer noe med maskinvaren, logges det i IML. For å se IML med hplog, kjør hplog -v. Eksempel:

maskin.uio.no# hplog -v

ID   Severity       Initial Time      Update Time       Count
-------------------------------------------------------------
0000 Repaired       14:59  08/27/2007 07:30  08/28/2007 0004
LOG: Network Adapters Redundancy Reduced (Slot 0, Port 2)

0001 Caution        12:40  02/05/2008 12:40  02/05/2008 0001
LOG: Corrected Memory Error threshold exceeded (System Memory, Memory Module 3)

Her ser vi to innslag i IML. Den første er "repaired", og er som sådan ikke noe å bry seg om. Den andre forteller om en dårlig minnebrikke, og gir derfor grunn til bekymring.

4   Informasjon om strømforsyninger

En enkel presentasjon av maskinen strømforsyninger får man med hplog -p. Eksempel:

maskin.uio.no# hplog -p
ID     TYPE        LOCATION      STATUS  REDUNDANT
 1  Standard     Pwr. Supply Bay Normal     Yes
 2  Standard     Pwr. Supply Bay Normal     Yes

I eksemplet er alt normalt, dvs. begge PS-ene virker og har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show powersupply'

Power supply #1
        Present  : Yes
        Redundant: Yes
        Condition: Ok
        Hotplug  : Supported
        Power    : 35 Watts
Power supply #2
        Present  : Yes
        Redundant: Yes
        Condition: Ok
        Hotplug  : Supported
        Power    : 50 Watts

5   Informasjon om temperatur

Man kan liste opp temperaturen på maskinens sensorer med hplog -t. Eksempel:

maskin.uio.no# hplog -t
ID     TYPE        LOCATION      STATUS    CURRENT  THRESHOLD
 1  Basic Sensor Ambient         Normal    68F/ 20C 105F/ 41C
 2  Basic Sensor CPU (1)         Normal   104F/ 40C 179F/ 82C
 3  Basic Sensor CPU (2)         Normal   104F/ 40C 179F/ 82C
 4  Basic Sensor Memory Board    Normal    84F/ 29C 188F/ 87C
 5  Basic Sensor Memory Board    Normal    84F/ 29C 188F/ 87C
 6  Basic Sensor Memory Board    Normal    93F/ 34C 188F/ 87C
 7  Basic Sensor Memory Board    Normal    93F/ 34C 188F/ 87C
 8  Basic Sensor Pwr. Supply Bay Normal   113F/ 45C 194F/ 90C
 9  Basic Sensor Pwr. Supply Bay Normal   104F/ 40C 149F/ 65C
10  Basic Sensor I/O Zone        Normal   114F/ 46C 194F/ 90C
11  Basic Sensor I/O Zone        Normal    98F/ 37C 158F/ 70C
12  Basic Sensor I/O Zone        Normal   114F/ 46C 194F/ 90C
13  Basic Sensor I/O Zone        Normal    32F/  0C 158F/ 70C
14  Basic Sensor I/O Zone        Normal    32F/  0C 158F/ 70C
15  Basic Sensor I/O Zone        Normal    32F/  0C 158F/ 70C
16  Basic Sensor I/O Zone        Normal   ---F/---C 158F/ 70C
17  Basic Sensor I/O Zone        Normal   ---F/---C 158F/ 70C
18  Basic Sensor I/O Zone        Normal   ---F/---C 158F/ 70C
19  Basic Sensor Processor Zone  Normal    77F/ 25C 158F/ 70C
20  Basic Sensor Processor Zone  Normal    93F/ 34C 158F/ 70C
21  Basic Sensor Processor Zone  Normal    89F/ 32C 176F/ 80C
22  Basic Sensor Processor Zone  Normal    89F/ 32C 176F/ 80C
23  Basic Sensor I/O Zone        Normal   111F/ 44C 170F/ 77C
24  Basic Sensor Memory Board    Normal    96F/ 36C 158F/ 70C
25  Basic Sensor Memory Board    Normal    96F/ 36C 158F/ 70C
26  Basic Sensor Memory Board    Normal    96F/ 36C 158F/ 70C
27  Basic Sensor I/O Zone        Normal    32F/  0C 158F/ 70C
28  Basic Sensor I/O Zone        Normal   ---F/---C 158F/ 70C
29  Basic Sensor System Board    Normal   113F/ 45C 140F/ 60C
30  Basic Sensor I/O Zone        Normal   159F/ 71C 230F/110C

I eksemplet er alt normalt, dvs. alle sensorene har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show temp'

Sensor   Location              Temp       Threshold
------   --------              ----       ---------
#1        AMBIENT              20C/68F    41C/105F
#2        CPU#1                40C/104F   82C/179F
#3        CPU#2                40C/104F   82C/179F
#4        MEMORY_BD            29C/84F    87C/188F
#5        MEMORY_BD            29C/84F    87C/188F
#6        MEMORY_BD            34C/93F    87C/188F
#7        MEMORY_BD            34C/93F    87C/188F
#8        POWER_SUPPLY_BAY     45C/113F   90C/194F
#9        POWER_SUPPLY_BAY     40C/104F   65C/149F
#10       I/O_ZONE             46C/114F   90C/194F
#11       I/O_ZONE             37C/98F    70C/158F
#12       I/O_ZONE             46C/114F   90C/194F
#13       I/O_ZONE             0C/32F     70C/158F
#14       I/O_ZONE             0C/32F     70C/158F
#15       I/O_ZONE             0C/32F     70C/158F
#16       I/O_ZONE              -         70C/158F
#17       I/O_ZONE              -         70C/158F
#18       I/O_ZONE              -         70C/158F
#19       PROCESSOR_ZONE       25C/77F    70C/158F
#20       PROCESSOR_ZONE       34C/93F    70C/158F
#21       PROCESSOR_ZONE       32C/89F    80C/176F
#22       PROCESSOR_ZONE       32C/89F    80C/176F
#23       I/O_ZONE             44C/111F   77C/170F
#24       MEMORY_BD            36C/96F    70C/158F
#25       MEMORY_BD            36C/96F    70C/158F
#26       MEMORY_BD            36C/96F    70C/158F
#27       I/O_ZONE             0C/32F     70C/158F
#28       I/O_ZONE              -         70C/158F
#29       SYSTEM_BD            45C/113F   60C/140F
#30       I/O_ZONE             71C/159F   110C/230F

6   Informasjon om vifter

Man kan liste opp status på maskinens vifter med hplog -f. Eksempel:

maskin.uio.no# hplog -f
ID     TYPE        LOCATION      STATUS  REDUNDANT FAN SPEED
 1  Var. Speed   System Board    Normal     Yes     Low    ( 15)
 2  Var. Speed   System Board    Normal     Yes     Low    ( 15)
 3  Var. Speed   System Board    Normal     Yes     Low    ( 15)
 4  Var. Speed   System Board    Normal     Yes     Low    ( 15)
 5  Var. Speed   System Board    Normal     Yes     Low    ( 15)
 6  Var. Speed   System Board    Normal     Yes     Low    ( 15)

I eksemplet er alt normalt, dvs. alle viftene har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show fan'

Fan  Location        Present Speed  of max  Redundant  Partner  Hot-pluggable
---  --------        ------- -----  ------  ---------  -------  -------------
#1   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes
#2   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes
#3   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes
#4   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes
#5   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes
#6   SYSTEM          Yes     NORMAL  15%     Yes        0        Yes

7   Vise andre ting

Verktøyet hpasmcli kan vise mer informasjon enn hplog, og en fullstendig liste over hva som kan vises fram får du slik:

maskin.uio.no /# hpasmcli -s show

Invalid Arguments
         SHOW ASR
         SHOW BOOT
         SHOW DIMM [ SPD ]
         SHOW F1
         SHOW FANS
         SHOW HT
         SHOW IML
         SHOW IPL
         SHOW NAME
         SHOW PORTMAP
         SHOW POWERSUPPLY
         SHOW PXE
         SHOW SERIAL [ BIOS | EMBEDDED | VIRTUAL ]
         SHOW SERVER
         SHOW TEMP
         SHOW TPM
         SHOW UID
         SHOW WOL

Vi kan f.eks. vise informasjon om maskinen:

maskin.uio.no /# hpasmcli -s 'show server'

System        : ProLiant DL380 G6
Serial No.    : GB8921S4JB
ROM version   : P62 03/30/2010
iLo present   : Yes
Embedded NICs : 4
        NIC1 MAC: 00:23:7d:dc:fc:46
        NIC2 MAC: 00:23:7d:dc:fc:48
        NIC3 MAC: 00:23:7d:dc:fc:4a
        NIC4 MAC: 00:23:7d:dc:fc:4c

Processor: 0
        Name         : Intel Xeon
        Stepping     : 5
        Speed        : 2267 MHz
        Bus          : 133 MHz
        Core         : 4
        Thread       : 8
        Socket       : 1
        Level2 Cache : 1024 KBytes
        Status       : Ok

Processor: 1
        Name         : Intel Xeon
        Stepping     : 5
        Speed        : 2267 MHz
        Bus          : 133 MHz
        Core         : 4
        Thread       : 8
        Socket       : 2
        Level3 Cache : 8192 KBytes
        Status       : Ok

Processor total  : 2

Memory installed : 24576 MBytes
ECC supported    : Yes

8   Slette IML-loggen

Dersom IML-loggen ikke inneholder noe man er interessert i, eller vil ta vare på, kan man slette innholdet ved hjelp av hpasmcli:

maskin.uio.no# hpasmcli -s 'clear iml'
IML Log successfully cleared.

Det er også mulig å bruke hpimlview til å manipulere IML-loggen, men vanligvis bruker man bare hpasmcli.

9   Konfigurere maskinvare med hpasmcli

For å se hva som kan konfigureres med SET, kjør hpasmcli -s set:

maskin.uio.no# hpasmcli -s set

Invalid Arguments
         SET ASR <timeout>
         SET BOOT [ FIRST | ONCE ]
         SET F1 [ ENABLED | DELAYED | DISABLED ]
         SET NAME <string>
         SET SERIAL [ BIOS | EMBEDDED | VIRTUAL ]
         SET UID [ ON | OFF ]

Det er ikke ofte man bruker SET-kommandoen i hpasmcli. Det vanligste er likevel å bruke SET til å konfigurere ASR eller SERIAL. Man kan skru på/av UID (blått lys foran for å identifisere maskinen) med hpasmcli, men det er som regel mer praktisk å bruke hpuid til slikt.

En annen metode for å konfigurere er å bruke enable eller disable med hpasmcli:

maskin.uio.no# hpasmcli -s disable

Invalid Arguments
         DISABLE ASR
         DISABLE HT
         DISABLE PXE [ NIC1 | NIC2 | NIC3 | NIC4 | NIC5 ]
         DISABLE WOL

Det vanligste man bruker dette til er å skru av eller på ASR:

maskin.uio.no# hpasmcli -s 'disable asr'
Successfully disabled ASR timer.

De andre tingene; HT (hyperthreading), PXE (pre-execution environment) eller WOL (wake-on-lan), er enten uinteressante for oss på UiO, eller default-verdien er hva vi ønsker.

10   Manipulere IML (Integrated Management Log)

hpimlview er et interaktivt verktøy som brukes til å se på eller manipulere IML-loggen. Med dette verktøyet kan man fjerne entries fra IML, man kan endre status på eksisterende log-entries, eller man kan legge inn sine egne.

Erfaringsmessig brukes dette lite av oss på USIT. Det er blitt brukt unntaksvis dersom man ønsker å bevare enkelte log-entries i IML, men endre status til "Repaired".

11   Fysisk identifikasjon av maskinen med UID-lys

Alle HP-servere har et UID-lys i front. Skrur man dette på, vil det lyse skarpt blått. Hensikten med dette er å kunne identifisere maskinen. Siden vi normalt merker maskinene med navnelapper er dette overflødig funksjonalitet for oss, men det kan fra tid til annen være nyttig. For å skru på UID-lys:

maskin.uio.no# hpuid -e

For å se status på UID-lyset:

maskin.uio.no# hpuid -s
ON

For å skru av UID-lyset:

maskin.uio.no# hpuid -d

12   Manipulere intern-RAID

De aller fleste av HP-serverne våre har en eller annen RAID-kontroller til de interne diskene. For å vise informasjon om, eller manipulere eller konfigurere disse, bruker vi verktøyet hpacucli. Man kan konfigurere RAID når maskinen booter, men dersom man ønsker å sette inn nye disker og lage et nytt RAID-sett av disse, kan man altså gjøre dette i fart.

12.1   Vise informasjon om RAID-kontrollere

hpacucli kan vise alt man vanligvis renger å vite om selve RAID-kontrolleren, de logiske diskene eller de fysiske diskene. For å vise informasjon, brukes opsjonen show. Denne kan igjen kobles med opsjonene status for status-informasjon, eller med detail for detaljert informasjon. Her er et eksempel, hvor vi viser informasjon om kontrolleren (egentlig alle kontrollerne, men vi har vanligvis bare en):

Med en enkel show:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0          (sn: 50123456789ABCDE)

Med show status:

maskin.uio.no# hpacucli ctrl all show status

Smart Array P410i in Slot 0
   Controller Status: OK

Med show detail:

maskin.uio.no# hpacucli ctrl all show detail

Smart Array P410i in Slot 0
   Bus Interface: PCI
   Slot: 0
   Serial Number: 50123456789ABCDE
   RAID 6 (ADG) Status: Disabled
   Controller Status: OK
   Chassis Slot:
   Hardware Revision: Rev C
   Firmware Version: 3.00
   Rebuild Priority: Medium
   Expand Priority: Medium
   Surface Scan Delay: 15 secs
   Post Prompt Timeout: 0 secs
   Cache Board Present: False
   Drive Write Cache: Disabled
   SATA NCQ Supported: True

12.2   Vise informasjon om logiske disker

Det første man må vite er hvilken slot kontrolleren henger på:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0
   Controller Status: OK

Her er det slot 0. Da kan vi konstruere kommandoen for å vise de logiske diskene:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show

Smart Array P410i in Slot 0

   array A

      logicaldrive 1 (68.3 GB, RAID 1, OK)

Hvis vi hekter på status:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show status

   logicaldrive 1 (68.3 GB, RAID 1): OK

Hvis vi hekter på detail:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show detail

Smart Array P410i in Slot 0

   array A

      Logical Drive: 1
         Size: 68.3 GB
         Fault Tolerance: RAID 1
         Heads: 255
         Sectors Per Track: 63
         Cylinders: 8920
         Stripe Size: 128 KB
         Status: OK
         Array Accelerator: Disabled
         Unique Identifier: 600508B1001037383941424344450000
         Disk Name: /dev/cciss/c0d0
         Mount Points: /boot 258 MB
         Logical Drive Label: A8038E0350123456789ABCDE733E
         Mirror Group 0:
            physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
         Mirror Group 1:
            physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

12.3   Vise informasjon om fysiske disker

Det første man må vite er hvilken slot kontrolleren henger på:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0
   Controller Status: OK

Her er det slot 0. Da kan vi konstruere kommandoen for å vise de logiske diskene:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show

Smart Array P410i in Slot 0

   array A

      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
      physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

Hvis vi hekter på status:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show status

   physicaldrive 1I:1:1 (port 1I:box 1:bay 1, 72 GB): OK
   physicaldrive 1I:1:2 (port 1I:box 1:bay 2, 72 GB): OK

Hvis vi hekter på detail:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show detail

Smart Array P410i in Slot 0

   array A

      physicaldrive 1I:1:1
         Port: 1I
         Box: 1
         Bay: 1
         Status: OK
         Drive Type: Data Drive
         Interface Type: SAS
         Size: 72 GB
         Rotational Speed: 15000
         Firmware Revision: HPD3
         Serial Number: BV05P940ER9L0917
         Model: HP      DH072BAAKN
         PHY Count: 2
         PHY Transfer Rate: 3.0GBPS, Unknown
      physicaldrive 1I:1:2
         Port: 1I
         Box: 1
         Bay: 2
         Status: OK
         Drive Type: Data Drive
         Interface Type: SAS
         Size: 72 GB
         Rotational Speed: 15000
         Firmware Revision: HPD3
         Serial Number: BV05P940ER5N0917
         Model: HP      DH072BAAKN
         PHY Count: 2
         PHY Transfer Rate: 3.0GBPS, Unknown

12.4   Lage nytt RAID-sett

Gitt følgende scenario: En maskin har to tomme diskbays. Man kjøper inn to nye disker fra HP og dytter dem inn i maskinen. Man ønsker da å lage et nytt RAID-sett (vanligvis RAID1) av disse diskene uten å måtte ha nedetid (reboot). Løsningen er å bruke hpacucli til å lage et nytt RAID-sett av tomme disker:

Først må man liste opp diskene:

maskin.uio.no# hpacucli ctrl slot=3 physicaldrive all show

Smart Array P400 in Slot 3

   array A

      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
      physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

   unassigned

      physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 146 GB, OK)
      physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 146 GB, OK)

Deretter kan man lage et nytt RAID-sett:

maskin.uio.no# hpacucli slot=3 create type=ld drives=1I:1:3,1I:1:4 raid=1
[...]

Når nytt RAID-sett er lages kan man aksessere dette på normal måte, f.eks. ved fdisk -l for å vise informasjon om de logiske diskene slik OS-et ser dem.

12.5   Vise hjelpetekst

hpacucli er et omfattende program med en syntaks som kan virke komplisert og forvirrende. Heldigvis kan programmet gi endel nyttig hjelpetekst. For eksempel vil hpacucli help gi generell hjelp, mens man kan spesifisere nøyaktig hva man vil ha hjelp til. Eksempel:

maskin.uio.no# hpacucli help show

The show command outputs information about a device or a list of devices.

<target> show [config] [detail]
   The show command outputs information about the specified device. To force a
   more detailed and verbose output, specify the "detail" parameter. To see the
   configuration, which includes the targeted device along with all of the
   devices that it aggregates, specify the "config" parameter. The target can
   be any valid device except when using the "config" parameter. In this case
   the specified target must be a controller.

<target> show [status]
   Displays the status information for the specified device(s). The target can
   be any valid device.

<target> show [ssp]
   Displays the ssp information for the specified controller. The target can be
   any valid controller that supports ssp.

Examples:
   ctrl ch="lab 3" show config detail
   ctrl all show status
   ctrl ch="lab 3" show ssp
Publisert 5. okt. 2011 21:48 - Sist endret 6. okt. 2011 15:02