HP ProLiant: Verktøy for informasjon og konfigurasjon

Forfatter: Trond Hasle Amundsen
Kontakt: unix-drift@usit.uio.no
Dato: 2011-10-06

Notat

Dette dokumentet inneholder informasjon om verktøy som kan gjøres tilgjengelig på tjenermaskiner av typen HP ProLiant. Dette gjelder med andre ord ikke arbeidsstasjoner, bærbare maskiner eller lignende.

1   Installasjon av HP-verktøy

Verktøyene fra HP kommer i form av RPM-pakker. USIT har samlet disse RPM-pakkene i et eget repositories til bruk for UiO-maskiner. For å installere og konfigurere disse verktøyene på en HP-server som kjører RHEL5, kjør følgende:

maskin.uio.no# /local/sbin/usit-config-hpserver

Tilsvarende for en maskin som kjører RHEL6:

maskin.uio.no# uio-config-hpserver

Scriptet usit-config-hpserver / uio-config-hpserver vil legge inn det man trenger av RPM-pakker og programvare, og starte tjenestene. Under kjøring av usit-config-hpserver / uio-config-hpserver vil man etterhvert komme inn i et interaktivt program for konfigurasjon av hp-health, en av de essensielle programvarebitene. Under denne interaktive konfigurasjonen, svar standard-svaret (dvs. trykk ENTER) for alt bortsett fra spørsmålet om man skal bruke en eksisterende SNMP-konfigurasjonsfil. På dette spørsmålet skal man svare "yes".

Installasjonsscriptet vil starte tjenestene automatisk, og man kan begynne å bruke HP-verktøyene straks installasjonen er ferdig.

2   Automatic Server Recovery (ASR)

ASR er funksjonalitet som ligger i alle moderne servere fra HP. Hensikten er å oppdage en situasjon der operativsystemet henger, samt forsøke å fikse problemet med en reboot. Denne funksjonaliteten oppnås ved at en del av maskinvaren snakker med en del av HP-verktøyene (en av daemonene). Dersom daemonen ikke svarer på forespørsler fra maskinvaren, vil maskinvaren tolke dette som et OS-heng, og reboote maskinen etter en timeout som pr. default er 10 minutter.

Det har vist seg, ved spesielle omstendigheter, at ASR ikke fungerer etter hensikten. Problemer som har vært observert er at daemonen som snakker med maskinvaren har dødd pga. feil i daemonen. Dette tolker maskinvaren som et OS-heng og ASR trer inn. Dersom slikt skjer, og det ikke er mulig å oppgradere programvaren til en versjon som fungerer, er det best å skru av ASR:

hpasmcli -s 'disable asr'

Dersom ASR virker etter hensikten, noe som er tilfelle for de fleste servere, er ASR etter USITs vurdering en funksjonalitet i serveren som vi ønsker skal være skrudd på. Det er derfor ikke vanlig å skru av ASR med mindre man opplever problemer med det.

3   Vise hardware-loggen (IML)

HP har et enkelt verktøy som gir deg informasjon om maskinvarens tilstand, hplog. IML er "Integrated Management Log". Når det skjer noe med maskinvaren, logges det i IML. For å se IML med hplog, kjør hplog -v. Eksempel:

maskin.uio.no# hplog -v

ID  Severity    Initial Time   Update Time    Count
-------------------------------------------------------------
0000 Repaired    14:59 08/27/2007 07:30 08/28/2007 0004
LOG: Network Adapters Redundancy Reduced (Slot 0, Port 2)

0001 Caution    12:40 02/05/2008 12:40 02/05/2008 0001
LOG: Corrected Memory Error threshold exceeded (System Memory, Memory Module 3)

Her ser vi to innslag i IML. Den første er "repaired", og er som sådan ikke noe å bry seg om. Den andre forteller om en dårlig minnebrikke, og gir derfor grunn til bekymring.

4   Informasjon om strømforsyninger

En enkel presentasjon av maskinen strømforsyninger får man med hplog -p. Eksempel:

maskin.uio.no# hplog -p
ID   TYPE    LOCATION   STATUS REDUNDANT
 1 Standard   Pwr. Supply Bay Normal   Yes
 2 Standard   Pwr. Supply Bay Normal   Yes

I eksemplet er alt normalt, dvs. begge PS-ene virker og har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show powersupply'

Power supply #1
    Present : Yes
    Redundant: Yes
    Condition: Ok
    Hotplug : Supported
    Power  : 35 Watts
Power supply #2
    Present : Yes
    Redundant: Yes
    Condition: Ok
    Hotplug : Supported
    Power  : 50 Watts

5   Informasjon om temperatur

Man kan liste opp temperaturen på maskinens sensorer med hplog -t. Eksempel:

maskin.uio.no# hplog -t
ID   TYPE    LOCATION   STATUS  CURRENT THRESHOLD
 1 Basic Sensor Ambient     Normal  68F/ 20C 105F/ 41C
 2 Basic Sensor CPU (1)     Normal  104F/ 40C 179F/ 82C
 3 Basic Sensor CPU (2)     Normal  104F/ 40C 179F/ 82C
 4 Basic Sensor Memory Board  Normal  84F/ 29C 188F/ 87C
 5 Basic Sensor Memory Board  Normal  84F/ 29C 188F/ 87C
 6 Basic Sensor Memory Board  Normal  93F/ 34C 188F/ 87C
 7 Basic Sensor Memory Board  Normal  93F/ 34C 188F/ 87C
 8 Basic Sensor Pwr. Supply Bay Normal  113F/ 45C 194F/ 90C
 9 Basic Sensor Pwr. Supply Bay Normal  104F/ 40C 149F/ 65C
10 Basic Sensor I/O Zone    Normal  114F/ 46C 194F/ 90C
11 Basic Sensor I/O Zone    Normal  98F/ 37C 158F/ 70C
12 Basic Sensor I/O Zone    Normal  114F/ 46C 194F/ 90C
13 Basic Sensor I/O Zone    Normal  32F/ 0C 158F/ 70C
14 Basic Sensor I/O Zone    Normal  32F/ 0C 158F/ 70C
15 Basic Sensor I/O Zone    Normal  32F/ 0C 158F/ 70C
16 Basic Sensor I/O Zone    Normal  ---F/---C 158F/ 70C
17 Basic Sensor I/O Zone    Normal  ---F/---C 158F/ 70C
18 Basic Sensor I/O Zone    Normal  ---F/---C 158F/ 70C
19 Basic Sensor Processor Zone Normal  77F/ 25C 158F/ 70C
20 Basic Sensor Processor Zone Normal  93F/ 34C 158F/ 70C
21 Basic Sensor Processor Zone Normal  89F/ 32C 176F/ 80C
22 Basic Sensor Processor Zone Normal  89F/ 32C 176F/ 80C
23 Basic Sensor I/O Zone    Normal  111F/ 44C 170F/ 77C
24 Basic Sensor Memory Board  Normal  96F/ 36C 158F/ 70C
25 Basic Sensor Memory Board  Normal  96F/ 36C 158F/ 70C
26 Basic Sensor Memory Board  Normal  96F/ 36C 158F/ 70C
27 Basic Sensor I/O Zone    Normal  32F/ 0C 158F/ 70C
28 Basic Sensor I/O Zone    Normal  ---F/---C 158F/ 70C
29 Basic Sensor System Board  Normal  113F/ 45C 140F/ 60C
30 Basic Sensor I/O Zone    Normal  159F/ 71C 230F/110C

I eksemplet er alt normalt, dvs. alle sensorene har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show temp'

Sensor  Location       Temp    Threshold
------  --------       ----    ---------
#1    AMBIENT       20C/68F  41C/105F
#2    CPU#1        40C/104F  82C/179F
#3    CPU#2        40C/104F  82C/179F
#4    MEMORY_BD      29C/84F  87C/188F
#5    MEMORY_BD      29C/84F  87C/188F
#6    MEMORY_BD      34C/93F  87C/188F
#7    MEMORY_BD      34C/93F  87C/188F
#8    POWER_SUPPLY_BAY   45C/113F  90C/194F
#9    POWER_SUPPLY_BAY   40C/104F  65C/149F
#10    I/O_ZONE       46C/114F  90C/194F
#11    I/O_ZONE       37C/98F  70C/158F
#12    I/O_ZONE       46C/114F  90C/194F
#13    I/O_ZONE       0C/32F   70C/158F
#14    I/O_ZONE       0C/32F   70C/158F
#15    I/O_ZONE       0C/32F   70C/158F
#16    I/O_ZONE       -     70C/158F
#17    I/O_ZONE       -     70C/158F
#18    I/O_ZONE       -     70C/158F
#19    PROCESSOR_ZONE    25C/77F  70C/158F
#20    PROCESSOR_ZONE    34C/93F  70C/158F
#21    PROCESSOR_ZONE    32C/89F  80C/176F
#22    PROCESSOR_ZONE    32C/89F  80C/176F
#23    I/O_ZONE       44C/111F  77C/170F
#24    MEMORY_BD      36C/96F  70C/158F
#25    MEMORY_BD      36C/96F  70C/158F
#26    MEMORY_BD      36C/96F  70C/158F
#27    I/O_ZONE       0C/32F   70C/158F
#28    I/O_ZONE       -     70C/158F
#29    SYSTEM_BD      45C/113F  60C/140F
#30    I/O_ZONE       71C/159F  110C/230F

6   Informasjon om vifter

Man kan liste opp status på maskinens vifter med hplog -f. Eksempel:

maskin.uio.no# hplog -f
ID   TYPE    LOCATION   STATUS REDUNDANT FAN SPEED
 1 Var. Speed  System Board  Normal   Yes   Low  ( 15)
 2 Var. Speed  System Board  Normal   Yes   Low  ( 15)
 3 Var. Speed  System Board  Normal   Yes   Low  ( 15)
 4 Var. Speed  System Board  Normal   Yes   Low  ( 15)
 5 Var. Speed  System Board  Normal   Yes   Low  ( 15)
 6 Var. Speed  System Board  Normal   Yes   Low  ( 15)

I eksemplet er alt normalt, dvs. alle viftene har status "Normal". Man kan også bruke hpasmcli:

maskin.uio.no /# hpasmcli -s 'show fan'

Fan Location    Present Speed of max Redundant Partner Hot-pluggable
--- --------    ------- ----- ------ --------- ------- -------------
#1  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes
#2  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes
#3  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes
#4  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes
#5  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes
#6  SYSTEM     Yes   NORMAL 15%   Yes    0    Yes

7   Vise andre ting

Verktøyet hpasmcli kan vise mer informasjon enn hplog, og en fullstendig liste over hva som kan vises fram får du slik:

maskin.uio.no /# hpasmcli -s show

Invalid Arguments
     SHOW ASR
     SHOW BOOT
     SHOW DIMM [ SPD ]
     SHOW F1
     SHOW FANS
     SHOW HT
     SHOW IML
     SHOW IPL
     SHOW NAME
     SHOW PORTMAP
     SHOW POWERSUPPLY
     SHOW PXE
     SHOW SERIAL [ BIOS | EMBEDDED | VIRTUAL ]
     SHOW SERVER
     SHOW TEMP
     SHOW TPM
     SHOW UID
     SHOW WOL

Vi kan f.eks. vise informasjon om maskinen:

maskin.uio.no /# hpasmcli -s 'show server'

System    : ProLiant DL380 G6
Serial No.  : GB8921S4JB
ROM version  : P62 03/30/2010
iLo present  : Yes
Embedded NICs : 4
    NIC1 MAC: 00:23:7d:dc:fc:46
    NIC2 MAC: 00:23:7d:dc:fc:48
    NIC3 MAC: 00:23:7d:dc:fc:4a
    NIC4 MAC: 00:23:7d:dc:fc:4c

Processor: 0
    Name     : Intel Xeon
    Stepping   : 5
    Speed    : 2267 MHz
    Bus     : 133 MHz
    Core     : 4
    Thread    : 8
    Socket    : 1
    Level2 Cache : 1024 KBytes
    Status    : Ok

Processor: 1
    Name     : Intel Xeon
    Stepping   : 5
    Speed    : 2267 MHz
    Bus     : 133 MHz
    Core     : 4
    Thread    : 8
    Socket    : 2
    Level3 Cache : 8192 KBytes
    Status    : Ok

Processor total : 2

Memory installed : 24576 MBytes
ECC supported  : Yes

8   Slette IML-loggen

Dersom IML-loggen ikke inneholder noe man er interessert i, eller vil ta vare på, kan man slette innholdet ved hjelp av hpasmcli:

maskin.uio.no# hpasmcli -s 'clear iml'
IML Log successfully cleared.

Det er også mulig å bruke hpimlview til å manipulere IML-loggen, men vanligvis bruker man bare hpasmcli.

9   Konfigurere maskinvare med hpasmcli

For å se hva som kan konfigureres med SET, kjør hpasmcli -s set:

maskin.uio.no# hpasmcli -s set

Invalid Arguments
     SET ASR <timeout>
     SET BOOT [ FIRST | ONCE ]
     SET F1 [ ENABLED | DELAYED | DISABLED ]
     SET NAME <string>
     SET SERIAL [ BIOS | EMBEDDED | VIRTUAL ]
     SET UID [ ON | OFF ]

Det er ikke ofte man bruker SET-kommandoen i hpasmcli. Det vanligste er likevel å bruke SET til å konfigurere ASR eller SERIAL. Man kan skru på/av UID (blått lys foran for å identifisere maskinen) med hpasmcli, men det er som regel mer praktisk å bruke hpuid til slikt.

En annen metode for å konfigurere er å bruke enable eller disable med hpasmcli:

maskin.uio.no# hpasmcli -s disable

Invalid Arguments
     DISABLE ASR
     DISABLE HT
     DISABLE PXE [ NIC1 | NIC2 | NIC3 | NIC4 | NIC5 ]
     DISABLE WOL

Det vanligste man bruker dette til er å skru av eller på ASR:

maskin.uio.no# hpasmcli -s 'disable asr'
Successfully disabled ASR timer.

De andre tingene; HT (hyperthreading), PXE (pre-execution environment) eller WOL (wake-on-lan), er enten uinteressante for oss på UiO, eller default-verdien er hva vi ønsker.

10   Manipulere IML (Integrated Management Log)

hpimlview er et interaktivt verktøy som brukes til å se på eller manipulere IML-loggen. Med dette verktøyet kan man fjerne entries fra IML, man kan endre status på eksisterende log-entries, eller man kan legge inn sine egne.

Erfaringsmessig brukes dette lite av oss på USIT. Det er blitt brukt unntaksvis dersom man ønsker å bevare enkelte log-entries i IML, men endre status til "Repaired".

11   Fysisk identifikasjon av maskinen med UID-lys

Alle HP-servere har et UID-lys i front. Skrur man dette på, vil det lyse skarpt blått. Hensikten med dette er å kunne identifisere maskinen. Siden vi normalt merker maskinene med navnelapper er dette overflødig funksjonalitet for oss, men det kan fra tid til annen være nyttig. For å skru på UID-lys:

maskin.uio.no# hpuid -e

For å se status på UID-lyset:

maskin.uio.no# hpuid -s
ON

For å skru av UID-lyset:

maskin.uio.no# hpuid -d

12   Manipulere intern-RAID

De aller fleste av HP-serverne våre har en eller annen RAID-kontroller til de interne diskene. For å vise informasjon om, eller manipulere eller konfigurere disse, bruker vi verktøyet hpacucli. Man kan konfigurere RAID når maskinen booter, men dersom man ønsker å sette inn nye disker og lage et nytt RAID-sett av disse, kan man altså gjøre dette i fart.

12.1   Vise informasjon om RAID-kontrollere

hpacucli kan vise alt man vanligvis renger å vite om selve RAID-kontrolleren, de logiske diskene eller de fysiske diskene. For å vise informasjon, brukes opsjonen show. Denne kan igjen kobles med opsjonene status for status-informasjon, eller med detail for detaljert informasjon. Her er et eksempel, hvor vi viser informasjon om kontrolleren (egentlig alle kontrollerne, men vi har vanligvis bare en):

Med en enkel show:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0     (sn: 50123456789ABCDE)

Med show status:

maskin.uio.no# hpacucli ctrl all show status

Smart Array P410i in Slot 0
  Controller Status: OK

Med show detail:

maskin.uio.no# hpacucli ctrl all show detail

Smart Array P410i in Slot 0
  Bus Interface: PCI
  Slot: 0
  Serial Number: 50123456789ABCDE
  RAID 6 (ADG) Status: Disabled
  Controller Status: OK
  Chassis Slot:
  Hardware Revision: Rev C
  Firmware Version: 3.00
  Rebuild Priority: Medium
  Expand Priority: Medium
  Surface Scan Delay: 15 secs
  Post Prompt Timeout: 0 secs
  Cache Board Present: False
  Drive Write Cache: Disabled
  SATA NCQ Supported: True

12.2   Vise informasjon om logiske disker

Det første man må vite er hvilken slot kontrolleren henger på:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0
  Controller Status: OK

Her er det slot 0. Da kan vi konstruere kommandoen for å vise de logiske diskene:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show

Smart Array P410i in Slot 0

  array A

   logicaldrive 1 (68.3 GB, RAID 1, OK)

Hvis vi hekter på status:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show status

  logicaldrive 1 (68.3 GB, RAID 1): OK

Hvis vi hekter på detail:

maskin.uio.no# hpacucli ctrl slot=0 logicaldrive all show detail

Smart Array P410i in Slot 0

  array A

   Logical Drive: 1
     Size: 68.3 GB
     Fault Tolerance: RAID 1
     Heads: 255
     Sectors Per Track: 63
     Cylinders: 8920
     Stripe Size: 128 KB
     Status: OK
     Array Accelerator: Disabled
     Unique Identifier: 600508B1001037383941424344450000
     Disk Name: /dev/cciss/c0d0
     Mount Points: /boot 258 MB
     Logical Drive Label: A8038E0350123456789ABCDE733E
     Mirror Group 0:
      physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
     Mirror Group 1:
      physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

12.3   Vise informasjon om fysiske disker

Det første man må vite er hvilken slot kontrolleren henger på:

maskin.uio.no# hpacucli ctrl all show

Smart Array P410i in Slot 0
  Controller Status: OK

Her er det slot 0. Da kan vi konstruere kommandoen for å vise de logiske diskene:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show

Smart Array P410i in Slot 0

  array A

   physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
   physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

Hvis vi hekter på status:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show status

  physicaldrive 1I:1:1 (port 1I:box 1:bay 1, 72 GB): OK
  physicaldrive 1I:1:2 (port 1I:box 1:bay 2, 72 GB): OK

Hvis vi hekter på detail:

maskin.uio.no# hpacucli ctrl slot=0 physicaldrive all show detail

Smart Array P410i in Slot 0

  array A

   physicaldrive 1I:1:1
     Port: 1I
     Box: 1
     Bay: 1
     Status: OK
     Drive Type: Data Drive
     Interface Type: SAS
     Size: 72 GB
     Rotational Speed: 15000
     Firmware Revision: HPD3
     Serial Number: BV05P940ER9L0917
     Model: HP   DH072BAAKN
     PHY Count: 2
     PHY Transfer Rate: 3.0GBPS, Unknown
   physicaldrive 1I:1:2
     Port: 1I
     Box: 1
     Bay: 2
     Status: OK
     Drive Type: Data Drive
     Interface Type: SAS
     Size: 72 GB
     Rotational Speed: 15000
     Firmware Revision: HPD3
     Serial Number: BV05P940ER5N0917
     Model: HP   DH072BAAKN
     PHY Count: 2
     PHY Transfer Rate: 3.0GBPS, Unknown

12.4   Lage nytt RAID-sett

Gitt følgende scenario: En maskin har to tomme diskbays. Man kjøper inn to nye disker fra HP og dytter dem inn i maskinen. Man ønsker da å lage et nytt RAID-sett (vanligvis RAID1) av disse diskene uten å måtte ha nedetid (reboot). Løsningen er å bruke hpacucli til å lage et nytt RAID-sett av tomme disker:

Først må man liste opp diskene:

maskin.uio.no# hpacucli ctrl slot=3 physicaldrive all show

Smart Array P400 in Slot 3

  array A

   physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 72 GB, OK)
   physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 72 GB, OK)

  unassigned

   physicaldrive 1I:1:3 (port 1I:box 1:bay 3, SAS, 146 GB, OK)
   physicaldrive 1I:1:4 (port 1I:box 1:bay 4, SAS, 146 GB, OK)

Deretter kan man lage et nytt RAID-sett:

maskin.uio.no# hpacucli slot=3 create type=ld drives=1I:1:3,1I:1:4 raid=1
[...]

Når nytt RAID-sett er lages kan man aksessere dette på normal måte, f.eks. ved fdisk -l for å vise informasjon om de logiske diskene slik OS-et ser dem.

12.5   Vise hjelpetekst

hpacucli er et omfattende program med en syntaks som kan virke komplisert og forvirrende. Heldigvis kan programmet gi endel nyttig hjelpetekst. For eksempel vil hpacucli help gi generell hjelp, mens man kan spesifisere nøyaktig hva man vil ha hjelp til. Eksempel:

maskin.uio.no# hpacucli help show

The show command outputs information about a device or a list of devices.

<target> show [config] [detail]
  The show command outputs information about the specified device. To force a
  more detailed and verbose output, specify the "detail" parameter. To see the
  configuration, which includes the targeted device along with all of the
  devices that it aggregates, specify the "config" parameter. The target can
  be any valid device except when using the "config" parameter. In this case
  the specified target must be a controller.

<target> show [status]
  Displays the status information for the specified device(s). The target can
  be any valid device.

<target> show [ssp]
  Displays the ssp information for the specified controller. The target can be
  any valid controller that supports ssp.

Examples:
  ctrl ch="lab 3" show config detail
  ctrl all show status
  ctrl ch="lab 3" show ssp
Publisert 5. okt. 2011 21:48 - Sist endret 6. okt. 2011 15:02