Wednesday 18 July 2018

Oracle Database Appliance : Monitor Hardware Components

Oracle Database Appliance (ODA) is an entry level Engineered System. ODA is a pre-configured, highly available Oracle Database Engineered system. ODA system consists of hardware, software, storage and networking. The hardware configuration is designed to provide redundancy and protection against single points of failures in the system.

ODA consists of two physical servers (Node 0 and Node 1), a storage shelf and optionally an additional storage shelf. The two independent physical servers are interconnected and direct attached to SAS and SSD storage.

ODA is basically a 2-node RAC cluster database system running Oracle Linux operating (OEL), Oracle Database Enterprise Edition, Oracle Grid Infrastructure (Clusterware and ASM). All these together provides the Oracle Database high availability running on ODA.

ODA consists of several hardware components such as Mother Board, Processor, Memory, Power Supply, FAN, Network cards and so on. You can monitor the hardware status of these components using OAKCLI command for both Bare Metal and Virtualized platform.

Note: ODACLI is used for Hardware monitoring and administrative tasks on the Oracle Database Appliance on X6-2 S/M/L & X7-2 S/M.


In this article we will demonstrate how to monitor different hardware component status on ODA nodes.

Using OAKCLI command to Get Hardware Status


  • Execute the following command to display ODA server details

[root@odanoden1 ~]# oakcli show server

        Power State              : On
        Open Problems            : 0
        Model                    : ODA X4-2
        Type                     : Rack Mount
        Part Number              : 33060862+1+1
        Serial Number            : 1440XXXXXX
        Primary OS               : Not Available
        ILOM Address             : 10.10.20.1
        ILOM MAC Address         : 00:10:E0:62:3F:F6
        Description              : Oracle Database Appliance X4-2 1440XXXXX
        Locator Light            : Off
        Actual Power Consumption : 261 watts
        Ambient Temperature      : 18.500 degree C
        Open Problems Report     : System is healthy

[root@odanoden2 ~]# oakcli show server

        Power State              : On
        Open Problems            : 0
        Model                    : ODA X4-2
        Type                     : Rack Mount
        Part Number              : 33060862+1+1
        Serial Number            : 1440XXXXXX
        Primary OS               : Not Available
        ILOM Address             : 10.10.20.2
        ILOM MAC Address         : 00:10:E0:62:41:D6
        Description              : Oracle Database Appliance X4-2 1440XXXXX
        Locator Light            : Off
        Actual Power Consumption : 269 watts
        Ambient Temperature      : 17.750 degree C
        Open Problems Report     : System is healthy


  • Execute the following command to display ODA model

[root@odanoden1 ~]# oakcli show env_hw
BM ODA X4-2
Public interface : COPPER


  • Execute the following command to display ODA software version details

[root@odanoden1 ~]# oakcli show version -detail
Reading the metadata. It takes a while...
System Version  Component Name            Installed Version         Supported Version
--------------  ---------------           ------------------        -----------------
12.1.2.10.0
                Controller_INT            11.05.03.00               Up-to-date
                Controller_EXT            11.05.03.00               Up-to-date
                Expander                  0018                      Up-to-date
                SSD_SHARED                944A                      Up-to-date
                HDD_LOCAL                 A72A                      Up-to-date
                HDD_SHARED                A72A                      Up-to-date
                ILOM                      3.2.8.25 r114493          Up-to-date
                BIOS                      25040100                  Up-to-date
                IPMI                      1.8.12.4                  Up-to-date
                HMP                       2.3.5.2.8                 Up-to-date
                OAK                       12.1.2.10.0               Up-to-date
                OL                        6.8                       Up-to-date
                GI_HOME                   12.1.0.2.170117(2473      Up-to-date
                                          2082,24828633)
                DB_HOME                   12.1.0.2.170117(2473      Up-to-date
                                          2082,24828633)


  • Execute the following command to display 'oakcli show' help

[root@odanoden1 ~]# oakcli show -h
Usage:
oakcli show {disk|diskgroup|expander|fs|raidsycstatus|controller|server|processor|memory|power|cooling|network|enclosure|storage|core_config_key|version|dbhomes|dbstorage|databases|db_config_params|asr|env_hw} [<options>]
where:
        disk                     - About the disk
        diskgroup                - ASM disk group
        expander                 - Expander
        fs                       - Filesystem
        controller               - Controller
        storage                  - All storage components
        version                  - Running software version
        dbhomes                  - Installed oracle database homes
        dbstorage                - Details of ACFS storage setup for the databases
        databases                - Database names
        db_config_params         - db_config_params file
        asr                      - ASR configuration
        env_hw                   - Environment and Hardware information
        server                   - Details of server sub-system
        processor                - Details of processor sub-system
        memory                   - Details of memory sub-system
        power                    - Details of power supply sub-system
        cooling                  - Details of cooling sub-system
        network                  - Details of network sub-system
        enclosure                - Details of enclosure sub-system
        raidsyncstatus           - RAID sync status information
        core_config_key          - Core configuration
For detailed help on each command and object and its options use:
oakcli <command> <object> -h


  • Execute the following command to monitor the Processor Status

[root@odanoden1 ~]# oakcli show processor

        NAME  HEALTH HEALTH_DETAILS PART_NO. LOCATION   MODEL                         MAX_CLK_SPEED TOTAL_CORES ENABLED_CORES

        CPU_0 OK     -              060E     P0 (CPU 0) Intel(R) Xeon(R) CPU E5-2697  2.700 GHz       12        NA
        CPU_1 OK     -              060E     P1 (CPU 1) Intel(R) Xeon(R) CPU E5-2697  2.700 GHz       12        NA


  • Execute the following command to monitor the Memory Status

[root@odanoden1 ~]# oakcli show memory

        NAME    HEALTH HEALTH_DETAILS PART_NO.         SERIAL_NO.         LOCATION MANUFACTURER MEMORY_SIZE CURR_CLK_SPEED ECC_Errors

        DIMM_0  OK     -              M393B2G70DB0-YK0 00CE03143317593248 P0/D0    Samsung      16 GB       1600 MHz       0
        DIMM_1  OK     -              M393B2G70DB0-YK0 00CE0314331759238B P0/D1    Samsung      16 GB       1600 MHz       0
        DIMM_10 OK     -              M393B2G70DB0-YK0 00CE031433175926CD P1/D2    Samsung      16 GB       1600 MHz       0
        DIMM_11 OK     -              M393B2G70DB0-YK0 00CE031433175927AD P1/D3    Samsung      16 GB       1600 MHz       0
        DIMM_12 OK     -              M393B2G70DB0-YK0 00CE031433175922C3 P1/D4    Samsung      16 GB       1600 MHz       0
        DIMM_13 OK     -              M393B2G70DB0-YK0 00CE03143317593250 P1/D5    Samsung      16 GB       1600 MHz       0
        DIMM_14 OK     -              M393B2G70DB0-YK0 00CE0314331759367A P1/D6    Samsung      16 GB       1600 MHz       0
        DIMM_15 OK     -              M393B2G70DB0-YK0 00CE03143317593319 P1/D7    Samsung      16 GB       1600 MHz       0
        DIMM_2  OK     -              M393B2G70DB0-YK0 00CE031433175927A8 P0/D2    Samsung      16 GB       1600 MHz       0
        DIMM_3  OK     -              M393B2G70DB0-YK0 00CE03143317592B31 P0/D3    Samsung      16 GB       1600 MHz       0
        DIMM_4  OK     -              M393B2G70DB0-YK0 00CE03143317592B35 P0/D4    Samsung      16 GB       1600 MHz       0
        DIMM_5  OK     -              M393B2G70DB0-YK0 00CE03143317591C3C P0/D5    Samsung      16 GB       1600 MHz       0
        DIMM_6  OK     -              M393B2G70DB0-YK0 00CE031433175922C7 P0/D6    Samsung      16 GB       1600 MHz       0
        DIMM_7  OK     -              M393B2G70DB0-YK0 00CE0314331759324E P0/D7    Samsung      16 GB       1600 MHz       0
        DIMM_8  OK     -              M393B2G70DB0-YK0 00CE0314331759324B P1/D0    Samsung      16 GB       1600 MHz       0
        DIMM_9  OK     -              M393B2G70DB0-YK0 00CE0314331759331A P1/D1    Samsung      16 GB       1600 MHz       0


  • Execute the following command to monitor Power Status

[root@odanoden1 ~]# oakcli show power

        NAME            HEALTH HEALTH_DETAILS PART_NO. SERIAL_NO.         LOCATION INPUT_POWER OUTPUT_POWER INLET_TEMP     EXHAUST_TEMP

        Power_Supply_0  OK     -              7079395  476856Z+1435CE00EU PS0      Present     119 watts    32.250 degree C 36.562 degree C
        Power_Supply_1  OK     -              7079395  476856Z+1435CE00F6 PS1      Present     112 watts    37.000 degree C 40.375 degree C


  • Execute the following command to monitor Network Status

[root@odanoden1 ~]# oakcli show network

        NAME           HEALTH HEALTH_DETAILS LOCATION PART_NO MANUFACTURER MAC_ADDRESS        LINK_DETECTED DIE_TEMP

        Ethernet_NIC_0 OK     -              NET0     X540    INTEL        00:10:E0:62:3F:F2  yes (eth2)    46.250 degree C
        Ethernet_NIC_1 OK     -              NET1     X540    INTEL        00:10:E0:62:3F:F3  no (eth3)     46.250 degree C
        Ethernet_NIC_2 OK     -              NET2     X540    INTEL        00:10:E0:62:3F:F4  no (eth4)     51.000 degree C
        Ethernet_NIC_3 OK     -              NET3     X540    INTEL        00:10:E0:62:3F:F5  no (eth5)     51.500 degree C
        Ethernet_NIC_4 -      -              NET4     X540    INTEL        90:E2:BA:81:2B:B4  yes (eth0)    -
        Ethernet_NIC_5 -      -              NET5     X540    INTEL        90:E2:BA:81:2B:B5  yes (eth1)    -


  • Execute the following command to monitor Storage Status

[root@odanoden1 ~]# oakcli show storage
==== BEGIN STORAGE DUMP ========
Host Description: Oracle Corporation:SUN SERVER X4-2
Total number of controllers: 3
        Id         = 1
        Serial Num = 500605b008030030
        Vendor     = LSI Logic
        Model      = SGX-SAS6-EXT-Z
        FwVers     = 11.05.03.00
        strId      = mpt2sas:30:00.0

        Id         = 2
        Serial Num = 500605b00802fbc0
        Vendor     = LSI Logic
        Model      = SGX-SAS6-EXT-Z
        FwVers     = 11.05.03.00
        strId      = mpt2sas:40:00.0

        Id         = 0
        Serial Num = 500605b008071240
        Vendor     = LSI Logic
        Model      = SGX-SAS6-INT-Z
        FwVers     = 11.05.03.00
        strId      = mpt2sas:50:00.0

Total number of expanders: 2
        Id         = 1
        Serial Num = 50800200019f0002
        Vendor     = ORACLE
        Model      = DE2-24P
        FwVers     = 0018
        strId      = Primary
        WWN        = 5080020001a6b97e

        Id         = 0
        Serial Num = 50800200019f0002
        Vendor     = ORACLE
        Model      = DE2-24P
        FwVers     = 0018
        strId      = Secondary
        WWN        = 5080020001a6babe

Total number of PDs: 24
        /dev/sdl        LSI Logic         HDD  900gb slot:  0  exp:  0
        /dev/sdn        LSI Logic         HDD  900gb slot:  1  exp:  0
        /dev/sdah       LSI Logic         HDD  900gb slot:  2  exp:  0
        /dev/sdai       LSI Logic         HDD  900gb slot:  3  exp:  0
        /dev/sdaj       LSI Logic         HDD  900gb slot:  4  exp:  0
        /dev/sdak       LSI Logic         HDD  900gb slot:  5  exp:  0
        /dev/sdal       LSI Logic         HDD  900gb slot:  6  exp:  0
        /dev/sdam       LSI Logic         HDD  900gb slot:  7  exp:  0
        /dev/sdan       LSI Logic         HDD  900gb slot:  8  exp:  0
        /dev/sdao       LSI Logic         HDD  900gb slot:  9  exp:  0
        /dev/sdap       LSI Logic         HDD  900gb slot: 10  exp:  0
        /dev/sdaq       LSI Logic         HDD  900gb slot: 11  exp:  0
        /dev/sdar       LSI Logic         HDD  900gb slot: 12  exp:  0
        /dev/sdaa       LSI Logic         HDD  900gb slot: 13  exp:  0
        /dev/sdab       LSI Logic         HDD  900gb slot: 14  exp:  0
        /dev/sdac       LSI Logic         HDD  900gb slot: 15  exp:  0
        /dev/sdad       LSI Logic         HDD  900gb slot: 16  exp:  0
        /dev/sdae       LSI Logic         HDD  900gb slot: 17  exp:  0
        /dev/sdaf       LSI Logic         HDD  900gb slot: 18  exp:  0
        /dev/sdag       LSI Logic         HDD  900gb slot: 19  exp:  0
        /dev/sda        LSI Logic         SSD  200gb slot: 20  exp:  0
        /dev/sdb        LSI Logic         SSD  200gb slot: 21  exp:  0
        /dev/sdc        LSI Logic         SSD  200gb slot: 22  exp:  0
        /dev/sdd        LSI Logic         SSD  200gb slot: 23  exp:  0
==== END STORAGE DUMP =========


  • Execute the following command to monitor Shared Disk Status

[root@odanoden1 ~]# oakcli show disk
        NAME            PATH            TYPE            STATE           STATE_DETAILS

        e0_pd_00        /dev/sdl        HDD             ONLINE          Good
        e0_pd_01        /dev/sdn        HDD             ONLINE          Good
        e0_pd_02        /dev/sdah       HDD             ONLINE          Good
        e0_pd_03        /dev/sdai       HDD             ONLINE          Good
        e0_pd_04        /dev/sdaj       HDD             ONLINE          Good
        e0_pd_05        /dev/sdak       HDD             ONLINE          Good
        e0_pd_06        /dev/sdal       HDD             ONLINE          Good
        e0_pd_07        /dev/sdam       HDD             ONLINE          Good
        e0_pd_08        /dev/sdan       HDD             ONLINE          Good
        e0_pd_09        /dev/sdao       HDD             ONLINE          Good
        e0_pd_10        /dev/sdap       HDD             ONLINE          Good
        e0_pd_11        /dev/sdaq       HDD             ONLINE          Good
        e0_pd_12        /dev/sdar       HDD             ONLINE          Good
        e0_pd_13        /dev/sdaa       HDD             ONLINE          Good
        e0_pd_14        /dev/sdab       HDD             ONLINE          Good
        e0_pd_15        /dev/sdac       HDD             ONLINE          Good
        e0_pd_16        /dev/sdad       HDD             ONLINE          Good
        e0_pd_17        /dev/sdae       HDD             ONLINE          Good
        e0_pd_18        /dev/sdaf       HDD             ONLINE          Good
        e0_pd_19        /dev/sdag       HDD             ONLINE          Good
        e0_pd_20        /dev/sda        SSD             ONLINE          Good
        e0_pd_21        /dev/sdb        SSD             ONLINE          Good
        e0_pd_22        /dev/sdc        SSD             ONLINE          Good
        e0_pd_23        /dev/sdd        SSD             ONLINE          Good


  • Execute the following command to monitor ODA server enclosure

[root@odanoden1 ~]# oakcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC

        E0_FAN0     Cooling           OK          3450 rpm
        E0_FAN1     Cooling           OK          3070 rpm
        E0_FAN2     Cooling           OK          3070 rpm
        E0_FAN3     Cooling           OK          3070 rpm
        E0_IOM0     Encl_Electronics  OK          -
        E0_IOM1     Encl_Electronics  OK          -
        E0_PSU0     Power_Supply      OK          -
        E0_PSU1     Power_Supply      OK          -
        E0_TEMP0    Amb_Temp          OK          19 C
        E0_TEMP1    Midplane_Temp     OK          27 C
        E0_TEMP2    PCM0_Inlet_Temp   OK          32 C
        E0_TEMP3    PCM0_Hotspot_Temp OK          38 C
        E0_TEMP4    PCM1_Inlet_Temp   OK          27 C
        E0_TEMP5    PCM1_Hotspot_Temp OK          36 C
        E0_TEMP6    IOM0_Temp         OK          38 C
        E0_TEMP7    IOM1_Temp         OK          45 C


Using ILOM CLI to Get the Hardware Status


  • Execute the following command to connect to ILOM and monitor Hardware Status

[root@odanoden2 ~]# ssh odanoden2-ilom
Password:

Oracle(R) Integrated Lights Out Manager

Version 3.2.8.25 r114493

Copyright (c) 2016, Oracle and/or its affiliates. All rights reserved.

Warning: password is set to factory default.

Warning: HTTPS certificate is set to factory default.

Hostname: odanoden2-ilom

-> show -level all -output table /SP/faultmgmt
Target                          | Property                             | Value
--------------------------------+--------------------------------------+---------------------------------------------------------

-> show -l all /SYS type=='Hard Disk'

 /SYS/DBP0/HDD0
    Targets:
        OK2RM
        PRSNT
        SERVICE
        STATE

    Properties:
        type = Hard Disk
        ipmi_name = HDD0

    Commands:
        cd
        show

 /SYS/DBP0/HDD1
    Targets:
        OK2RM
        PRSNT
        SERVICE
        STATE

    Properties:
        type = Hard Disk
        ipmi_name = HDD1

    Commands:
        cd
        show


Using ILOM GUI to Get the Hardware Status




Conclusion

In this article we have learned how to monitor various hardware components status on ODA nodes using oakcli and ILOM. ODA server comes with different hardware components and monitoring them is key for ODA availability.

3 comments:

  1. Nice Post! I appreciate to you for this post. Really you are the best. Oracle Cloud Dumps

    ReplyDelete
  2. Sometime few educational blogs become very helpful while getting relevant and new information related to your targeted area. As I found this blog and appreciate the information delivered to my database.
    TeraStation 3410RN Series

    ReplyDelete
  3. Studio Best Monitor, also commonly referred to as reference monitors, are the means of translating the sounds and music you are mixing to your ears, thus you want them to provide as accurate a translation as possible. In this article you will learn what near field reference monitors-or studio monitors are, and the difference between active & passive monitoring systems. You will also learn basic setup keys to optimize your monitoring system for your home studio.

    ReplyDelete

Comparing Oracle Database Appliance X8-2 Model Family

September 2019 Oracle announced Oracle Database Appliance X8-2 (Small, Medium and HA). ODA X8-2 comes with more computing resources com...