it-swarm-ja.com

システムの状態を確認するにはどうすればよいですか?

システムの正常性に関するレポートが必要なため、すべてのハードウェアコンポーネント(CPU、メモリ、ディスクなど)が期待どおりに機能していることがわかります。レポートに見つかった問題のみがリストされている場合(ある場合)は、最も読みやすくなります。これを行うシステムツールはありますか?

関連するメモ:

  • ディスクユーティリティ は、ディスクのSMART結果を報告できることを知っています。他のすべてのコンポーネントについても同様のものが欲しいです。
  • 未加工の診断ツールとベンチマーク は適切ではありません。診断ツールは、コンポーネントの詳細をリストしますが、その健全性はリストしません。ベンチマークは、健康上の問題を強調することもあります。私は直接的な健康報告にのみ興味があります。
  • Windowsでこの機能を実行する同等のツールを知っています(ハードウェアコンポーネントに障害が発生した場合に報告します)が、名前を忘れてしまった:P基本的にこれと同等のものが欲しいです。
3
david.libremone

電子機器は通常、100%または0%で動作します。ハードドライブなどの機械装置には、すでに知っているSMARTレポートに従って、差し迫った障害のインジケータがあります。

Fans

ファンには差し迫った故障インジケータがありますが、これは振動速度、キーリングベアリングなどのインジケータの聴覚と聴取に基づいています。

CPU

ファンの劣化の別の潜在的な指標は、CPUの熱レベルです。ラップトップでは、ファンの排気口が詰まっているか、RPMが低すぎます。また、CPU /マザーボードは圧縮空気でのダストクリーニングが必要であることを意味する場合があります(水分を含む呼吸は使用しないでください)。また、CPUヒートシンクを新しいサーマルペーストで再装着する必要があることも意味します。

RAM

マシンがロックして不良メモリエラーが表示される場合は、次の指示に従ってRAMをテストできます。 RAMのエラーをLinux経由で確認する方法

RAMチェッカーが不良メモリブロックを検出した場合、次の手順を使用してブラックリストに登録できます。 メモリの75%のみを使用するようカーネルのメモリマネージャを制限する方法はありますか?

NVMe PCIe M.2 Gen 3.0 x 4(または2)SSD

SSDを使用している場合、寿命は1兆回の書き込みで測定されます。 SMARTユーティリティはすでにSSD寿命を測定していますが、NVMe SSDについては測定していません。そのためにはnvme-cliが必要です。以下を使用してインストールします。

Sudo apt install nvme-cli

次に、SSDから利用可能な情報を収集します。

$ Sudo nvme smart-log /dev/nvme0
Smart Log for NVME device:nvme0 namespace-id:ffffffff
critical_warning                    : 0
temperature                         : 40 C
available_spare                     : 100%
available_spare_threshold           : 10%
percentage_used                     : 0%
data_units_read                     : 12,539,332
data_units_written                  : 10,623,582
Host_read_commands                  : 281,194,884
Host_write_commands                 : 96,528,713
controller_busy_time                : 672
power_cycles                        : 1,677
power_on_hours                      : 687
unsafe_shutdowns                    : 105
media_errors                        : 0
num_err_log_entries                 : 279
Warning Temperature Time            : 0
Critical Composite Temperature Time : 0
Temperature Sensor 1                : 40 C
Temperature Sensor 2                : 51 C
Temperature Sensor 3                : 0 C
Temperature Sensor 4                : 0 C
Temperature Sensor 5                : 0 C
Temperature Sensor 6                : 0 C
Temperature Sensor 7                : 0 C
Temperature Sensor 8                : 0 C

最も重要なフィールドはPercentage usedで、0%と表示されます。これはディスク使用率ではなく、使用寿命パーセントです。 Percentage usedが1%に達するとすぐに、所有していた月数に100を掛けて、いつ死ぬかを調べます。現在の速度では、ドライブは100年以上続くと言えます。もちろん、それはとにかく10年で廃止されます。

conkyを使用したデスクトップのシステムモニター

多くの人は、デスクトップの一部にシステムステータス(およびヘルス)を表示することを好みます。 Conkyをプライマリモニターの右側20%で実行したい:

Conky all.gif

注:シングルCPUでの97%のCPU使用率は、スクリーンレコーダー自体が原因です。

conkyおよびCPU使用率の詳細については、以下を参照してください: CPUとRAMにストレステストを同時に行うにはどうすればよいですか?

6