エントリー 788 件中 1-5 件を ボックス表示 ⇔ リスト表示

dkmsでpx4_drvのドライバ更新が失敗するようになった

2025/9/14

Open Media VaultのLinux kernelを6.18.34以降にしてからtsukumijima/px4_drv 0.5.4 の更新に失敗するようになる。make.logには

/usr/sbin/dkms: line 106: cd: ./driver: No such file or directory

と出ていたのが気になってはいたのですが、その後ビルドは進み.koはできていたので無視していました。これがいけなかったらしい。解決としては/usr/src/px4_drv-0.5.4/dkms.confの

CLEAN="cd ./driver; make clean"
MAKE="cd ./driver; make KVER=${kernelver} px4_drv.ko"

を

CLEAN[0]="make -C driver clean"
MAKE[0]="make -C driver KVER=${kernelver} px4_drv.ko"

に変更。[0]はなくてもいいかも。

以上、Copilotに教えてもらいました。"cd ./driver; make"と"make -C driver"で結果に差が出るって、何が起こってるんだろう？

— posted by mu at 12:31 pm Comment [0] TrackBack [0]

Windows記憶域プールでRepair-VirtualDiskが完了しない

2025/3/19

カテゴリー » 日記

Windows Server 2019で作ってた記憶域プール、知らない間に構成ドライブの1/4がRetiredになっていたようで、Virtual diskが2つほど'No Redundancy'になっておりました。GUIからRepair Virtual Diskを選択したのですが、一向に終わる気配がないのでPower Shellから調べてみると、

PS C:¥Windows¥system32> Get-StorageJob

Name           IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----           ---------------- ----------- --------  --------------- -------------- ----------
VDisk1-Repair  True             00:48:19    Suspended 0                          0 B     256 MB
VDisk2-Repair  True             00:48:19    Suspended 0                          0 B     256 MB

と、JobがSuspendedのまま。Retiredになったドライブを除去しようにも、Virtual Disk Repairが先だと拒否。

調べたところOptimize-StoragePoolなるコマンドがあるようで、実行。2フェーズあるようですが、1フェーズが終わったところで

PS C:¥Windows¥system32> Optimize-StoragePool -FriendlyName 'pool0'
Optimize-StoragePool : Unspecified Error

Extended information:
Unspecified error

Activity ID: {........-....-....-....-............}
At line:1 char:1
+ Optimize-StoragePool -FriendlyName 'pool0'
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : NotSpecified: (StorageWMI:ROOT/Microsoft/...SFT_StoragePool) [Optimize-StoragePool], Cim
   Exception
    + FullyQualifiedErrorId : StorageWMI 2,Optimize-StoragePool

エラー終了。しかしGet-StorageJobで確認したところ、

Name                IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----                ---------------- ----------- --------  --------------- -------------- ----------
pool0-Optimize      False            01:09:46    Running   91                    670.5 GB     736 GB
VDisk0-Regeneration True             00:00:02    Running   4                    344.25 MB       8 GB
VDisk1-Repair       True             02:09:38    Suspended 0                          0 B     256 MB
VDisk2-Repair       True             02:09:38    Suspended 0                          0 B     256 MB

Suspend中のRepairも含めて全Virtual DiskのRegenerationとRepairが現れては消えるを繰り返しているようです。pool0-OptimizeのBytesTotalも徐々に増えていくようで、それに応じてPercentCompleteも後退する時もあり当てにならない。

もしかして構成ドライブの個数だけ繰り返すのだろうか？24個あるんだが…、というわけで休日後再確認。

[参考]

Win 2k19 StorageJob suspended during repair (Microsoft Learn)

— posted by mu at 06:54 pm Comment [0] TrackBack [0]

Python ReactiveXのtimerが値を出さない

2024/3/12

カテゴリー » PC関連

ReactiveXのコード読んでないので理由不明ですが、reactivex.timer() はdue timeにdatetime.datetime型を指定した場合、値を出さない。GIL とかasyncioという話でもなさそう。

import datetime
import reactivex as rx

import time
import asyncio

dtStart = datetime.datetime.now() + datetime.timedelta(seconds=10)
rx.timer(dtStart, 5).subscribe(
    on_next = lambda value: print(value),  # 呼ばれない
    on_completed = lambda: print('completed'),
    on_error = lambda ex: print(ex)
)

time.sleep(30)
# asyncio.run(asyncio.sleep(30))  # こちらでも同じなので、GILのせいではなさそう

回避策として、due timeから現時刻を引き算して渡す。

rx.timer(dtStart - datetime.datetime.now(), 5)  # これは値を出す

環境

WinPython 3.12.2 64bit
reactivex 4.0.4

— posted by mu at 02:30 pm Comment [0] TrackBack [0]

RX570/Ubuntu 22.04でFooocusを動かす

2023/10/21

カテゴリー » PC関連

先日の続き。Stable Diffusion XLの派生Fooocusが動くまでこぎつけたので、備忘録。

環境

CPU: Ryzen 1700。お古を流用。PCIe atomic機能を有するHaswell以降・初代Ryzen以降必須。Fooocusはシングルスレッド性能しか求めてないようなので、選べるならそちら重視で。
OS: Ubuntu 22.4 LTS。参考にしたサイトの情報だとカーネル5.xなら動きそうな感じはするので、22.4, 22.4.1, 22.4.2は行けるかも。カーネル6.xになる22.4.3は実際にやって失敗した(Radeonドライバが入らない)。Windowsは将来OSアップデートでどうなるか分かったものではないのでパス。

Radeonのドライバ及びROCmが/optに20GB程度、その他ビルド用パッケージなどが/usrに30GBほど入るので、/を大きめに取る・/opt, /usrのパーティションを切るなど対策した方がいい。

メモリ: 32GB。Fooocusが画像サイズ1151x896で18GBくらい使っていたので、これくらいあった方がよさそう。なければスワップで乗り切る。
GPU: AMD Radeon RX570 8GB。1151x896だとVRAM 80%位使用する模様。

手順

ドライバインストール

ドライバ5.6や5.7で挑戦するならhttps://repo.radeon.com/amdgpu-install

以下からjammyのdebを選ぶ。6.xは大幅に変わると言われているので期待薄。再起動後rocminfoでRX570が表示されれば成功。

mkdir -p ~/stable_diffusion/rocm
cd ~/stable_diffusion/rocm
sudo usermod -aG video $USER
sudo usermod -aG render $USER
curl -O https://repo.radeon.com/amdgpu-install/5.5/ubuntu/jammy/amdgpu-install_5.5.50500-1_all.deb 
sudo dpkg -i amdgpu-install_5.5.50500-1_all.deb
sudo amdgpu-install --usecase=graphics,rocm,hip,hiplibsdk --no-32
sudo reboot
rocminfo
rocm-smi

Pytorchのビルド

ビルドに必要なパッケージのインストール。

sudo apt install ¥
  git build-essential ¥
  python3-pip python3-venv python3-dev ¥
  libstdc++-12-dev libpng-dev libjpeg-dev

Python仮想環境とかdockerでやった方が失敗したときのやり直しがききやすい。

cd ~/stable_diffusion
python3 -m venv fooocus_env
source fooocus_env/bin/activate
pip install pygit2==1.12.2 packaging

Pytorch2のビルド。2.1は試してません。

環境変数PYTORCH_ROCM_ARCHはrocminfoやrocm-smiで表示されるものから読み取る。複数指定できるがビルドに失敗しやすくなる。再度ビルドすると通ることもあるが、この後の動作確認が動かないとか経験したので欲張らず装着しているGPUだけに限定することがおすすめ。

curl -L -O https://github.com/pytorch/pytorch/releases/download/v2.0.1/pytorch-v2.0.1.tar.gz 
tar -xzvf pytorch-v2.0.1.tar.gz
cd pytorch-v2.0.1
echo 2.0.1 > version.txt
export CMAKE_PREFIX_PATH="$HOME/stable_diffusion/fooocus_env:/opt/rocm"
export USE_CUDA=0
# export PYTORCH_ROCM_ARCH="gfx803;gfx900;gfx906;gfx908;gfx90a;gfx1030"
export PYTORCH_ROCM_ARCH=gfx803
pip install cmake ninja
# sed -i '/^torch¥s*$/d' requirements.txt
pip install -r requirements.txt
pip install mkl mkl-include
python3 tools/amd_build/build_amd.py
python3 setup.py install

仮想環境入りなおして(import torchがエラーになる)、Pythonコマンドライン起動。

# envに入りなおさないと、import torchがエラーになる
deactivate
cd ~/stable_diffusion
source fooocus_env/bin/activate
python3

以下のコマンドで動作確認。最後のprint(res)でSegmentation faultが出る場合、PYTORCH_ROCM_ARCHの見直し(参考

)、場合によってはUbuntu/Radeonドライバの入れ直し。

import torch
torch.cuda.is_available()  # True
torch.cuda.device_count()  # >=1 (装着しているGPU数による)
torch.cuda.current_device() # >=0 (装着しているGPU数による)
torch.cuda.get_device_name(torch.cuda.current_device()) # gfx803とかRX570を含む文字列

tensor = torch.randn(2, 2)
res = tensor.to(0)
print(res)
(Ctrl+D)

torchvisionのビルド・インストール

cd ~/stable_diffusion
source fooocus_env/bin/activate
curl -L -O https://github.com/pytorch/vision/archive/refs/tags/v0.15.2.tar.gz 
tar -xzvf v0.15.2.tar.gz
cd vision-0.15.2
echo 0.15.2 > version.txt
export CMAKE_PREFIX_PATH="$HOME/stable_diffusion/fooocus_env:/opt/rocm"
export FORCE_CUDA=1
python3 setup.py install
deactivate

Fooocusのインストール

Pytorchをビルドした仮想環境で実行。最後の--listenオプションは外のPCからアクセスできるようにするためなので、同じマシンのブラウザで動かすなら不要。

cd ~/stable_diffusion
source fooocus_env/bin/activate
git clone https://github.com/lllyasviel/Fooocus.git 
cd Fooocus
python entry_with_update.py --listen

画像サイズ1152x896を作成するのにQualityで10-11分、Speedで6.5分弱。古いGPU故コア数少ない・BFloat16ない・Tensorエンジンもないので、これくらいになってしまうのか。ちょっと試してみたいとか打ち込む設定が決まっているならいいですが、いろいろ試すにはちょっと辛いかなぁ。

— posted by mu at 11:00 am Comment [1] TrackBack [0]

RX570/Ubuntu 22.04でROCmを入れる

2023/10/8

カテゴリー » PC関連

基本的には下記サイトの内容なのですが、言及されてないことも経験したので備忘録。[続き]

事前項目

PC

CPUはPCI atomicsをサポートしているものが必要。intelではHaswell (Core i 4000番台)以降、AMDは初代Ryzen以降。満たしてなくてもGPUドライバはインストールできるが、No GPU扱いになる。

No AMD GPUs specified #1742 (ROCm on GitHub)

Ubuntu

UbuntuはLTSを使用。20.4ならFocal Fossa、22.4はJammy Jellyfish(22.4.xではなく22.4)。上記サイトでも触れられているように、今のROCmはRX570をサポートしていないが事実として動くということを利用している。どのバージョンから動かなくなるのかわからないので、無闇に新しいものを使うのは避ける。

AMD GPUドライバは上記サイトで使われている5.5 or 5.6。おそらくLTSのカーネルバージョンじゃないと、ドライバビルド(下記amdgpu-installの部分)が失敗し入らない(22.4.3/カーネル6.2で経験)。うっかり新しいカーネルに更新しないようにする。

WikipediaのUbuntuバージョン履歴。22.4はカーネル5.15がインストールできた。

22.4.xに古いカーネルを入れる場合、AMD GPUドライバインストール(amdgpu-install)前に新しいカーネルは全部削除する。でないと、ドライバインストーラはインストールされているすべてのカーネルバージョンに対してビルドを試み失敗、その後カーネルをアンインストールしようとするとまたドライバインストーラが動き出して失敗でアンインストールできなくなる。

手順

curl -O https://repo.radeon.com/amdgpu-install/5.5/ubuntu/jammy/amdgpu-install_5.5.50500-1_all.deb  (https://repo.radeon.com/amdgpu-install/5.7/ubuntu/focal/amdgpu-install_5.7.50700-1_all.deb  for Ubuntu 20.4 LTS)
sudo dpkg -i amdgpu-install_5.5.50500-1_all.deb
sudo amdgpu-install --usecase=rocm,mllib,mlsdk (or sudo amdgpu-install --usecase=graphics,rocm,mllib,mlsdk --no-32)
sudo usermod -aG video $USER
sudo usermod -aG render $USER
(Reboot Ubuntu)
sudo rocminfo
rocm-smi

現在CPU atomic未対応CPUのためrocminfo, rocm-smiともにGPUを認識しない状態。機材を調達して再挑戦の予定。

[2023/10/15] 訂正 --no-86 → --no-32

— posted by mu at 10:38 am Comment [0] TrackBack [0]