カテゴリー: 技術系

  • WhisperをWindowsにインストールして使ってみる

    Whisperは、OpenAIがMITライセンスで公開した汎用音声認識モデル。機械学習の訓練済みのモデルなので、そのまま使うことができる。

    https://openai.com/blog/whisper/
    https://github.com/openai/whisper

    これを試すために、ほぼまっさらなWindows11 Proの上に、インストールして、実際に使ってみた。そのときの手順は下記。

    Pythonをインストール

    Pythonの公式サイトから、Windows用のインストーラーをダウンロードしてインストールする。

    Windowsでインストールするときは、ユーザ環境ではなく、ALLユーザの環境を選択して、インストール先をCドライブの下にフォルダを作成して、そこにインストールするのがよい。ユーザ環境にインストールする場合、ユーザ名で日本語が使われていたりして、実行時にエラーになるので。

    PyTorchをインストール

    インストールするコマンドを下記のpytorchのサイトで確認して実行する。

    https://pytorch.org/get-started/locally/

    NVIDIAのGPUがない普通のPC(とりあえずSurface Pro7)なので、PytorchもCPU版を選択した(CUDAなしの環境)。インストールは、Python標準についてくるpip3で。そのときのコマンドは下記。

    pip3 install torch torchvision torchaudio

    もし、pip3が見つからない場合は、Windowsを再起動してみる。パスが認識されていない可能性があるため。

    FFMPEGをインストール

    いろいろと検討したが、Windows用のパッケージ管理ツールのchocolateyを使うのが楽だった。

    まずは、chocolateyをインストールする。Powershellを管理者権限で開いて下記を実行する。

    Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))

    インストール後、パスが正常に読み込まれていないようだったので、Windowsを再起動した。

    Powershellを管理者権限で開いて、下記のコマンドを実行してffmpegをインストールする。

    choco install ffmpeg

    Rustをインストール

    Whisperのページによると、念のため、 rustもインストールしておくとのこと。

    pip install setuptools-rust

    Gitをインストール

    下記のサイトからWindows用のGitをダウンロードしてインストールする。

    https://gitforwindows.org/

    インストールしたら、Windowsを再起動する。

    Whisperのインストール

    Powershellを開いて、下記のコマンドを実行する

    pip install git+https://github.com/openai/whisper.git

    やっとインストールが完了。

    Whisperで動画ファイルの音声起こしをやってみる

    Powershellを起動して、下記の書式でWhisperを利用する。実際に動作するのは、Pythonのコードだが、使うだけならPythonを起動させなくてもいい。

    whisper ファイル名 --language Japanese --model small

    「–model xxx」のxxxには「tiny」「base」「small」「medium」「large」を選択して、指定する。モデルは、処理速度と精度のトレードオフになる。モデルがmedium、largeと大きくなるほど、処理負荷が増える。

    利用するモデルの初回実行時には、モデルのダウンロードが行われるため、処理が始まるまでに時間がかかる。

    実際に、1時間程度のMP4の動画の文字起こしを、モデルsmallでさせてみたところ、第10世代のCore i5での処理で、5時間かかって、30分弱しか処理できていない。認識の精度としては、漢字への変換も含めて、かなり読める精度だ。「xxx代」が「xxx台」になっているとか、コンテキストを読まないと変換できないものは、違っているけれど、おおむね文字起こしできている。

    NVIDIAのGPUを入れて、CUDAで、Pytorchの処理をさせないと、高速化はできないということもわかった。CPUだけだと、向き不向きの不向きな処理なので、実用に耐えられる速度はだせないのかもしれない。「base」や「tiny」も試してみないことには結論はだせないけれども。

  • Microsoft StoreからインストールしたGIMPが起動できなかった

    Windows11に、Microsoft StoreからGIMPをインストールしたが、起動しない。バージョンは、GIMP 2.10.32。

    GIMPの公式サイト(https://www.gimp.org)からダウンロードしたインストローラーでインストールしたら、Windows11で起動できた。Microsoft Store版だと、対応言語に日本語が入っていなかったのも原因なのかもしれない。

  • モリサワのUDフォントがChromebookで利用できるようになった。

    モリサワのUDフォントがChromebookで利用できるようになったという。

    https://forest.watch.impress.co.jp/docs/news/1440673.html

    早速、Chromebookで設定変更を試してみた。

    Chromebookの設定には、フォントの設定はなく、ブラウザのChromeの設定のデザインにあるフォントで設定を変えた。アドレスバーに直接入力するなら下記。

    chrome://settings/fonts

    標準フォントなどを選ぶところで、「BIZ UDPGothic」を選ぶ。

    最初は何も考えず、全部「BIZ UDPGothic」にしたけれど、Serifフォントだけ、あとから「BIZ UDPMincho」に変えた。

  • FreeBSD13.1にしたときにCertbotが消えていた

    FreeBSD13.1にアップグレードしたときに、pkgの更新も行ったためか、certbotがきえていた。Let’s Encryptの証明書が更新されているはずなのに、更新されず期限が切れたので、そこで気がついた。

    コマンドが消えて、エラーになった。(↓のコマンドが消えた)

    /usr/local/bin/certbot-3.8 renew

    pkgで探して、新しくインストール。

    pkg search certbot
    pkg install py39-certbot-1.27.0,1

    シンボリックリンクが作られていたので、そちらを利用して、証明書を更新した。そのあとに、Apacheを再起動。

    certbot renew
    httpd -k restart
  • Azureでメンテナンス告知を確認する方法

    1. Azureの管理コンソールにアクセスする。

    2. すべてのサービスから、「サービス正常性」を開く。

    3. サイドメニューから「計画メンテナンス」を選択する。通知がある場合には、サイドメニューの計画メンテナンスに、(1)のような件数表示がある。

    4. メンテナンスの告知が表示されるので、選択して、内容を確認する。

    5. 内容を保存する場合には、PDFで出力する。

    AppServiceでも、個別のところにはなく、サービス正常性のところに通知がある。そして、複数のインスタンスがあるとき、どれの通知なのかわからない。

    サービス停止を伴うものかどうかも、メンテナンスの内容を見てみないとわからない。(サービス停止を伴うもに出会っていないので、なんともいえないけれど)

  • GitLab 14.10 から 15.3.1 にアップデートした

    GitLabで、14.10から15.3.1にapt upgradeでアップデートしたときに、エラーになったので、対応メモを残す。

    発生したエラー

    zen@LABO:~$ sudo apt upgrade
    パッケージリストを読み込んでいます... 完了
    依存関係ツリーを作成しています
    状態情報を読み取っています... 完了
    アップグレードパッケージを検出しています... 完了
    以下のパッケージはアップグレードされます:
      gitlab-ce
    アップグレード: 1 個、新規インストール: 0 個、削除: 0 個、保留: 0 個。
    11 個のパッケージが完全にインストールまたは削除されていません。
    1,104 MB 中 0 B のアーカイブを取得する必要があります。
    この操作後に追加で 223 MB のディスク容量が消費されます。
    続行しますか? [Y/n] Y
    (データベースを読み込んでいます ... 現在 296393 個のファイルとディレクトリがインストールされています。)
    .../gitlab-ce_15.3.1-ce.0_amd64.deb を展開する準備をしています ...
    gitlab preinstall: It seems you are upgrading from major version 14 to major version 15.
    gitlab preinstall: It is required to upgrade to the latest 15.0.x version first before proceeding.
    gitlab preinstall: Please follow the upgrade documentation at https://docs.gitlab.com/ee/update/index.html#upgrade-paths
    dpkg: アーカイブ /var/cache/apt/archives/gitlab-ce_15.3.1-ce.0_amd64.deb の処理 中にエラーが発生しました (--unpack):
     new gitlab-ce package pre-installation script subprocess returned error exit status 1
    処理中にエラーが発生しました:
     /var/cache/apt/archives/gitlab-ce_15.3.1-ce.0_amd64.deb
    E: Sub-process /usr/bin/dpkg returned an error code (1)
    zen@LABO:~$

    最初に、14.10から、15.0.2-ce.0に、アップデート。リストにあるかどうかを確認してから、バージョン指定でインストール。これで上書きインストールされる。

    zen@LABO:~$ sudo apt-cache madison gitlab-ce
    zen@LABO:~$ sudo apt-get install gitlab-ce=15.0.2-ce.0

    この後に、15.3(最新)にアップデート。今度は成功した。

    zen@LABO:~$ sudo apt update
    zen@LABO:~$ sudo apt upgrade
  • SQL Server 2022 のリリースが近い。

    SQL Server 2022がリリース候補版になったとのこと。

    https://www.itmedia.co.jp/news/articles/2208/26/news085.html

    リリース候補版が発表されたので、今年の秋(2022年秋)には正式リリース版が出そうである。SQL Server 2019を入れたばかりなのだが。そんなに機能をフル活用しないので、SQL Server 2022にしておきたかった。タイミングが合わないものである。

    SQL Server 2022がリリースされたら、Express Editionか、MSDNで試すかな。

  • お名前ドットコムのVPSの質が悪い

    またお名前ドットコムのVPSで、メンテナンスによりNICを変更された。固定IPアドレスはNICの設定となっているので、メンテナンスが終わってもネットワークには繋がらず。

    前もNICの割当が変更されてネットワークダウンしっぱなしになった。VPSはサーバ用のサービスなのだから、もっと気を使ってほしい。別にカスタムイメージを使っているわけでなく、標準インストールから使えるOSだったというのに。

    NICは、変更されて、10GのNICから、1GのNICに変更された。前のメンテナンスのときに10Gになったと思ったら、また1G接続に戻されたのだ。NICの接続速度は、10Gも使うわけはないのでよいのだが、そのためにNICごと変更するのは止めてほしいものだ。

  • Windows Updateには、80番ポートも必要

    ネットワーク的に外部との通信を厳しく制限している環境で、Windows Server 2019のWindows Updateをやっていた。httpsでの外部通信用に443番ポートは通信できるようにしていたが、http用の80番ポートはファイアウォールで閉じたままだった。

    443番ポートだけ開けてあって、80番ポートを閉じたネットワークで、Windows Updateを行うと、アップデート対象のリストの取得ができなくてエラーになる。最初の通信を80番ポートでやっているため、80番ポートでの通信ができないとWindows Updateができない。Windows Updateには、80番ポートと443番ポートを使う、というのは本当で、「と」というのがポイント。「or」ではなく「and」である。

    ちなみに、Windows Updateで80番ポートを使わない方法を探して、いろいろと試したがことごとく失敗した。両方のポートが必要だ。

  • 「Dirty Cred」の対応をUbuntuでやったログ

    「Dirty Cred(CVE-2022-2588)」についてのUbuntuのページ。修正されたカーネルのバージョンを調べて、アップデート後にそれよりも新しくなっていればよい。

    https://ubuntu.com/security/CVE-2022-2588

    修正パッチは出ているので、”apt update” “apt upgrade” でできるはずなので、試した。カーネルのバージョンが変わっていることが確認できたので、apt upgradeで問題なし。

    Ubuntu 18.04 LTS のとき

    作業前

    zen@LABO:~$ lsb_release -a
    No LSB modules are available.
    Distributor ID: Ubuntu
    Description:    Ubuntu 18.04.6 LTS
    Release:        18.04
    Codename:       bionic
    zen@LABO:~$ uname -a
    Linux LABO 4.15.0-166-generic #174-Ubuntu SMP Wed Dec 8 19:07:44 UTC 2021 x86_64 x86_64 x86_64 GNU/Linux
    zen@LABO:~$

    作業後

    zen@LABO:~$ lsb_release -a
    No LSB modules are available.
    Distributor ID: Ubuntu
    Description:    Ubuntu 18.04.6 LTS
    Release:        18.04
    Codename:       bionic
    zen@LABO:~$ uname -a
    Linux LABO 4.15.0-191-generic #202-Ubuntu SMP Thu Aug 4 01:49:29 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux
    zen@LABO:~$

    Ubuntu 20.04 LTS のとき

    作業前

    zen@TEST:~$ lsb_release -a
    No LSB modules are available.
    Distributor ID: Ubuntu
    Description:    Ubuntu 20.04.4 LTS
    Release:        20.04
    Codename:       focal
    zen@TEST:~$ uname -a
    Linux TEST 5.4.0-109-generic #123-Ubuntu SMP Fri Apr 8 09:10:54 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux
    zen@TEST:~$

    作業後

    zen@TEST:~$ lsb_release -a
    No LSB modules are available.
    Distributor ID: Ubuntu
    Description:    Ubuntu 20.04.4 LTS
    Release:        20.04
    Codename:       focal
    zen@TEST:~$ uname -a
    Linux TEST 5.4.0-125-generic #141-Ubuntu SMP Wed Aug 10 13:42:03 UTC 2022 x86_64 x86_64 x86_64 GNU/Linux
    zen@TEST:~$