投稿者: zen

  • ハッピーセットのシークレットプラレール(2022年秋)

    マクドナルドのハッピーセット(2022年秋)のプラレールおもちゃ。第2弾は、初だけど、なんかシークレットのプラレールがでていた。金色のD51蒸気機関車。子供は金ピカが好きだよね。

  • 赤坂に新しいmaruetsupetitがオープンしていた

    赤坂のBizタワーの下にマルエツプチの工事をしていたのは知っていたが、オープン日がなかなか張り出されず。そして、気がついたら、オープンしていた。

    店舗にいってみたが、ドリンクの品揃えが微妙。前の店舗ではあった缶コーヒーがほぼない。酒の品揃えはいいけれど、出勤のときにアルコール製品は買わないからなぁ。さっそく買い物と思っても、Tポイントボーナスの掲示もないので、マルエツプチで買わなくても・・・な感じだ。Bizタワーの上にいる人には、お弁当などで使うのだろうけど、いまのところ用はない感じ。

    ちなみにレジはセルフレジが多数。ポイント処理とかが気になるから、いつかは買い物かな。

  • ランチ:蒸し鶏ポン酢(2022/10/14)

    今日のランチは、赤坂よ志多の蒸し鶏ポン酢ランチ。

    鶏肉は、蒸しというか低温調理されている感じで、刺し身っぽい感じで、やわらかくもっちりしていた。味はさっぱりだった。これは、もっと暑いころだといいかも。美味しい蒸し鶏だった。たぶん、おつまみには最適。ランチだと、ご飯を食べすぎないので、これはこれでヘルシーな感じだ。

    今日のランチで、誤算だったのは、赤坂よ志多は、800円でランチが食べられたはずだったのだが、10月くらい値上げしていたようで、1,000円だった。9月の初めにいったときは800円だったのに。安いランチが、また1つ消えた。赤坂のランチの物価が上がりすぎ。なかなか厳しい。

  • スマホゲームのFF7 FIRST SOLDIERが終了するとのこと。

    スマホゲームのFF7 FIRST SOLDIERが終了するとのこと。サービス開始の前の情報で、とりあえずダウンロードしたけれど、めんどくさくて、プレイしなかったゲームだ。きっと課金された金額が少なくて、コストを超えられなかったのだろう。

    「FF」のバトロワ「FINAL FANTASY VII THE FIRST SOLDIER」が2023年1月11日をもってサービス終了
    https://game.watch.impress.co.jp/docs/news/1446897.html

    売り切りのゲームでもないし、サービスの継続でコストはかかるのがスマホゲーム。アイテムの購入が少なければ元が取れないから、さっさとゲームを終了させるのは判断としてはありそう。週刊少年ジャンプの10週打ち切りみたいなものだろう。印象としては、やっぱり終了か、というところ。本編などのミニゲームなどだったらよかったのだろうけど。個人的には、前に打ち切られたFF7のバイクゲームの方が悲しかった。

  • GoogleもMicrosoftもウェブ会議ツールに文字起こしと要約機能を追加

    たまたまなのか、対応して合わせたのかはわからないが、GoogleとMicrosoftは、MeetとTeamsにウェブ会議の自動文字起こし機能と、その要約機能(まとめ機能)を追加するとのこと。

    Transcribe speech during Google Meet calls into a Google Doc
    https://workspaceupdates.googleblog.com/2022/10/google-meet-transcripts.html

    Microsoftが「Teams Premium」を発表、ミーティング後の“まとめ”をAIが自動作成してくれる機能など実装
    https://internet.watch.impress.co.jp/docs/news/1446955.html

    Whisperが公開されているので、録画されたミーティングから文字起こしを考えていたが、そもそもウェブ会議ツールでやってくれるのであれば、そっちの方が手間がない。なんとなく、Whisperが無料公開されたから、機能追加を急いだ気もする。

    さて、こうやって大手のウェブ会議ツールに文字起こしツールが実装されると、SaaSでサービス展開されている文字起こしはディスラプトされる気がする。Whisperが公開されただけでも、個人的には怪しいと感じていたのだけど、その前に巨人がつぶしにきた感じだ。

  • Coca-Colaの自販機も値上げ

    自動販売機へも値上げの波が。コカ・コーラの自動販売機が10月から値上げしていた。10円(と20円)の値上げは、なかなか痛い。

    まだ、量は少ないが買いやすいものが残っているのが救いかな。値上げラッシュは、生活に厳しいな。

  • 碓氷峠のめがね橋

    久しぶりに遠出して、碓氷峠のメガネ橋をみてきた。

    めがね橋は、何回見てもいい。古びた感じとアーチ、趣があってよい。本当は横川駅のところからハイキングで、ここまで来ればなお良いのだけど、いろいろと大変なので、今はめがね橋の下まで車で移動。途中の丸山変電所跡も見ながらの散策をやりたいものだ。

    今回は、iPhone12Proではなくて、GR Digitalで撮影。もう十分レトロなカメラになっているので、のんびりな感じで楽しんだ。

  • ランチ:一龍本店のカルビクッパ(2022/10/6)

    急に寒くなったので、ランチは一龍本店で温かいカルビクッパ。ユッケジャンクッパのような刺激はないけれど、ごろごろと入っている柔らかくなった牛カルビがいい。辛くないので、お腹にも優しい。美味しかった。

  • WhisperをWindowsにインストールして使ってみる

    Whisperは、OpenAIがMITライセンスで公開した汎用音声認識モデル。機械学習の訓練済みのモデルなので、そのまま使うことができる。

    https://openai.com/blog/whisper/
    https://github.com/openai/whisper

    これを試すために、ほぼまっさらなWindows11 Proの上に、インストールして、実際に使ってみた。そのときの手順は下記。

    Pythonをインストール

    Pythonの公式サイトから、Windows用のインストーラーをダウンロードしてインストールする。

    Windowsでインストールするときは、ユーザ環境ではなく、ALLユーザの環境を選択して、インストール先をCドライブの下にフォルダを作成して、そこにインストールするのがよい。ユーザ環境にインストールする場合、ユーザ名で日本語が使われていたりして、実行時にエラーになるので。

    PyTorchをインストール

    インストールするコマンドを下記のpytorchのサイトで確認して実行する。

    https://pytorch.org/get-started/locally/

    NVIDIAのGPUがない普通のPC(とりあえずSurface Pro7)なので、PytorchもCPU版を選択した(CUDAなしの環境)。インストールは、Python標準についてくるpip3で。そのときのコマンドは下記。

    pip3 install torch torchvision torchaudio

    もし、pip3が見つからない場合は、Windowsを再起動してみる。パスが認識されていない可能性があるため。

    FFMPEGをインストール

    いろいろと検討したが、Windows用のパッケージ管理ツールのchocolateyを使うのが楽だった。

    まずは、chocolateyをインストールする。Powershellを管理者権限で開いて下記を実行する。

    Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://chocolatey.org/install.ps1'))

    インストール後、パスが正常に読み込まれていないようだったので、Windowsを再起動した。

    Powershellを管理者権限で開いて、下記のコマンドを実行してffmpegをインストールする。

    choco install ffmpeg

    Rustをインストール

    Whisperのページによると、念のため、 rustもインストールしておくとのこと。

    pip install setuptools-rust

    Gitをインストール

    下記のサイトからWindows用のGitをダウンロードしてインストールする。

    https://gitforwindows.org/

    インストールしたら、Windowsを再起動する。

    Whisperのインストール

    Powershellを開いて、下記のコマンドを実行する

    pip install git+https://github.com/openai/whisper.git

    やっとインストールが完了。

    Whisperで動画ファイルの音声起こしをやってみる

    Powershellを起動して、下記の書式でWhisperを利用する。実際に動作するのは、Pythonのコードだが、使うだけならPythonを起動させなくてもいい。

    whisper ファイル名 --language Japanese --model small

    「–model xxx」のxxxには「tiny」「base」「small」「medium」「large」を選択して、指定する。モデルは、処理速度と精度のトレードオフになる。モデルがmedium、largeと大きくなるほど、処理負荷が増える。

    利用するモデルの初回実行時には、モデルのダウンロードが行われるため、処理が始まるまでに時間がかかる。

    実際に、1時間程度のMP4の動画の文字起こしを、モデルsmallでさせてみたところ、第10世代のCore i5での処理で、5時間かかって、30分弱しか処理できていない。認識の精度としては、漢字への変換も含めて、かなり読める精度だ。「xxx代」が「xxx台」になっているとか、コンテキストを読まないと変換できないものは、違っているけれど、おおむね文字起こしできている。

    NVIDIAのGPUを入れて、CUDAで、Pytorchの処理をさせないと、高速化はできないということもわかった。CPUだけだと、向き不向きの不向きな処理なので、実用に耐えられる速度はだせないのかもしれない。「base」や「tiny」も試してみないことには結論はだせないけれども。

  • 読了:デザインと障害が出会うとき

    デザインについてと、障害への対応と、考えることができる本だった。示唆は多いけれど、結論を出しているわけではない、そこがいいのかも。障害に対するデザイン的な解決にパターンは決まっていないわけで、だからこそ、いろいろなことができるとも言える。

    本としては、そんなに堅い内容ではなくて、障害の部分を抜きにしても、デザインのグラフィックが多くて、楽しい。扱っているものが障害に関係するものもあれば、そうでないものもある。面白いというか、考え方の世界が広がるというか、そういうもの。即物的に何かを得られるわけではないけれど、ちょっとだけ視野が広がるというか、そういう見方もあるのか、ってこと。

    それから本の中に、下記の文がいろいろと表している。

    筆者は、本書に含まれるアイディアが単なる記述にとどまらず、実例によってより良く表現されるようになってほしいと願っている。これらの緊張関係を解決する数多くのさまざまな方法は実例によって最もよく伝わるだろうし、ひとたびデザインが障害と出会うことになれば、理論よりも実践によってより良く表現されるだろう。
    また逆に、デザインは影響を吸収し続け、そうすることによってそれらを変異させ、新たな情報のみならず、人びとや素材、媒体、そしてアイディアを新たに取り組みつつ自分自身を再創造していく。
    (中略)
    デザインがデザインにインスピレーションをもたらすのである。デザインが障害と出会うとき、その出会いはデザインそのものを変えることになるだろう。(P.379)

    デザインと障害が出会うとき

    出会うことで変わることがいろいろとある。そう思える。