タグ: LLM

  • 読了:Software Design 2025年12月号

    AIセキュリティ入門が為になった。AIエージェントのセキュリティは、新しい分野なので、まとまって読めるのは嬉しい。攻撃手法がわかるというのは、そういうことが起き得るという備えになる。防御策についても参考になった。いい内容だった。

    今さら聞けないID管理は、さらっと流したこともあり、よくわからんかった。興味が薄いのが原因だけど。なんとなくとっつきにくい感じで、それで流し読んでしまったかも。内容的には、知っておかないといけないことなんだけれど。ちゃんと読めず、ごめんなさい。

    Amazon: https://amzn.to/4oXH4jX

  • AIエージェントのセキュリティの話。

    MicrosoftがAIエージェントの危険性の話をしているサポート記事がある。

    https://support.microsoft.com/en-us/windows/experimental-agentic-features-a25ede8a-e4c2-4841-85a8-44839191dfb3

    Additionally, agentic AI applications introduce novel security risks, such as cross-prompt injection (XPIA), where malicious content embedded in UI elements or documents can override agent instructions, leading to unintended actions like data exfiltration or malware installation.

    翻訳してみると、

    さらに、エージェンティックAIアプリケーションは新たなセキュリティリスクをもたらします。例えば、クロスプロンプトインジェクション(XPIA)と呼ばれるもので、UI要素やドキュメントに埋め込まれた悪意のあるコンテンツがエージェントの指示を上書きし、データの流出やマルウェアのインストールといった意図しない行動を引き起こす可能性があります。

    Microsoftが考えているのは、エージェントそのものが悪いというのではなく、クロスプロンプトインジェクションで、プロンプト指示の内容が書き換えられて、内部データを外部に送信したり、マルウェアのインストールが行われる可能性があるというもの。信用できないAIエージェントは普通なので除外されているのだろう。途中で指示が上書きされていると、防ぐのはなかなか大変。インストールさせないように実行権限を最小化したり、不要なファイルにアクセスできなくしたり、対策を行うことになる。それはそれでめんどくさいわけで、頻繁に行う作業をAIエージェントにやらせるのならば、その対策でもよいけれど、ワンタイムで、さくっと実行だと設定が漏れてしまいそう。なんとも難しい。

    結局のところ、AIエージェントによって、PCを操作させないようするか、やれることを限定させる(操作を受ける側のMCPで調整するとか)のだろう。なんでもできる便利なものは、あえて使わないようにするのがよいだろうな。

  • 読了:生成AI時代の価値のつくりかた

    面白いというか、重かった。流されないメンタルモデルをつくることが主軸の本なので、重くて当然。当然、知っていることも多い。いろいろと考えさせられるものも多かった。単純に便利ツールとしてChatGPTやGeminiのようなLLMを使うのも選択としてはお手軽だし悪くない。その上で、個別の特化型のなにか、プラスアルファな部分をどうするか。そういうことを考える感じだった。

    本当は、オープンなSLMに手を出して、ファインチューニングしていくのがよいのだろう。ただ、いろいろと良いものが増えてくるので、落ち着くまで待ちたい気分でもある。Windowsにも、NPUは搭載されつつあるので、あと1年くらいでSLMを使って、ローカル環境での生成AIは環境がよくなるはず(インテルのNPUを使うものがなくて絶望したばかりだけれども)。ぼちぼち、この生成AIブームも落ち着いてくるはず。冬の時期にはなってほしくはないが、各社が新しいモデルを競うのは、そろそろ落ち着くと思っている。そのときに、利用できるように準備はしておきたいものだ。

    Amazon: https://amzn.to/47O4Sl1

  • 自動的にドキュメント生成する「Code Wiki」をGoogleが開発中

    実にGoogleらしいコードファーストな試み。Gemini CLI経由で、パブリックではない、ローカルソースコードの解析とドキュメント化ができれば、設計書が古いんです、っていう議論が終わる。まぁ、特定の言語だったり、フレームワークだったり、環境は特定されるだろうけれど。(LLMで得意な言語とフレームワークはあるから。)

    ドキュメントを手作業で保守する時代は終わり ~Google、「Code Wiki」を公開プレビューhttps://forest.watch.impress.co.jp/docs/news/2063281.html

    個人的には、かなり期待したい機能。詳細設計にあたる文書は、コードから生成した方が間違いがないし、基本設計部分との自然言語での突合せもやりやすくなると期待している。最初はいいけれど、あとからのドキュメントのメンテナンスは本当に時間がかかるので。

  • 読了:Software Design 2025年11月号

    遅くなったけれど、読み終わった。AI開発ツール大整理がよかった。Devinは文句を言わないコーダーって感じなので、実際に試してみたい。GitHub CopilotとClaude Codeはアシストというか一緒に作業する感じ。生成AIとペアプロみたいな(そこまではいかない?)感じで、人の目も入るので、まぁ、いいかも。Gemini Code Assistは、よくわらかない。情報が少ないのか、それとも紙面の問題か、なんだろうか。

    どれかのツール・LLMに特化した本もいいけれど、そこまで重くなく、さらりとツールの感触がつかめた。こういうのは雑誌の特集ならでは利点。気に入ったのがあれば、ターゲットを絞って本や深い解説を探せばいいので。

    あとオンコール対応の特集もよかった。慣れというのはあるけれど、最初のときはね。あとゲーム感覚で楽しめるように、っていうのはその通りかも。未知のことも多いので楽しめるようなマインドになればいい。

    Amazon: https://amzn.to/4hXPWnD

  • 読了:Software Design 2025年9月号

    MCPの特集がよかった。MCPがわかりやすくて、どういう通信になるのか、そういうのがわかってよかった。実際にMCPを使って、試すなら、この特集がちょうどいい。

    MCPサーバは、利用するか、立てればいいので、そこまで難しい感じではない。MCPホスト・MCPクライアントの部分の組み方が難しそう。使うだけではなく、役に立つものと考えると、MCPホストのチューニングというか組み方が重要そうだ。ここらへんも、そのうち簡単に組めるサービスがたくさん出てきそうな気がする。

    完全理解文字コードの特集は・・・わかったような、わからなかったような。Emojiのトラブルが多いことはわかったくらい。また理解しきれなかった。

    Amazon: https://amzn.to/47wn4jj


  • Google Vids で音声読み上げの動画を試したけれど

    Google Vids で音声読み上げの動画を試したけれど、スクリプトの入力枠はあるけれど、日本語が対応していなかった。

    日本語対応していないので、音声生成のボタンが表示されていない(せめて押せないなら、わかりやすくて良かったのだけど)。スクリプトの中身を英語に変えてみたが、音声生成はできず。

    あと、Vidsで言語をEnglishに変えてみたけれど、音声生成のボタンは表示されなかった。何か別のロケーションを見ているようだ(Chromeの言語設定か?)。

    早く日本語対応してくれるとよいのだけど。

  • LLM系のクローラーのアクセスがふえている

    数か月分のアクセスログみていたところ、OpenAI(Chat GPT)やAnthropic(Claude)などのLLMを提供している企業のクローラーのアクセスが増えていた。突発的なアクセスの偏りがあるので、原因をみていたら、こいつらによるものだった。

    Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.2; +https://openai.com/gptbot)

    Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)

    Chat GPTもClaude(クロード)も、AIを使ったウェブ検索に力をいれている。データ収集のためにクローラーが活動しているみたいだ。GoogleやBingのクローラーは定期的にいるが、急にふえたということはないので、地の利があるのだろう。とはいえ、情報の探し方もかわりつつあるので、この先はどうなるのかはわからない。ググるよりも、LLMにチャットで聞くほうが増えつつあるので。