関連検索ワード
新着
帯椀 稀能毘
#画像生成AI
#AIグラビア
#FLUX1

帯椀 稀能毘
#画像生成AI
#AIグラビア
#FLUX2
ようやくComfyUIがFLUX.2Klein正式対応になったので、9B用のワークフロー落として動かしました。
謎のエラーが頻発していたのは、どうやらテキストエンコーダーが原因だったようです。4Bと9Bで共通じゃないのね。9B用とされるエンコーダー(Quen3-FP8-8BMIX)に変えたら動きました。
ただ、推奨セッティングの4ステップ生成だと、FLUX系では珍しく腕の生成不良がいきなり出たので、一体化されてるワークフローを分解して、8ステップ生成に設定変更してます。
画像は前に挙げた紫髪のお嬢さんのプロンプトをほぼ流用して、バックをプールに変えてます。「紫ベースの多色髪」というプロンプトはちゃんと再現されましたが、髪の長さはベリーショート設定でもこの長さでした。
ただ、Z-Image-TurboもFLUX.2Kleinも、AI作画の天敵と言われる腹ばいをいともあっさり作画してくれるので、今どきの画像生成AIはすごいと思います。

帯椀 稀能毘
先日リリースされたFLUX.2の新バージョン「Klein」のテスト生成をしてみました。ただ、ComfyUIの正式対応がまだのようなので、とりあえずFLUX.2Div用のワークフロー使いました。ところがKleinの2バージョンあるうちのサイズの大きい9Bモデルのほうが、このワークフローだと謎のエラーを吐き出して生成ができず、今回は超軽量仕様の4Bモデルだけテストしました。
ということでFLUX.2Kleinです。モデルデータは4Bと超軽量で、高速化を重点に開発されていて4ステップ生成。FLUX.2のアーキテクチャーはそのままなので画像修正もできる点がZ-Image-Turboより上回る一方、NSFWフィルターが入っていて、際どい表現ができないっぽいです(未テスト)。
なお、テキストエンコーダーはFLUX.2DivのMistralから、Z-Image-Turboと同じQuen3に置き換わってます。
で、テスト生成です。1枚目/3枚目がFLUX.2Klein、2枚目/4枚目がZ-Image-Turboです。モデルさんのかわいさではZ-Image-Turboかなと思う一方、FLUX.2Kleinの真骨頂はその生成速度で、このくらいのカットだと、うちの環境でも1ショット約10秒という超高速で生成してしまいます。多分、もうちょっと上等なGPUだったらほぼ瞬間で生成できる感じでしょう。実際、「リアルタイム生成」を目指している旨のコメントも有りました。
FLUXの絵柄なのでクセがないのはいいんですが、検閲入りなのがなんとも微妙です。どこまでできるかテストしてからでしょうか。ちなみにZ-Image-Turboは無検閲です。
#画像生成AI
#ZImageTurbo
#FLUX2
#AIグラビア




帯椀 稀能毘
引き続き最新鋭生成AIのテスト生成です。
同じプロンプトを放り込んで、それぞれのAIの表現の違いを見てもらいましょう。
プロンプトは例の「冬のデートコーデ」の写真をGeminiにプロンプト化してもらったやつで、画像は順にZ-Image-Turbo(ノーマル・9ステップ)Quen-Image-2512(ターボLoRA・8ステップ)FLUX.2(ターボLoRA・8ステップ)と、参考用に服装プロンプトだけ流用してSDXLで生成した画像。
まあ仕上がりは見ての通りです。
参考までに、後でコメント欄にオリジナル画像貼っておきます。
仕上がりが互角なら、生成速度が圧倒的に早くて生成ガチャができるZ-Image-Turboがユーティリティー的に圧勝となります。カスタムチェックポイントがそろそろ揃ってきてるだけに、ある意味今のSDXLの後釜としてカスタマイズの幅の広い生成AIとして重宝されるような気がします。Quen-Image-2512ほど画質にクセがなく、FLUX.2ほど要求スペックも高くないだけに、使い勝手がいいのも強みとなりそうです。
#画像生成AI
#ZImageTurbo
#QuenImage
#FLUX2




帯椀 稀能毘
プロンプトは至ってシンプルに、右の画像を与えて「車の色を青から赤に」お願いしただけです。
ターボLoRA入れて4ステップで生成されたので、一旦モデルがロードされれば電光石火です。
Flux.1Kontextとどっちがいいかとなると微妙ですが…。
#画像生成AI
#QuenImage


帯椀 稀能毘
とりあえずサクッと動かしてみましたが、初回生成はただでさえ重たい仕様に加えて50ステップ生成だったのでとんでもなくては時間がかかりまして。
ComfyUIのテンプレートのワークフロー使ったんですが、中身が一体化されてるのでとりあえずフルオープンして中身を確認し、ついでにライトニングの4ステップ生成のワークフロー(通常版と並列になってました)をばっさり削除して、LORAロード用ノードだけをメインのワークフローに移植し、LORAは8ステップ仕様のをセットしてテスト生成しました。
作例は今夜にでもアップしますが、全体的にバキバキのCGっぽい仕上がりになります。再現性はさすがですが、絵柄はちょっと好みが分かれそう。生成速度やら再現性やら考えると、同じ開発元(アリババ)のZ-IMAGE-TURBOの方が使い勝手は良さそうです。
今夜は、QUEN-image-edit2511の導入をやる予定です。コレも参照画像を取り込むタイプです。FLUX.1-kontextと競合する事になりますが、さてどっちがつかえるか。
#ひとりごとのようなもの

たすく
unionとfluxって滑りのちがいわかるかな
早く滑りたい


もっとみる 
