抹茶もなかさんのプロフィール画像

抹茶もなかさんのイラストまとめ


AIモデル開発したりシステム作ったりしてる人。首都圏近郊メインで釣りもしている GitHub: github.com/mattyamonaca note: note.com/mattyamonaca

フォロー数:671 フォロワー数:11151

えー先程パターンノイズが繰り返されるのToken予測モデルだからでは?という発言をしましたが、同じToken予測系の画像生成AIであるOmniGen2でバケツ塗り画像を作って可視化した所以下のようなったため、皆様の指摘通り電子透かしだと思われます
Token予測モデルは精度上がればバケツ塗りできそうやね https://t.co/G7hWcooYfD

130 617

僕がちまちま研究しているレイヤー分け手法はこの辺をかなり色々頑張っていて、今だとパラメーター設定ほとんどせずにこれくらいの精度は出るようになってるんだけど、それでもやっぱり領域の境界周りは精度が悪化するし、最終的に全要素を重ねた時のはみ出しにつながるので頭を抱えている https://t.co/3uilwA25Zi

1 15

例えば雑にk-meansとかでピクセルに対してRGB値でクラスタリングかけて階調数を12まで落とすと一枚目のようになりマスクとして使えず、逆に6まで落とすと2枚目のように統合されすぎて使えず、ということになるので精緻なマスク画像の作成は思った以上に難しい
(細いパラメータ設定が必須)

35 233

nanobanana proもベタ塗りできてるように見えて、解析かけてみると全然ベタ塗りじゃない(すごく近い色だけどRGB値が微妙に異なってる)んだよな
これが解決されないと一生正確なマスク画像が作れなくてレイヤー分け処理が上手くいかない
(近似色の統合処理を挟むとどうしても精度劣化する)

342 1770

nanobanana背景透過できない問題、雑に解決するならこの辺かなぁ
nanobananaでアルファ値の代わりに透過したいところをグレスケ画像として生成して、元画像のアルファ値に生成結果を挿入すれば透過画像にできる
(なお本体である抹茶もなかは消えた)

11 46

おかしいだろ!!!!

0 12

ちょっと無理そうですね...

0 2

う〜〜んフラット化はイマイチかな〜〜

4 4

Framepack 1f-mc、二枚以上の画像を生成条件にしてもちゃんと生成結果を制御できるのか実験
前に作った背景を維持したままキャラクターリファレンスができるモデルに、さらに顔の配置場所を制御できるよう追加の学習をしてみた
赤枠のサイズ次第でキャラのサイズ調整もできそう

9 76

Framepack 1Frameについて、複数の画像を生成条件として入力できるようにしたmusubi-tunerを自分のリポジトリに公開しました(ツリーに添付)
例として、背景とキャラクターの二つの画像を渡すと、背景をほぼ完全に維持したままキャラクターの特徴だけ再現して画像を生成できるモデルも公開しています

38 161