セーブポイント

特にジャンルの決まってない雑記です。

機械学習

SDXLとComfyUIを触ってみた所感

最近はあまり画像生成について調べてなかったのですが、NovelAIから11月にNovelAI Diffusion Anime V3が出て、触ってみたら案外面白いかも?という感じだったので、そこらへんの感想とか考察とか書いておきます。 blog.novelai.net NAI Diffusion Anime V3 …

読み上げ白上フブキを作り直してみた

3ヶ月前くらいに読み上げ白上フブキを作っていたのですが、色々気になる点も多かったので作り直してみました。読み上げ白上フブキ 3.0です。 new-file.hatenablog.com ついでに、so-vits-svc向けのデータセットの作り方をメモ書き程度に解説しておきます。 …

読み上げ白上フブキ ver2.1 / so-vits-svc 4.0 解説

new-file.hatenablog.com この記事のさらに続きです。 モデルを作って普通に放置してたのですが、気がついたらひと月の間にリポジトリが消えたりバージョン4.0が出たりなんだりしてたみたいです。 今のリポジトリはここらしいです。(03/14時点) github.com…

読み上げ白上フブキ ver2? - 技術日記 2月9日号

昨日の記事の続き。 new-file.hatenablog.com 前回の記事ではDiff-SVCという手法を使ってみましたが、so-vits-svcってやつが良いらしい(上位互換?)ということでこっちでもやってみました。 github.com ↑は自分のforkです。gradioのUIを英語化したりして多…

読み上げ白上フブキが欲しいので作った - 技術日記 2月8日号

前々から声質変換とか音声合成に興味があって「やりたいな~」と思っていたのですが、Diff-SVCという手法(?)がすごいのでやってみた、という記事です。 日本語どころか、英語でもあんまりドキュメントっぽいのが無いな~って感じなのでざっくり解説。 作…

Hypernetwork学習の備忘録

AUTOMATIC1111版のStable Diffusion web UIを用いてHypernetworkを学習する際に得られた知見などの備忘録です。 ※機械学習モデルの訓練はあまり自分でやったことが無かったので、全然妄言を吐いている可能性があります。 基本 そもそもHypernetworkの学習を…

概略 Danbooruとは何なのか

最近、画像生成モデルの学習用データセットとして話題に上がることの多いWebサービス、Danbooru。 Stable Diffusionの亜種であるNovelAI DiffusionやWaifu DiffusionはDanbooru由来のデータを学習に利用していることを明言していますが、そもそもこれらの親…

画像置き場作った&拡散モデルすげえ~の巻 - 技術日記 10月6日号

前回の記事を書いてからも、ぽちぽちNovelAIで遊んでいる。 普通に生成された画像を眺めているだけでも面白いのだけど、せっかくだしイラストのギャラリーでも作りたいなと思い、作ってみた。 notfbk.mgcup.net 今回はとりあえずこれを作った話からしていこ…

NovelAI Diffusionを使ってみたけど、凄い(色々な意味で)

追記:NovelAI関係の話で話題に上がることの多いDanbooruについての解説も書きました。 new-file.hatenablog.com ※若干えっちな画像などが載っているので注意 今月3日に、NovelAIという海外のサービス上のおまけ機能として画像生成の機能が公開されました。 …

画像のモザイクを除去したりしてみる

DeepCreamPyという深層学習を利用したツールが面白いので紹介します。少し古いツールゆえ動かすための環境を整えるのに少し手こずったので、そのメモです。 ツールの名前からも分かる通り、まあ子どもには見せられないタイプのやつの話なので、そういったも…