マスクといえば、女の子二人の画像を
Photoshopでマスクをかけて一人だけにして、かけた画像をPNG書き出ししたら当然女の子ひとりで背景は透過の画像になるけど、それをi2iのダンボール分析かけたら2girlsって出るのよね
背景と女の子の画像で女の子を切り抜いても同じで背景のタグが出る

切り抜いた画像を単色背景と合成して透過じゃ無くせば出なくはなるんだが、もしかして透過PKGを学習素材にしたら意図しない情報も拾って学習しているんじゃないだろうか