目前看来似乎发生在寝室的图基本可以得到理想的产出,应该是和参考图有关系,但是寝室参考图也包含两个人物面部并不清晰
于是我想了下基于原来工地那几个参考图强行用cref添加面部特征,并保留一些背影。
问题还是不少,似乎因为身材比例问题幼儿化了。
目前来看比较省事儿的做法是把觉得挑不出来的部分直接去掉工地参考图仅用3个人物画风参考作为引导去生成,以下是第2话中用这种方法补充的画:
若是用工地图作为参考往往会得到下面这种,场景整体大了,更为写实丰富但是人物细节很少,连续几幅这样的话就会显得十分苍白平淡,也可能每个画面16幅太少了?:
换脸似乎得基于画风相似的前提
2024-9-18更新:
我想了下目前还有个大问题是即使人物画风卡通生动些由于剧情平淡集中在工地日常又缺少对白所以会显得十分平淡,剧情的问题可能是人物设定太简单以及剧情要求太简单。对于chatgpt而言,它的一大优点是可以把许多东西大杂烩,强行把看似不合理的逻辑圆回来。所以我在剧情构造时就给片段,然后让它编造人物设定。再给剧情大纲,再根据上面这些写小说。根据百度ai的信息来看,200页漫画对应17500字,20页就是1750字,因此22页一话的漫画对应2000字左右的小说,然而chatgpt似乎再2000字限定时往往只能回复1000-1500字,有时也会2000字朝上,所以用3000字去限定要求。
20000字编写一个故事,故事内容大概为农民工艰苦工作起早贪黑,工地因房地产企业经营不善时常欠薪,工人受到包工头和房企的威胁,双方在争斗中勉强妥协,住宅项目勉强完工后,房地产处在摇摇欲坠中,工人们对接下来的生活充满了迷茫,房地产企业的管理层不知道未来何去何从,办公室一片狼藉似乎预示着人走茶凉,整个故事至少要有20个主要角色。 这个故事要写出过去房地产市场的繁荣,在大好行情下,各个房地产公司大肆扩张。工人们在行情好时虽然同样是超负荷工作,但经常深夜吃夜宵、烧烤喝酒。一些建材商随着行情发展赚的盆满钵满。附近的各种便利店、饮食店等等也生意很好。 随着房地产衰退周围的各种行业也陷入了衰退,不少小企业主入不敷出。 很多人不乏经济相关的研究学者也十分困惑这究竟是为什么。 工人在工地上时而发生工伤,却鲜有得到照看和补偿,城市的发展似乎代价就是这些工人的血汗。 要提到互联网行业发力冲击了传统的小商小贩,小商小贩在互联网+企业布局的商业中挣扎,一些人退出了市场,一些人依旧坚守着。 我希望最后是工人们各奔东西寻找新的生活方向,房地产行业不可避免地持续低迷,工人们所在的房地产公司倒闭解散了。 互联网公司的竞争使其员工仿佛和工地上的工人一样嗅探到了未来的阴影,这样的高歌猛进终有一天也会迎来泡沫的破碎 整个故事分10段,每段约3000字,我说请写第x段你就写第x段 请先把30个主要角色的人物设定详细写出来
人物设定手动复制到一个txt中,然后运行autochatgpt_每章剧情大纲.py,让chatgpt写每章的剧情大纲,并输出到文件夹以第x章大纲为文件名,接着运行autochatgpt_逐页描写小说命令.py让chatgpt根据人物设定以及每章剧情大纲写2000字小说,并输出每章内容到文件夹以第x章为文件名。最后运行autochatgpt_mangascription.py让chatgpt转换小说为漫画分镜和地点并提取出各话的分镜描述以及地点为txt。前两步由于带上了枷锁可能可以让chatgpt的“健忘症”改善,我在想其实这一套丢给kimi的话是可以利用发送文件作为参考使kimi基于整个前文来续写后面的故事的,这样的话理论上来说它写出来的东西应该是更有整体逻辑性的。然而我仅仅用第1章剧情大纲和角色设定,测试两次让它写3000字结果都没超2000字,看来要让它搞长文不太现实。我看了下网上有个ai小说家的收费应用,它这个每章节大约1200字和国内的文心一言、kimi高度重合,我怀疑可能就是调用那边的接口?小说方面暂时先放一放吧
挣扎与变革 互联网行业的迅猛发展使得传统行业面临巨大的压力,尤其是小商小贩和房地产公司。在市场剧变的背景下,吴峰、赵丽和陈教授的生活也发生了巨大的变化。李强和工人们在工地上的辛劳与困境更是体现了社会转型期的深层次问题。 吴峰决定进一步探索互联网的潜力,他开始尝试通过社交媒体平台推广自己的小吃摊位。他在自己的社交媒体账号上发布了各种促销活动的广告,还录制了一些自己制作小吃的短视频。尽管他并不擅长这些新技术,但他知道,必须适应这种变化才能生存下去。 “大家快来尝尝我们的小吃,还有优惠活动哦!”吴峰在社交媒体上发布了一条消息,“为了感谢大家的支持,我们现在接受外卖订单!” 这个举措虽然带来了些许的流量,但转化率并不高。吴峰感觉到,互联网平台虽然能带来新的机会,但也需要不断优化和调整。他决定聘请一个兼职的社交媒体专家来帮助他提高曝光率和用户参与度。 与此同时,赵丽的便利店也在努力适应互联网时代的变革。她与几个互联网平台合作,尝试将店里的产品上线销售,并提供送货服务。尽管这个过程充满了挑战,但赵丽还是充满了希望。她相信,只有通过线上线下结合,才能在这个变革的时代中找到新的生存空间。 “我已经和几个平台达成了合作协议,我们的产品也开始在网上销售了。”赵丽对店员们说道,“虽然这还只是开始,但我相信,通过不断的调整和优化,我们一定能够找到合适的市场定位。” 店员们纷纷表示支持,他们也意识到,只有适应市场的变化,才能确保店铺的生存和发展。 在工地上,李强和工人们依然在忙碌地工作,但他们的心情却越来越沉重。随着市场的变化,工地上的工作压力也不断增加。工人们不仅要面对缺乏物资和工具的问题,还要应对工资迟迟未能发放的困境。 王大壮在工地上和其他工人们讨论当前的困境。他们知道,互联网的发展不仅改变了消费模式,也在影响着工地上的材料供应和项目管理。 “互联网的冲击让整个市场都发生了变化,我们的工作也受到了影响。”王大壮说道,“虽然我们现在还在拼命工作,但未来的路却充满了不确定性。” 李强点了点头,他感到工人们的焦虑和无奈。他们的生活在不断地被市场的变动所影响,尽管他们努力维持正常的工作,但这种持续的压力和困境让他们感到力不从心。 在房地产公司的办公室,郑总和杨小辉正在讨论公司未来的发展方向。他们知道,传统的房地产模式已经难以适应市场的变化,必须寻找新的业务模式来应对挑战。 “我们需要寻找新的增长点,互联网行业的崛起是一个重要的信号。”郑总说道,“如果我们继续坚持传统的房地产模式,可能会被市场淘汰。” 杨小辉点了点头,他已经开始研究如何将互联网技术应用到房地产行业中,包括通过线上平台来销售房产、提供虚拟现实看房服务等。他知道,这些措施虽然能带来一些新的机遇,但也需要克服很多困难。 “我们必须在互联网时代中找到新的业务模式,否则公司可能会陷入困境。”杨小辉说道。 陈教授的研究也在不断推进,他对市场的变化有了更深入的理解。他发现,互联网不仅改变了消费者的购物习惯,还深刻影响了整个经济结构。传统行业的衰退和新兴行业的崛起是市场变革的必然结果。 “互联网带来了新的经济模式,这种模式正在重新定义整个市场的运作方式。”陈教授在他的研究论文中写道,“虽然这种变革带来了巨大的挑战,但也提供了新的机遇。” 在工地的宿舍区,李霞和其他工人们讨论着未来的生活和职业规划。他们知道,市场的变化已经深刻影响了他们的工作和生活,他们必须找到新的方向来应对未来的挑战。 “我们必须考虑如何适应市场的变化,寻找新的生活方向。”李霞说道,“虽然现在的困境很困难,但我们不能放弃。” 工人们纷纷表示同意,他们开始考虑是否应该寻找其他的工作机会,或者在市场回暖之前找到其他的生计方式。 在这个充满变革的时代,吴峰、赵丽、李强和其他人都在努力适应新的市场环境。他们知道,只有不断调整和优化,才能在这个快速变化的世界中找到新的生存和发展机会。 根据上面的故事请你给出符合剧情的22个漫画分镜描述,并给出每个分镜描述发生的地点,然后再给出分镜描述的英文以及发生地点的英文。 英文版中所有人的人名都用其职业身份代替,并且英文版中要求在最后逗号隔开注明发生的地点,例如As a new worker, Xiao Chen is a bit flustered, and Old Wang patiently instructs him.应该改为As a new worker, a worker is a bit flustered, and a worker patiently instructs him, in construction site , 中文版的人名保持正常 你的回答格式应该是这样的 第3话:工地上的午饭 1. 场景: 凌晨,宿舍区昏暗,手机闹钟响起,显示时间为3:00。老王伸手关掉闹钟,表情显得有些疲倦。 英文: In the early morning, the dormitory area is dim, and a phone alarm rings at 3:00 AM. A worker reaches to turn it off, looking weary. 地点:宿舍区 Location: Dormitory area. 2. 场景: 老王起床,动作沉重,背后镜头显示他简单地穿上了工地工作服。 英文: A worker gets up, moving slowly, as seen from behind, putting on his work uniform. 地点:宿舍区 Location: Dormitory area. 3. 场景: 镜头转向大壮,他也在沉默地穿好衣服,脸上的疲惫感明显。 英文: A quiet worker is also putting on his clothes, with a tired expression visible on his face. 地点:宿舍区 Location: Dormitory area. 请提供第6话分镜描述
2024-9-19更新:
昨晚想用drissionpage在笔记本运行批量midjourney结果失败了,昨晚的pyautogui似乎由于telegram弹出窗口导致乱套。早上把new_tab去了可以运行了,运行了20几轮好像由于我在执行任务期间在页面中有鼠标干扰导致出错退出了,继续测试笔记本电脑的drissionpage。suno音乐方面我想和城市风光、自然风光的视频配合起来,看看能不能在bilibili、youtube、抖音、小红书之类的平台吸收些关注。花了0.5元买了900gb视频,百度这边速度好像提不起来,一天24小时全开大概就是下载12gb的样子,随它去咯,反正笔记本需要长期持续运行midjourney批量生产。笔记本晚上睡觉的时候注意音响调整静音,今天一早被吵醒了。
drissionpage再进一步测试中发现若是受到暂时网络问题没刷新出来页面的话,后续就会中断,根据🔦 找不到元素时 | DrissionPage官网的信息来看似乎加上tab.set.NoneElement_value(‘没找到’)能避免程序中断退出?我让chatgpt看了一下这个文档它也说可以,等待实测观察。
实现了hexo自动生成markdown语句排版漫画附带分镜描述。
晚上测试了下修改要求用“请根据上述的人物设定以及剧情大纲用约3000字左右描写第1章,注意必须超过2000字!”使得字数方面确实偏向了2000字,但是超的太多到3000字会使chatgpt单次回复受到限制中止从而失败,因此我调整为“请根据上述的人物设定以及剧情大纲用约2300字左右描写第{chapter_number}章,注意必须超过1800字不能超过2800字!”效果还可以。
然后是转换分镜,之前是人物设定+小说剧情+要求命令,这一套chatgpt不吃,kimi倒是可以理解,然而kimi有诸多政治考量会导致频繁的中断,我研究了下把要求命令前置基本可以解决。
2024-9-20更新:
drissionpage控制midjourney生产器在本机短时间批量比如30-50个左右任务还好,由于目前无法解决刷新页面加载失败退出程序的中断因此过夜这种批量没法交给drissionpage,昨天晚上用pyautogui到第二天中午没毛病。
chatgpt编写小说章节当其参考的人物设定过多,我用88个角色测试它就不行了,70个的时候还行。另外chatgpt在字数要求方面距离我的命令偏差较大大多数情况下字数远远不能达到要求的2000字,有时则严重超出导致程序中断。我今天发现抖音的豆包在长文本设定要求下对命令的执行相对现存的所有ai而言是最为优秀的,kimi虽然也能接下15000字以上的命令,然而它的输出仍然受到字数问题困扰。豆包单次甚至可以输出5000字以上而不被打断,这个输出有了很大的“让步”空间。最终我设定“{character_settings}\n\n剧情大纲\n\n{chapter_outline}\n\n请根据上面的人物设定以及剧情大纲用约2000字左右描写第{chapter_number}章,必须超过1800字不能超过2600字!注意要以“第{chapter_number}章开始:”+章节标题开始,以“第{chapter_number}章结束:”结束。”目前出来的结果没有超过3000字的,也没有少于2000字的。其输出速度也相对chatgpt稳定,我设定3-4分钟生产提取一章节内容,测试到23章没毛病。29章不知道什么原因没提取出来,30、31章都顺利提取了。
我手动测试了一下豆包也可以完成小说内容转换分镜的任务,同样,chatgpt在人物设定过长时就没法干这个了。
这回搞62章节不知道会产生多少location需要midjourney去生产参考图,另一方面是人物设定设计许多外国人种,看样子是要搞第二个midjourney账号同时工作了。50个location跑8种风格要求(包含尺寸、有无参考图)需要2天整。
在没有足够剧情提示的情况下豆包的写作容易陷入循环,相比于chatgpt而言豆包的大纲明显减少了情节的重复循环并照顾到了“各个角色的戏份”,在大纲限定的情况下似乎没办法让豆包再照顾到手法吧?不过豆包中可以上传文件,这意味着每次提取的章节可以串起来,上传作为参考依据写下文?
2024-9-22更新:
完成了地点匹配地点参考图片链接的程序,利用的是discord上传图片保留图片文件名,注意在生产地点图时要将地点放在最前面,不然会因为文件名长度限制导致地点无法完整加载到文件名。今晚测试一下加了地点和人物风格参考的房地产萧条工地生活第1话。
2024-9-23总结:
经过两天生产对比无参考图直出分镜描述漫画,和带人物、地点参考图的分镜描述漫画。可以看的出来有参考图的版本明显起到了统一画风和地点的效果,为了验证这一点我想再测试一话看看。
然后重点是剧情和对话,人物动态,因此需要预定角色以及各种神态。可以看到一些大众漫画中采用了大量的头像 head view 、头肩像head and shoulder view、半身像。
人物设定属于日常像suno音乐抽卡一样的工作,然后当要搞一个漫画就从人物池中抽取一些作为各个角色,再对它们生产各种表情。到时候只要vary region用cref换脸,就可以迁移画风的情况下替换角色。从下面的测试来看,即使表情不一样都可以迁移,所以表情扩展可以不急着搞,另外性别也不会受到限制。
head portrait 3/4 profile view , a man angry shouting , vivid facial expression , ultra detail , high resolution , high contrast , japanese manga, black and white ,inked lines , –cref https://s.mj.run/CieAR4Cpg_I–cw 0 –niji 6 –ar 2:3- Variations (Region) by
head portrait view , a man feel depressed , vivid facial expression , ultra detail , high resolution , high contrast , japanese manga, black and white ,inked lines , –cref https://s.mj.run/CieAR4Cpg_I–cw 0 –niji 6 –ar 2:3- Variations (Region) by
评论