#ai人工智能作图

既然跑通了midjourney的无值守全自动提交,那么我想晚上也应该让它有活干,首先得测试下批量midjourney生产器在夜间不发出干扰睡眠的亮度,目前想到的主意是合上笔记本的盖子但电脑不休眠。目前45分钟合盖状态下跑imagine autokeyword url程序,执行正常,今天晚上通宵继续测试。

我想让chatgpt写小说故事,然后把它转化为漫画分镜描述,用标记符号分割,批量提取输出到txt按行排列,到时候再用midjourney的imagine autokeyword url程序逐行读取去生成。不过看起来这个程序只需要分镜描述一个参数?那么url暂时为“ ”空格就好了,视情况之后再改。

我尝试通过一个梗概信息让chatgpt去编造故事的漫画分镜。

阅读更多

前几天midjourney的生产工具我自认为达到了一个不错的效率,大概3小时中断一次,然而月末时突然恶化为30分钟左右就断了。在好几次测试中断后,我觉得可能要换个平台了,另一方面我在想究竟是哪里出了问题导致频繁的中断呢,于是笔记本下载了一个captura同时买了另一个midjourney生产工具。另一个版本的工具有个优点是它是网页,它不会像先前那个版本莫名其妙强退,目前为止从没有强退过。在实战中发现这玩意儿能自动检测频次,5分钟内发起/imagine /blend基本会失败驳回,但这不会打断midjourney auto python,最后我在captura的录像中观察到问题出在了/blend /imagine命令输入后需要有一定时间等待sleep(10)左右,之前我是直接连着回车键有时候可能是网络原因来不及加载出命令,这会导致回车空砍从而还没出图片输入框就发动了点击图片输入框的动作请求(如下图,由于blend命令回车没起做用,图片输入框没出来接着去点击点到了临近的图片,再接着图片地址就跑到地址栏去了,后续全部崩塌),从而导致后面的逻辑全部崩塌。在修改这里的sleep等待后,目前验证10几小时都没出现过崩塌。

阅读更多

目前实测了3轮2.5小时也就是9000秒期间没有发生退出,都完整运行下来了,运行周期是3.1minutes/次,后两次测试发生了大量的队列占满不知道是不是频次太高?还需要进一步测试来确定,如果这个测试没问题,从早上8点开始到10.30一次,10.30到下午1点,1点到3.30,4点-7点。一天这么4轮感觉差不多,每40分钟断一次去折腾感觉还是会分神。

2024-8-20更新:

今天的3轮测试1次顺利。1次发生了不明原因的点击图片,导致后续出错,我不清楚这种情况是不是后续会自我调整回来从之前的记录看来好像是可以的。还有一次软件退出了。看来并不是完全稳定的,不过也不要太在意,总之继续观察运行状态。

blend使用方面经过这两天的测试,目前我想到的用法如下:

1.为整体建筑装饰添加某种色调或者图案风格,比如图2是由图1中从左到右的f1 f2 f3 blend而成,这种blend3通过两个建筑的整体结构和排布来定出建筑风格基调确保出图结果为建筑整体,可以看出来较为优秀的结果是由f1中的柱式cornice解析插图和中式古建筑彩画解析图引导而成的,图3用极为不规则的壁画或者像图1这个集成电路抽象艺术来引导,彩绘、色调的重排就会十分“剑走偏锋”从而使得绝大多数情况不尽如人意。那么由此可以推断,想要“小幅度”(我所认为的小幅度,实际上这种色调、彩绘涂装对于世界范围内的建筑装饰可以说已经是构成另一个体系了)的对建筑装饰的色调、彩绘做创新、个性化,那么f1的原料图引导应该是对f2、f3中目标建筑整体构建拆分后给出个性化涂装色彩,这种pattern book式的部件解析图网上有不少关键词可以去生成所以问题不大。

不过这是针对一个20240804这一批次blend测试的结论,我还没有用这个结论优化f1来验证,理想中状态可以把龙凤热带壁纸和芯片电路抽象图先设法弄到建筑部件解析图上然后再来blend3可以使这两种十分大胆、随意的彩绘布置到任意的建筑整体立面上。

阅读更多

由于midjourney手动提交1天搞下来大改只能收集150个图,非常疲惫而且会经历排队等待、队列占满导致的沮丧、进退两难。于是我想捣鼓一个自动提交的程序,经过这一天我大概看出来行为模式是用建筑装饰特征的图+楼面房型排列来实现建筑风格的生产。根据chatgpt的说法可以根据屏幕坐标来控制.exe文件中的/blend 命令实现自动化上传?我觉得可以试试看,用笔记本电脑全天开着自动匹配来生成素材?一方面是穷举几个文件夹中的图片排列组合使用/blend。还有一个是/imagine + 关键词,关键词应该是一个txt文件按照行来读取关键词,关键词提前准备好。还有一个是/describe + 图片链接,图片链接这一块通过selenium交互浏览器,批量抓取pinterest收藏的facade。

以下4天的进度跟踪是/blend的实现。主要依托pyautogui控制鼠标和键盘行为,遇到的难点有中文路径,自动暂停、手动暂停与任务执行时间关系、状态的计算。在这个过程中我觉得自动暂停、手动暂停控制执行任务的这个逻辑可以通用到其他日后类似需求的程序当中。另外就是制作程序时,遇到需要时长测试的先把任务部分简化为print输出,把时长放缩使周期缩短,这样能快速调试。当然这一整天的程序逻辑部分我丝毫没有去研究,完全就靠人工智能的概率论去蒙,做到了我理想状态的“我不懂,但我知道随心所欲”。

阅读更多

之前效果都很差,没法看直到上周试用tripoai感觉一下子厉害了,然而它一个月生成24个,多了要收费。我去看了相关的几个项目,era3d、crm、triposr,安装环境简直都要晕过去了,在线测试下来效果也不好,且每个都需要安装大量的huggingface 上的模型,我不知道这些所谓的权重模型是否能共通,很多名字相同,估计应该是不行的。

阅读更多

通过给kimi chat和chatgpt输入我想设计的建筑所追求的精神意境。这些ai会具体去展开具体的多个方面,比如形态、外立面材料、颜色、装饰的手法、建筑风格参考等。这可以说是十分及时的拯救,因为当前我开始觉得有些厌烦了,如果文艺复兴式盒子房和玻璃盒子房还有中式屋顶的木架、木柱房再做几组估计就没有啥长进的东西了,无非细化雕刻和图案彩画,关于设计这块之前的方法看上去很唬人,实际上产出很低,运气成分太大,也就是说sd在创意这块有时候会很惊人,但是这种概率太低了,哪怕是有全自动批量跑图的插件,也没啥收获。而今天随着奇域ai和midjourney配合gpt文字引导后,真的有种生产力大跃进的感觉,一下子看到了希望,这才是搞了那么久准备的批量智能边缘、接缝matrix材质、内景伪装、批量材质添加所值得付出的东西,建模方面也有了新的挑战而不是那些程式化的东西反复炒冷饭。之前纠结于sd很大一方面是被网上铺天盖地关于sd建筑相关的视频唬住了,其实仔细想想那些玩意儿都是为了落地玻璃盒子房的,局限性趋近于无穷大,根本没有任何创意性,我后来验证了一下用sd跑之前给midjourney和奇域的关键词,果然是一塌糊涂。

提取组织语言开一个chatgpt或者kimi chat进行中译英,然后丢给midjourney即可。

阅读更多

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×