由于midjourney手动提交1天搞下来大改只能收集150个图,非常疲惫而且会经历排队等待、队列占满导致的沮丧、进退两难。于是我想捣鼓一个自动提交的程序,经过这一天我大概看出来行为模式是用建筑装饰特征的图+楼面房型排列来实现建筑风格的生产。根据chatgpt的说法可以根据屏幕坐标来控制.exe文件中的/blend 命令实现自动化上传?我觉得可以试试看,用笔记本电脑全天开着自动匹配来生成素材?一方面是穷举几个文件夹中的图片排列组合使用/blend。还有一个是/imagine + 关键词,关键词应该是一个txt文件按照行来读取关键词,关键词提前准备好。还有一个是/describe + 图片链接,图片链接这一块通过selenium交互浏览器,批量抓取pinterest收藏的facade。
以下4天的进度跟踪是/blend的实现。主要依托pyautogui控制鼠标和键盘行为,遇到的难点有中文路径,自动暂停、手动暂停与任务执行时间关系、状态的计算。在这个过程中我觉得自动暂停、手动暂停控制执行任务的这个逻辑可以通用到其他日后类似需求的程序当中。另外就是制作程序时,遇到需要时长测试的先把任务部分简化为print输出,把时长放缩使周期缩短,这样能快速调试。当然这一整天的程序逻辑部分我丝毫没有去研究,完全就靠人工智能的概率论去蒙,做到了我理想状态的“我不懂,但我知道随心所欲”。