日记

这两天开始测试midjourney自动blend批量生产建筑装饰创新,目前遇到的问题是经常会退出断线,断线频率在1小时左右,原因目前不明,要保证每组blend尽量少的损失么,把单次自动暂停设置为40分钟比较好,省的总是心里不踏实要两边跑。在下载方面为了避免频道闪退,在一开始保证prefer auto dm即可把输出给到midjourney bot而且这样做不用按u键放大,在浏览器打开图片,用copytab插件批量复制url,再用wfdownloadapp批量下载图片。大约50分钟停一下去房间里新开一个频道,然后o键继续,目前由于是刚开始还没适应这种模式,其实这个模式倒是蛮符合我开始设定的每天定时工作流的。

几天下来,差不多是一天200个图,这还是我有选择的下载并不是所有的图。目前我还没有明确的下载依据,就是随着眼缘。一开始用这套自动化程序的目的是为了产出新的建筑装饰、多样的房型排列、图案、雕塑。目前我还没有进一步对产出的图做系列扩展,在midjourney本身的体系是用vary strong/vary sutble来扩展,那样虽然连续性高,但是难以从住宅、办公楼、医院、学校、商场这样的不同建筑类型来形成系列。我们说罗马建筑、art deco建筑、中式建筑等等都伴随着一些建筑装饰、部件、图案、雕塑应用在不同功能的建筑上。比如希腊柱式用到艾欧尼亚建筑可以在市政厅、财宝储藏室、神殿、运动场、剧院等多种建筑上。在midjourney中的扩展,我的思路是/imagine a building/an apartment building/a city hall/a shopping mall + 图片链接 –iw 2-3 iw越高风格和原图越像,这样可以使一个局部装饰部件或者完整的建筑转化为指定的建筑类型,从而扩展出全系列建筑,甚至可以通过图片本身的特征自定义出一种全新功能的建筑。就好比剧院、运动场这些,中式建筑基本是空白,那有没有可能构造出来?更进一步就是构造出当今世界还不存在的建筑类型,那么是先有某种活动还是先有某种建筑?像下面3组图,一眼望去会觉得很诡异,确实有许多一时间难以用语言形容的部件、材质、布局、色彩、装饰手法,但同时很难去构思说这样的装饰传达了什么情感可以作为什么历史上从未出现过的建筑功能,衍生出独特的人文,这部分可以让文心一言ai试试看。

阅读更多

由于midjourney手动提交1天搞下来大改只能收集150个图,非常疲惫而且会经历排队等待、队列占满导致的沮丧、进退两难。于是我想捣鼓一个自动提交的程序,经过这一天我大概看出来行为模式是用建筑装饰特征的图+楼面房型排列来实现建筑风格的生产。根据chatgpt的说法可以根据屏幕坐标来控制.exe文件中的/blend 命令实现自动化上传?我觉得可以试试看,用笔记本电脑全天开着自动匹配来生成素材?一方面是穷举几个文件夹中的图片排列组合使用/blend。还有一个是/imagine + 关键词,关键词应该是一个txt文件按照行来读取关键词,关键词提前准备好。还有一个是/describe + 图片链接,图片链接这一块通过selenium交互浏览器,批量抓取pinterest收藏的facade。

以下4天的进度跟踪是/blend的实现。主要依托pyautogui控制鼠标和键盘行为,遇到的难点有中文路径,自动暂停、手动暂停与任务执行时间关系、状态的计算。在这个过程中我觉得自动暂停、手动暂停控制执行任务的这个逻辑可以通用到其他日后类似需求的程序当中。另外就是制作程序时,遇到需要时长测试的先把任务部分简化为print输出,把时长放缩使周期缩短,这样能快速调试。当然这一整天的程序逻辑部分我丝毫没有去研究,完全就靠人工智能的概率论去蒙,做到了我理想状态的“我不懂,但我知道随心所欲”。

阅读更多

txt版本切分章节不能包含图片,而且大多数电子书不是txt而是pdf或者epub。最近找到个很强大的电子书网站汇书网,不少书都能找到文字型pdf。修改pdf15mb以内的可以上iLovePDF | Online PDF tools for PDF lovers上修改标题以确定章节分隔标识符,pdf切分还有个好处是可以保留书中的插图,然而kimi、百度、阿里的ai目前还无法解读图片内容,所以艺术建筑装饰绘画类的书籍没法给出更进一步的启发,不过现在图像识别技术已经很成熟了估计再过段时间会支持。我测试了下按照章节切割数理类的书籍让kimi解读,也可以获得概要以及让它扮演提问型研究员和出题老师促进学习。

阅读更多

最近发现家里附近2公里左右江宁路有个茑屋书店氛围不错去看了几次书,正当我对书店里的书做了一番准备想后期陆陆续续看时,我偶然间尝试用kimi概括整理电子书,发现它的概括整理还不错,花了一天时间手动复制章节给它概括。

chatgpt似乎不支持长文概括,或者说免费版的不支持,暂时还没找到可以免费用chatgpt4的办法。通义千问和kimi我测试后发现它虽然可以支持10几万字的长文本,但是长文本下要求概括章节则会发生假装概括的样子,比如让它概括第1章它会夹带其他章节的内容,为了使它的概括更为精确需要切分章节内容。手动搞,再一个个复制的话,一本40万字的书大约需要大半天完成。于是我想到自动切分章节,再用浏览器自动交互程序批量上传章节让kimi分析。

章节切分的逻辑是搜索第x章+“ ”(空格)到第x+1章+“ ”(空格),因为书中可能包含提及“第x章”的字符串因此首先要手动处理下每一章标题使其符合格式。通过这个程序能批量完成多本书的章节切分。

阅读更多

kimi ai可以对大段文字做提炼概括、归纳,这对于想要了解一些其他领域的书籍、资料是极强的助力。不过kimi的页面没有滚动条,应该是js分页读取数据,没法用ctrl f全文搜索,因此对于长文归纳需要及时将其答复复制到别的地方整理起来,以免后期需要漫长的翻页摘取。

我本来想陆陆续续去新闸路图书馆看理想国系列的书,现在看来对于感兴趣的书都可以用kimi过一遍大致内容,今天测试了下800多页的娜塔莎之舞用了半天就过了大半。接下来我把kimi提炼的娜塔莎之舞整理一下,看看zhihu这边复制到obsidian再到hexo能不能自动转换标题。

2024-7-18更新:
测试下来可以,hexo里面##+空格为章节标题,###+空格为每一节,####+空格为每一小节

阅读更多

昨天买了一个共享版midjourney,不过这玩意儿涉及discord,一直以来我都没在意,要用时切换到全局代理,但如果要长期高频率使用midjourney那就麻烦了。网上一些教程说的玄乎,其实就是把几个域名在规则中设置为节点选择,节点改成美国的代理就好了。另外service mode安装不知道是不是起到了做用,以后再说吧。

同时也解决了我自己的日记本zhudian.xyz hexo博客访问加载慢的问题。

阅读更多

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×