最近发现家里附近2公里左右江宁路有个茑屋书店氛围不错去看了几次书,正当我对书店里的书做了一番准备想后期陆陆续续看时,我偶然间尝试用kimi概括整理电子书,发现它的概括整理还不错,花了一天时间手动复制章节给它概括。
chatgpt似乎不支持长文概括,或者说免费版的不支持,暂时还没找到可以免费用chatgpt4的办法。通义千问和kimi我测试后发现它虽然可以支持10几万字的长文本,但是长文本下要求概括章节则会发生假装概括的样子,比如让它概括第1章它会夹带其他章节的内容,为了使它的概括更为精确需要切分章节内容。手动搞,再一个个复制的话,一本40万字的书大约需要大半天完成。于是我想到自动切分章节,再用浏览器自动交互程序批量上传章节让kimi分析。
章节切分的逻辑是搜索第x章+“ ”(空格)到第x+1章+“ ”(空格),因为书中可能包含提及“第x章”的字符串因此首先要手动处理下每一章标题使其符合格式。通过这个程序能批量完成多本书的章节切分。