2024-10-15-hitomi与kimi与简映实现youtube外语视频搬运转中文字幕配合中文朗读

先概括一下流程:
hitomi下载youtube视频自带英文字幕,把字幕分组1次20组发给kimi、doubao这些人工智能让它们翻译,大约间隔70秒左右,得到拼接版之后视情况使用不同的格式化python程序调整字幕格式,简映导入中文字幕和youtube视频,视频消音,字幕全选朗读选一个声音,关闭这个视频制作草稿,打开铃芽选中刚才的草稿点击启动使字幕和语音对齐,目前看来不同的音源语速不同会导致和视频的时长偏差不同,尽量接近些吧?然后调整视频的时长同步字幕时长即可。

之前一直用y2mate、savetube、savefrom之类的网页下载youtube,很不稳定还要看广告,hitomi下载很稳,gui版界面上设置代理127.0.0.1和端口7890,内置浏览器登录一个chrome账号即可开始下载了。它似乎内部自带人工智能可以生产视频的英文字幕,我试了下中文的没法直接生成,于是可以用kimi做分段式的翻译再拼接起来,这个程序折腾了我蛮久的,一开始是用chrome插件提取字幕,但那个是不完全的需要做比较复杂的格式化。另一个问题是kimi翻译输出的字幕换行空格有问题,目前还没办法一步到位,但可以在输出后做一次转换解决换行空格格式问题。我一开始用的chatgpt,起初40组1次提交没问题时间长了chatgpt和kimi都不行了,之前我不知道hitomi的英文字幕自动生成,那只有这俩可以,如果是英文么文心一言、doubao都可以用了,不过保险起见还是20组一次,目前来看40分钟内的视频没太大压力,另外我优化了程序让掉线以及没找到翻译输出的情况下发起重试,优化之后的还没在实战中遇到网络问题等而验证以后再说。
2024-10-17更新:
测试了下doubao、文心、通义、deepl翻译方面存在格式化问题,丢失,说不清的异常错误,总之就是没法用,看来字幕格式翻译只能交给kimi,另外验证了网络问题下,retry有效果。遇到了一种新的输出格式又折腾了蛮久的,抽空看看把这种格式化拼接到kimi字幕翻译上。

简映视频编辑器的好处是直接发布抖音省的再多步骤,它里面自带把字幕解析朗读选多种声音的功能,我今天试了下5.9破解版可以把vip功能和声音选项都免费使用。直接生成的阅读和字幕以及视频画面对不上,用铃芽这个程序解决了字幕和朗读同步同轨,然后就是把视频的时间长度手动输入同步字幕即可。
这样的话我想1天搬运3个左右的视频分享,看情况吧,之后可以考虑注册多个账号分布式发,前两天解决了邮箱批量注册问题,把域名交给cloudflare管理,可以添加电子邮件服务,看起来是可以通过drissionpage进行批量提交从而实现大量的[email protected]邮箱,然后指向我的qq邮箱来接收验证码。之前suno卡掉我的微软、discord账号也可以用这个办法来搞邮箱而不用每次网易注册都要短信验证、密码什么的再来一遍。
另外chrome这两天似乎不好申请了,我想就不申请了,每天20首也差不多了,出产少一点就少一点吧,太多了真是听不过来。

2024-10-20-midjourney漫画带分镜描述简易版小镇喧嚣第11话 2024-10-10-midjourney漫画带分镜描述简易版小镇喧嚣第10话

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×