1787064.jpg

injustice1

GF  2023-08-23 13:40
([sell=0,money] [/sell])

Whisper最正确的使用方式——Colab云端跑模型

可能知道这个项目的人不多:https://github.com/Ayanaminn/N46Whisper/blob/main/FAQ.md

简单的谈谈这是什么概念。Large模型转录两个小时的音频,个人电脑要跑一下午,而且全程强度拉满,始终占用十几个g的内存。而这个项目仅仅需要10分钟。

缺点呢?几乎没有。唯一麻烦的地方在于需要先把音频先传到谷歌盘。即使把所有准备的时间加上也不过15分钟。转录asmr这种短时间的音频只会更快。

看到有帖子开发了Whisper转录后自带翻译的功能,只能说没什么必要。至少我个人更相信gpt4.0的翻译水平。
引用

至于双语字幕,ass格式的很明显比srt和lrc格式的更美观。这个帖子有一半的内容都是在切割和合并长时间的音频。对于asmr而言只需要看帖子里的翻译和生成双语字幕的部分。

105826.jpg

Leader Three

    雲端跑音頻確實不錯,不像文字和圖片容易被封

1787064.jpg

injustice1

B2F  2023-08-23 23:11
([sell=0,money] [/sell])

回 1楼(Leader Three) 的帖子

你说的是云端部署sd吗
谷歌查的很严的哈哈哈,封的很快

a869391dec6ea717.png

kb-note

因为你用的是cpu跑的吧

1540380.jpg

钙片使者

帮顶

1496506.jpg

ツカサ

但是gpt4.0要钱钱      ,我用云端加百度翻译差不多也还行但是如果一直有声音不知道为什么会乱轴,一直有声音他不会分轴

none.gif

148e183d

这玩意Google drive里mp4和aac都不显示,只能从本地上传,本地又很慢

1787064.jpg

injustice1

B7F  2023-08-30 12:01
([sell=0,money] [/sell])

回 6楼(148e183d) 的帖子

MP4会显示啊,aac没试过
可以先用ffmepg转音频

273719.png

基の神

研究一下

a4.gif

3fe154db

B9F  2023-09-02 20:58
(这个b很懒,没有个性签名)
研究了下,哥们用gpt4翻译的吗,colab里的那个gpt3.5用不了吗....有没有什么另外的翻译软件好用?     

1787064.jpg

injustice1

B10F  2023-09-02 21:57
([sell=0,money] [/sell])

回 9楼(3fe154db) 的帖子

那个项目已经放弃维护了,自带的gpt翻译是个半成品
建议用文字游戏翻译君,站内有人发了激活码生成方式

1422289.png

Dolce

lz大佬你之前发的RJ01077937的网站和双语台本能再发一次吗?那个帖子被屏蔽看不到了