互联网创业圈 > 前沿 > 正文

视频版大爆炸来了,剪辑可精准到每个字,支持中文Demo可玩,老罗:打钱

来源:IT之家    2023-06-29 11:55   阅读量:18406   

现在剪视频,已经可以精准到每一个字了!

只需点击你要删减或者要留下的单词,AI 分分钟都能给你整出新的视频来。

这操作,有点大爆炸功能内味了。老罗:打钱!

不管是 MV、访谈、电影片段各种类型视频,也不论有无字幕,通通不在话下。

网友们纷纷开始试玩了起来。比如让 rick roll 鬼畜起来~

就连中文视频也能 Hold 住。实测 Demo 发现,它甚至直接翻译成了英文。

不过这也并不影响整个操作,毕竟背后模型是支持中文在内的多个语言的。

精准到每个字剪视频

只需三步,就可以轻松完成精准到字的视频剪辑 ——

上传视频、选择删减 / 留下的单词、下载视频。

释出的有三个示例,烹饪的美食视频、小扎采访、以及「Just Do IT」……

当然你也可以自己试玩,各种语言都能识别。比如就以让子弹飞一段经典对白为例。

绿色代表保留,红色代表删除。你有三种选择:剪辑、选择所有单词、重新设置。

任意选择保留单词之后,就可以「Cut Video」了。此处选择两处跳脱的台词。最终只花了不到十秒钟就完成了剪辑。

画面切换可以说是十分顺滑了~ 整个 Demo 试玩在 T4 上运行。

基于 Whisper 模型

这是个荷兰开发者 Matthijs Hollemans 在 HuggingFace 上基于 Whisper 开发的新功能。

Whisper 是 OpenAI 于去年 9 月开源的语音识别神经网络,经过 68 万小时的多语言和多任务监督网络数据的训练,其鲁棒性和准确性接近人类水平。它可以进行多语言转录,以及其他语言将翻译成英文。

它是基于 Transformer 端到端实现架构,无需任何微调。输入音频被分成 30 秒的块,转化为梅尔倒谱,然后传入编码器。

好了,试玩 Demo 在此,感兴趣的旁友可戳:

参考链接:

广告声明:本文含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考。IT之家所有文章均包含本声明。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

图文

热点

四叶草美学设计!米家全效空气净化器Ultra
四叶草美学设计!米家全效空气净化器Ultra图赏
9月26日,小米发布史上最强空气净化器——米家全效空气净化器...[详细]
最大40dB深度降噪!荣耀亲选Earbuds
最大40dB深度降噪!荣耀亲选Earbuds X3真无线耳机图赏
近日,荣耀亲选EarbudsX3真无线耳机发布,这是一款全入...[详细]

Copyright @ 2008-   www.43710.com   All Right Reserved Powered by 互联网创业圈版权所有

网站地图   联系邮箱:ha17701574748@163.com  备案号:沪ICP备2022017705号

版权声明:本站文章均来自网络,不代表本站观点。如对内容有争议,请联系客服。