效率翻倍!6 款不容错过的免费 AI 神器(六)
大家好,我是花生~
今天继续我们的 AI 效率神器推荐第 23 期,内容包括免费的文本转语音工具、AI 写真 / AI 音乐生成工具等。
上期回顾:
效率翻倍!6 款不容错过的免费 AI 神器(五)
大家好,我是花生~
今天继续为大家推荐一些好用的 AI 效率工具,包括图像矢量化、Midjourney 风格库、AI 免费图库、AI 音乐 MV 生成工具等。
阅读文章 >
在线试玩: https://huggingface.co/spaces/artificialguybr/Stable-Audio-Open-Zero
ComfyUI 插件: https://github.com/lks-ai/ComfyUI-StableAudioSampler
之前为大家推荐过 AI 音乐生成工具 Stable Audio,可以通过文本生成时长 3 分钟的高质量音乐。最近 Stability AI 宣布开源 Stable Audio Open 音乐生成模型(授权类型:不可商用),可以通过文本生成鼓点、乐器旋律、环境声音和配音,单次时长可达 47 秒。测试了一下它的生成速度很快,质量也相当不错,并且目前已经有 ComfyUI 插件可以使用了(需要至少 7G 的 VRAM),安装后即可在本地免费无限次生成高质量音乐素材。
网站直达: https://freeflo.ai/
Freeflo 是一个免费的 AI 绘画提示词灵感库,适用于 Midjourney、Adobe Firefly、Stable Diffusion 等多个平台,让我们能快速复刻某种风格或图像效果。其中还收录了多种 Midjourney 的 --sref 风格代码,并提供了丰富地应用效果展示;整个网页的交互做得很精致,浏览起来非常方便。
在线体验: https://huggingface.co/spaces/lllyasviel/Omost
ComfyUI 插件: https://github.com/huchenlei/ComfyUI_omost
Omost 是大神 @lllyasviel(controlnet、fooocus、ic-light 的作者)新推出的一个项目,借助大语言模型将简单的提示词优化为详细的、包含布局信息的形式,以生成高精度的图像。Omost 的运作过程主要有以下几个步骤:
- 接受用户给的提示词,比如 “A huge spaceship prepares to land on a lunar base(巨大的宇宙飞船准备降落在月球基地)” ;
- 大模型将其处理成一段更详细的描述,并总结一系列的 tag;
- 为画面的主要元素分配位置、占比、以及对应的关键词,比如 “飞船在画面中央”、“基地在画面右下角” 等;
- 根据处理好的信息生成高精度的图像。
在第二、三步完成后,如果你对大模型对生成的元素描述或者构图不满意,可以再发送指令要求其进行修改,比如 ”change the background into Galaxy“ 或者 “let the ship on the right side”。所有内容都设定好之后,点击左侧的「Render the Image」即可生成图像,最终得到的图像内容及构图都会和前面的设定一致。
目前 ComfyUI 中也已经有 Omost 插件可以使用,插件主要有两部分的功能,有需要的小伙伴可以自行安装:
① 通过大语言模型优化提示词并获取布局信息。这项功能可以单独使用,帮助我们获取更详细的提示词,精准控制画面构图。
② 区域条件控制:将布局信息转为为画布蒙版,这样用户能够更直观地指定图像中各个元素的位置和大小,从而生成更符合预期的图像。
网站直达: https://replicate.com/fofr/consistent-character
之前爆火的妙鸭相机将 “AI 写真” 的概念普及到大众之中,让我们知道借助 AI 可以无需真实拍摄就得到一套高质量的个人图像。不过目前好用的 AI 写真工具要么需要付费,要么需要用户自己通过 stable diffusion 工具来生成,对普通人来说门槛还是比较高的,而 Consistent-character 则是一套打包好的工具流,可直接免费使用。
这套工作流由 AI 大神@Fofr 构建分享,整合了 InstantID、IPAdapter、Controlnet 和 FaceDetailer 等多个目前热门的生成模型,来最大程度上保持人物形象特征的一致性。 你只需提供一张人物面部特写照片,加上描述词,等待几分钟就能生成 1-20 张同一人物不同表情和姿势的高质量图像,实测下来人物的面部相似度非常高。
在线试用: https://chattts.com/
Windows 本地安装包: https://github.com/jianchang512/ChatTTS-ui (文末有资源包)
ChatTTS 使用一款新的免费开源的文本转语音工具,可以将中文和英文文本转化为高质量的人声,适用于 AI 聊天机器人、角色对话、AI 播客、视频旁白等场景。它的生成速度非常快,效果很自然逼真,和真人几乎没有差别。
ChatTTS-UI 则是基于 ChatTTS 开发的一款本地 WebUI 应用, 一键解压安装后就能使用,非常简单。本地 WebUI 功能更全面,可以选择音色、调整语速,支持上传 txt 文件进行转换,且不受字数、使用次数的限制,非常适合对文本转语音有高需求的用户。
工具介绍: https://www.uisdc.com/pixverse
AI 视频生成工具 Pixverse 最近推出了一项新功能 Magic Brush,它与 Runway 的 motion bursh 类似,让用户可以自己选定图像的某个区域来设定运动方向和强度,从而更准确的控制视频的运动效果。目前支持同时使用 6 个笔刷,还支持 AI 智能识别画面元素,方便用户进行快速选择。
与 Runway 通过滑块来调节效果不同,Pixverse 是直接通过手绘线条来控制运动的,比如可以画抛物线引导球的运动,或者画曲线引导物体的飘动效果,元素的运动速度则是通过通过线条长短来控制,因此能实现的效果更复杂,用起来也更灵活。
以上就是本期为大家推荐的 6 款超棒的 AI 效率工具,如果对你有帮助的话记得点赞收藏或者评论支持一波,我会有更动力为大家推荐新的干货内容~ 想了解更多 AI 新鲜资讯的话,欢迎关注 优设 AI 自学网 和优设微信视频号,每天都会分享最新的 AIGC 资讯和神器,让你轻松掌握 AI 发展动态。也欢迎大家扫描下方的二维码加入“优设 AI 知识交流群”,和我及其他设计师一起交流学习 AI 知识~
另外我的最新课程《AI 视频零基础系统入门》已经上线了,对 AI 视频感兴趣的小伙伴不要错过。课程内容包括:
- 从文生视频、图生视频、视频生成视频、数字人视频 4 个方面,系统全面地带你了解目前主流的 AI 视频制作方式以及优缺点;
- 十余种热门 AI 视频生成神器用法详解,轻松掌握大神同款工具;
- 附赠课程专属工具清单,收录了近 300 款 AI 视频、音频、文案神器,全面赋能 AI 视频创作
- 高质量免费自学资源、最新 AI 视频资讯获取渠道全分享
推荐阅读:
深度解析!Midjourney 三大常用参数 --s/c/w 的区别与使用技巧
大家好,这里是和你们一起探索 AI 的花生~
之前为大家推荐了很多期 midjourney 提示词,然后有小伙伴问我推荐的提示词后跟着的参数,比如 --s 250、--c 6 等,是随便添加的还是有意识地用它们控制出图效果;如果是有意识的,又是如何确定使用哪一项参数和具体数值的。
阅读文章 >
一键复刻!12 组超惊艳的 Midjourney 风格代码推荐
大家好,这里是和你们一起探索 AI 的花生~
Midjourney 的 --sref random 随机风格功能推出之后,出现了很多对不同代码生成效果的探索。
阅读文章 >