整理一下最近了解到的AIGC工具

这篇具有很好参考价值的文章主要介绍了整理一下最近了解到的AIGC工具。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

好久没有写csdn博客了,突然不知道写点什么,最近AIGC真的很火,有一种三天不看就跟不上发展趋势的感觉,让人又激动又有点慌😂。这里我简单整理一下最近看到的AIGC的一些内容,后续如果有需要我详细描述一下如何使用。

AIGC类型

AIGC现在发展可以说是‘坐地日行八万里’了,总的来说我将目前技术较为成熟的AIGC工具大概分为三种类型,图像生成类,文本生成类,语音生成类,这三类目前均有不同程度的应用:

  1. 图像生成类 : Stable diffusion,Midjourney,DALL·E 2,DeepFloyd IF等;
  2. 文本生成类:Chat GPT,auto-GPT,GPT-4等;
  3. 语音生成类:So-vits-svc 4.0;
    下面就每一类工具,我大概描述一下他们的功能及优势劣势的比较,如有大家有兴趣我会详细讲解。

图像生成类

Stable diffusion

Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。目前已有大神将SD打包为本地可直接使用的工具(绘世 sd-webui),通过这个工具我们可以通过网页可视化,便捷使用文生图,图生图。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
这就是启动界面,只需要输入正向及反向prompt,调整类似图像大小,迭代步数等就可以生成各种不同类型的图像。同时还可以通过加载不同的lora及controlnet等模型来进行微调,生成自己需要的图案。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉

Midjourney

MidJourney 是一个文本到图像的在线服务AI,创始人是David Holz,它可以根据您的文本提示生成华丽的视觉效果。MidJourney 更喜欢用互补的颜色、光影的艺术运用、清晰的细节以及具有令人满意的对称性或透视性的构图来创建图像。

整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉

DALL·E 2

DALL-E 2由OpenAI开发,它通过一段文本描述生成图像。其使用超过100亿个参数训练的GPT-3转化器模型,能够解释自然语言输入并生成相应的图像。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉

三种工具比较

整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
以上比较为个人观点,如有补充会进行修改。

DeepFloyd IF

这个是stability.ai/团队最新作品,据官方介绍,DeepFloyd IF 是最新最先进的开源文本-图像模型,拥有强大的语言理解能力,生成的图像具有高度真实感。从其官网展示了图像来看,DeepFloyd IF 生成的图像质量非常不错,也能处理多种不同的风格效果。能在图像中生成连贯清晰的文本,以及理解不同对象的属性和空间关系。比如它可以正确地将文字呈现在路牌、纸片、包装外壳等规定的媒介内;能理解文本之间的连续关系,将不同的字母或数字按顺序呈现在不同的物体上;以及分清圆球是金属的,三角形是毛茸茸的,不会将不同物体的属性弄混。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉

文本生成

文本生成领域现在chatgpt、autogpt和gpt4目前正在大热。目前针对chat gpt及gpt-4网络上已经有很多相关体验结果及解析,这里对三个gpt模型进行一下对比。
chat GPT和GPT-4均为OpenAI公司开发的自然语言处理模型,gpt4和chatgpt的区别在于gpt4可以处理图像内容,可以更正确的理解信息和处理问题,且回复的准确性提高不少;chatgpt不支持图像内容处理,有时还会出现错误或者矛盾的回答。此外,GPT-4支持图文语义化的解读,以及更好的回答组织能力,而chatgpt则带来了AI对语义理解的突破。
Auto-GPT 的运作方式与 ChatGPT 相同,但增加了运动功能。它将大型语言模型指令链接在一起,以实现指定的结果。该工具具有一定的决策权,可以让AI自我提示。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉

语音生成

So-vits-svc 4.0

B站大佬已经将该算法工具化,类似于sd-webui,通过可视化就可以完成语音训练及推理。
整理一下最近了解到的AIGC工具,AIGC,人工智能,计算机视觉
具体效果大家可以看B站很多AI翻唱,很让人惊艳,后续我会将各个工具的具体用法进行介绍。

结尾

以上是我的一点总结,目前AIGC工具及算法日新月异,发展很快,我总结的一些东西在我下笔的那一刻可能就已经过时了。学无止尽,能亲身经历人工智能的发展,真的是幸事。另外,给自己打个广告,有没有做这个的一起玩儿啊😂。

下面是一些工具链接
Stable diffusion,Midjourney,DALL·E 2,DeepFloyd IF等;
2. 文本生成类:Chat GPT,auto-GPT,GPT-4等;
3. 语音生成类:So-vits-svc 4.0;
[1]: sd-webui :https://github.com/AUTOMATIC1111/stable-diffusion-webui
[2]: Midjourney:https://www.midjourney.com/home/
[3]: DALL·E 2:https://labs.openai.com/
[4]:DeepFloyd IF:https://deepfloyd.ai/deepfloyd-if
[5]:Chat GPT:https://chat.openai.com/
[6]:auto-GPT:https://github.com/Significant-Gravitas/Auto-GPT
[7]:GPT-4:https://openai.com/product/gpt-4
[8]: So-vits-svc 4.0:https://github.com/voicepaw/so-vits-svc-fork/blob/main/README_zh_CN.md文章来源地址https://www.toymoban.com/news/detail-521083.html

到了这里,关于整理一下最近了解到的AIGC工具的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 解读一下最近Midjourney开放的中国版

    最近Midjourney在中国开放测试申请,吸引了众多朋友加入,但也存在许多问题需要解答。因此,我决定撰写一份使用指南,以帮助大家更好地理解与国际版的差异。 接下来,我将分为两个部分进行详细介绍,其中一部分涵盖了免费用户可使用的功能和限制,而一些基础功能也

    2024年02月13日
    浏览(24)
  • 每个AI/ML工程师必须了解的人工智能框架和工具

    每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未

    2024年01月21日
    浏览(22)
  • 最近又考了两个Oracle认证,交一下作业

    从Oracle 10g 开始考Oracle的认证,现在已经有15个Oracle的认证了,最近又考了两个Oracle认证,分别是云和AI的。是现在正时髦的技术,又恰恰是我的短板,以考促学,正好系统地学习这两门知识。这两个证书的培训和考试都是免费的,在网站mylearn.oracle.com上都可以完成。 关于号主

    2024年02月05日
    浏览(20)
  • 精心整理了优秀的GitHub开源项目,包含前端、后端、AI人工智能、游戏、黑客工具、网络工具、AI医疗等等,空闲的时候方便看看提高自己的视野

    精心整理了优秀的GitHub开源项目,包含前端、后端、AI人工智能、游戏、黑客工具、网络工具、AI医疗等等,空闲的时候方便看看提高自己的视野。 刚开源就变成新星的 igl,不仅获得了 2k+ star,也能提高你开发游戏的效率,摆平一切和图形有关的问题。如果这个没有那么惊艳

    2024年02月10日
    浏览(16)
  • 最近台风肆虐,让我们用Python获取天气数据,分析一下台风到底要去哪!

    最近台风肆虐,已进入我国24小时警戒线!台风“卡努”到底要去哪儿? 作为一个Python程序员,虽然我帮不上忙,但是时时关注一下还是可以的,顺便祈祷一下台风往东边某个小日子过得不错的小岛吹。 于是我花了一分钟,用Python写了一个获取天气数据的代码,然后进行数据

    2024年02月14日
    浏览(15)
  • 【面试】Java面试频繁问到的题最新整理(附答案)

    封装 :对象只需要 选择性的对外公开一些属性和行为 。 继承 :子对象 可以继承父对象的属性和行为 ,并且可以在其之上进行修改以适合更特殊的场景需求。 多态 : 允许不同类的对象对同一消息做出响应 。 数据类型 占用字节 byte 1 short 2 int 4 long 8 float 4 double 8 char 2 boo

    2024年02月07日
    浏览(22)
  • 最近读的AIGC相关论文思路解读

    提示:本博客是作者本人最近对AIGC领域相关论文调研后,临时记录所用,所有观点都是来自作者本人局限理解,以及个人思考,不代表对。如果你也正好看过相关文章,发现作者的想法和思路有问题,欢迎评论区留言指正! 既然是论文阅读分享,首先,你需要有一些AIGC基础

    2024年02月10日
    浏览(14)
  • 简单了解下最近正火的SwissTable

    去年看到字节跳动给golang提了issue建议把map的底层实现改成SwissTable的时候,我就有想写这篇博客了,不过因为种种原因一直拖着。 直到最近遇golang官方开始讨论为了是否要接受SwissTable作为map的默认实现,以及实际遇到了一个hashtable有关的问题,促使我重新思考了常见的hash

    2024年02月16日
    浏览(14)
  • 小白最近比较闲,于是整理了一些日常使用的VUE组件

        VUE中,给 Dom 元素动态添加样式。     比如判断通过页面传递过来的值和env文件中配置的值是否一致,来动态添加元素的类,同时类的样式在 Style 中已经写好。  此时动态类名需要在 Dom 元素加载完成前添加上,否则样式可能添加不上。  这种情况下可以在   computed

    2024年02月10日
    浏览(12)
  • 【论文笔记】最近看的时空数据挖掘综述整理8.27

    Deep Learning for Spatio-Temporal Data Mining: A Survey 被引用次数:392 [Submitted on 11 Jun 2019 ( v1 ), last revised 24 Jun 2019 (this version, v2)] 主要内容: 该论文是一篇关于深度学习在时空数据挖掘中的应用的综述。论文首先介绍了时空数据挖掘的背景和意义,然后详细介绍了深度学习在时空数据

    2024年02月11日
    浏览(17)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包