人类忙着卷来卷去的时候,ai已经完成了近几年最大的一次进化了-k8凯发

人类忙着卷来卷去的时候,ai已经完成了近几年最大的一次进化了-k8凯发

来源:it之家
发布时间:2022-10-26 13:47
字体:

很长一段时间,ai这个词变得不那么令人兴奋了。

人类忙着卷来卷去的时候,ai已经完成了近几年最大的一次进化了

人们无法回避,但与此同时,似乎无论是ai的技术演进还是商业应用都遇到了瓶颈人们已经很多年没有经历过alphago的惊艳体验,业界也没有经历过语音助手普及这样的商机甚至很多投资人只有在真的没有新故事的情况下,才不情愿的回头看ai的机会

可是,在全人类都在忙着打滚的2022年,ai正在经历最近几年来最大的进化。

艾的脸突然变红了

日前,因引入稳定扩散文本—图像ai生成模型而大火的人工智能公司stabilityai宣布完成1.01亿美元的种子轮融资,使整个公司估值达到10亿美元,成为所谓的独角兽企业这仅仅是stabilityai成立以来的两年

即使以科技互联网行业的发展标准来看,stabilityai的增长率也是惊人的这个速度是2022年以来全球ai产业爆发式增长的一个缩影此时距离stabilityai的稳定扩散开源模型风靡全球还不到2个月

这种快速发展是一场真正的革命,尤其是在全球经济预期减弱的背景下。

和所有革命一样,这场ai革命也不是一蹴而就的。

人们一直有一个梦想,那就是借助人工智能技术来扩展现有人类智慧,知识和创造力的边界但是人脑复杂的结构带来的学习能力远远超过了人类构建ai的能力,所以ai只能通过各种特定的深度学习模型来突破某些特定领域,比如alphago用来学习围棋,或者通过天文大数据帮助寻找脉冲星候选

aigc,即基于人工智能能力的内容创作,也是重要类别之一在2022年之前,由于核心技术的限制,这个领域一直不温不火,因为ai没有点石成金的魔力,也没有人类凭空创造的能力ai的深度学习训练不是有意识的自我学习,而是ai通过收集大量样本,从海量数据中总结规律,然后根据规律按照人类的指令再现内容的过程还受到核心算法,硬件条件,数据库样本等方面的限制

在2022年之前,aigc领域使用最多的算法模型叫做gan,顾名思义就是让ai内部的两个程序相互比较,从而生成最接近人类心智的正确图像可是,这种算法有一个严重的问题因为节目对比的标准是现成的样本,生成的内容本质上是对已有内容的无限近似,模仿就意味着无法真正突破

沉寂已久的aigc革命火种,瞬间燎原。

绚丽的蓝色海洋

想象一下,在未来的vr/ar虚拟世界中,你脑海中想到的图像,在ai生成技术的帮助下,可以实时渲染出来这将如何颠覆人们娱乐和获取信息的方式

但这并不是在经济环境极度低迷之际,市场投票支持ai的全部原因广泛的商业潜力固然吸引人,但更值得投资的是ai技术本身这场革命还没有结束,它的下一个篇章已经来到人们面前

那就是生成视频。

meta的模型叫做make—a—video,通过学习大量的图文结合的样本数据和没有文字标记的视频,可以理解现实世界中物体的运动逻辑make—a—video可以在构造图像的基础上初步使图像移动,同时具备理解三维物体三维结构的能力

称为imagen video的模型通过称为级联扩散系列模型的方法生成视频即利用基本扩散模型生成分辨率更小的视频,然后利用一系列时空超分辨率模型提高视频的分辨率和帧数

相比较而言,imagen的视频分辨率高于make—a—video,时长也略长。

但是突破并不止于此另一个名为phenaki的人工智能视频生成模型宣布了根据文本内容生成可变长度视频的技术,这意味着phenaki有能力从文本中提取和理解故事情节,并将其转化为视频

在公布的演示中,phenaki基于一系列由数百个前后具有逻辑关系的文字组成的文字说明,生成了一段2分多钟的连续视频这部充满镜头感,剧情和过渡丰富的原型专题片,必然会在未来对整个视频行业产生广泛的影响,包括短视频,电视电影等等

剧变总是伴伴随着争议,以稳定扩散为代表的aigc革命的影像阶段也是如此我们尝试将其归纳为以下几个问题,并给出初步答案

如何界定ai生成内容的k8凯发的版权。

值得一提的是,ai生成技术深度学习训练中使用的很多数据库可能包含侵权内容,但用户生成内容侵权的可能性很低,因为生成的内容本身就充满了高度的随机性和不确定性,即使陷入k8凯发的版权纠纷,举证的过程也会异常艰难。

ai生成的内容有艺术性吗如果有,如何评价和定义

ai生成内容的艺术性在半年前还是一个很无聊的问题,但在歌剧院空间获奖后,人们开始越来越多地谈论它。

一般来说,ai生成的内容不是自己创造的,它受自己的模型算法和数据库样本大小的影响,这也是很多人声称ai生成的内容没有灵魂的原因。

但是,只把ai生成技术看作一个纯粹的工具是不公平的,因为它不仅可以被模仿,而且算法和样本一起提供了一个现有人类无法完全提供的创造性视角。

现有的ai生成图像技术,使得人们参与图像创作的门槛无限低所以对生成作品的艺术欣赏,大概应该从更细分的角度出发就像nft之于传统艺术品,其价值需要接受市场的检验,艺术市场正处于理解和接受它的初级阶段

image: gettyimages关于人工智能生成内容的声明

持技术中立态度的研究人员,如stabilityai,会尽量减少对内容的控制和干预他们认为,一个开放的,充分讨论的社区,会逐渐形成对信息内容传播的监督机制

用户自己负责如何使用这项技术,包括道德和法律合规性stability ai的首席执行官艾玛德·莫斯塔克在一次采访中这样说道

同时,深度学习使用的数据库虽然经过了严格的筛选,屏蔽了色情,暴力,恐怖等内容,但社会刻板印象,种族歧视等内容在技术上并不能完全消除更重要的是,如何定义所谓的偏见,在伦理学上还是一个有争议的问题正因如此,谷歌决定在消除相关风险之前推迟imagen视频模型的公开发布,而许多已发布的模型则选择在其生成的作品中添加不可擦除的水印,以避免潜在的争议

aigc革命正在全面展开不是将来时,是进行时我们已经在里面了

现在就是未来。

13.7k
ad555
- 广告服务 - 加入k8凯发 - 不良信息举报-
市场情报网 k8凯发的版权所有
备案号:
网站地图