绿茶通用站群绿茶通用站群

穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼

穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器人ChatGPT火爆以来,微软公司创始人比(bǐ)尔·盖(gài)茨已多次公开谈论(lùn)人(rén)工智能话题。在(zài)最(zuì)近的一次采访(fǎng)中,他再次表示:“AI可能会让科技行业迎(yíng)来一次剧(jù)烈的(de)洗牌”。

这个结论(lùn)是他在当(dāng)地(dì)时间2月20日接受《In Good Company》节目专访时提出的。

他预期(qī),AI的发展可能会(huì)威(wēi)胁到谷(gǔ)歌的市占率,因为(wèi)微(wēi)软在(zài)AI方(fāng)面(miàn)的行动相(xiāng)当迅速。而最终科技巨(jù)头将把AI整合成用户的“全能(néng)助手”,包揽(lǎn)一切应用,与人们进(jìn)行沟通并提供建(jiàn)议,可以取(qǔ)代亚(yà)马逊(xùn)、Siri或(huò)Outlook等应用。

大佬口中全能助手(shǒu)的到来可能(néng)尚需时(shí)日,但(dàn)由(yóu)ControlNet引发的又一次AI绘画(huà)浪潮,让AIGC在ChatGPT的(de)话题热点包围中杀出重围。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业(yè)?_黑料(liào)正能量(liàng)

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可(kě)控靠(kào)近

以(yǐ)AI绘画为代(dài)表(biǎo)的AIGC上(shàng)一(yī)次爆火的时候,还是2022年8月(yuè),在美国科罗拉多州举办的(de)新兴数字艺术家竞赛(sài)中,一幅名(míng)为《太空歌剧院》的作品(pǐn)获奖。

随后各大(dà)厂商的(de)AI绘画软(ruǎn)件被广大网友熟知并体验,Stable Diffusion便(biàn)是其中代表(biǎo)。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行(xíng)业?_黑料正能量

用户们可(kě)以(yǐ)在应用中输(shū)入一(yī)组关(guān)键词或(huò)者一张照(zhào)片,就能获得(dé)一幅AI创作的画作。

作画的(de)关键就是所输(shū)入(rù)的文本。同一组关键(jiàn)词也可以(yǐ)创(chuàng)作出很(hěn)多张风格不(bù)一样(yàng)的画作,这让创作的(de)过程就像开盲盒。

很多用(yòng)户很喜(xǐ)欢这种不确定的(de)惊喜,他(tā)们会将生成的(de)美(měi)图当做头像(xiàng)。而(ér)另(lìng)一部分喜欢翻看AI绘画(huà)的“翻车”作品。在社交(jiāo)媒体(tǐ)上,许多(duō)用户分享AI“翻车现场”,例如,一(yī)位(wèi)网友(yǒu)的小(xiǎo)狗照片被AI画成(chéng)了“肌肉(ròu)男”,还有网友的个人照片被AI识别成了建筑。

而如今随着(zhe)ControlNet的(de)出(chū)现与加(jiā)持,以(yǐ)往AI绘画的填(tián)写(xiě)关键词游戏可(kě)能要(yào)被(bèi)颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科(kē)技行业(yè)?_黑料正(zhèng)能量

ControlNet是一位正在斯坦福读(dú)博的中国人张(zhāng)吕(lǚ)敏(mǐn)创作的一种基(jī)于控(kòng)制点的图(tú)像(xiàng)变形(xíng)算法,主要(yào)用于数字(zì)图(tú)像(xiàng)处理、计算机(jī)视觉和计算(suàn)机(jī)图形学(xué)等领域。

其SD插件一(yī)经(jīng)发布(bù),在短(duǎn)短的(de)两天内便成为(wèi)了AI绘(huì)画(huà)领域(yù)最新的(de)热点(diǎn)。

在此之前(qián),大家用(yòng)了很(hěn)多(duō)方法想让AI生成(chéng)的结(jié)果尽可能(néng)的符合要求,但是(shì)都不(bù)尽如人意,它的出(chū)现代表着AI生成开始进(jìn)入真正(zhèng)的可控时期。

因为ControlNet可以直接提取画面的构图,人(rén)物的姿(zī)势(shì)和(hé)画(huà)面的深度信息(xī)等。有了它的帮助(zhù),就不用频(pín)繁的(de)用提示词来碰运(yùn)气,抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相(xiāng)当于给AI绘画加了(le)“魔(mó)法”,不少博(bó)主的作(zuò)品已经获得了大量的(de)浏览量,“viggo”就是其中之一(yī),他用朋友(yǒu)的照片直接(jiē)带她们走进动(dòng)漫世界(jiè)。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科技行业?_黑料正能(néng)量

viggo先(xiān)用StableDiffusion图片转文字。

再用Text2Prompt插件(jiàn)拓展(zhǎn)找到(dào)对(duì)应的关键词(cí);最后用ControlNet插(chā)件绑定骨(gǔ)骼(gé)开始换(huàn)关键(jiàn)词(cí)试效果。

ChatGPT之后又(yòu)一(yī)应用杀疯了(le),AIGC或进入(rù)可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

通过图(tú)片就可以(yǐ)看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正能(néng)量

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能(néng)量(liàng)

更厉(lì)害(hài)的是,除了真实的照片,草图也可以加上“魔(mó)法”,知乎(hū)大牛“DevPoint”和“逗砂(shā)”介绍到ControlNet还(hái)能实现线稿转全彩(cǎi)图。大神张吕敏(mǐn)其(qí)本尊也亲自回(huí)应(yīng)。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能(néng)量

不得不说当下AIGC已经变得越来越强大,甚至(zhì)输出(chū)的作品都已(yǐ)经能以假乱(luàn)真(zhēn)了。

02

难辨虚实(shí),AIGC技术(shù)力(lì)爆发

警惕安全问(wèn)题

近日,“苏州(zhōu)金鸡湖有游艇party”的消(xiāo)息火遍网(wǎng)络,而经过警方辟谣(yáo)这所谓(wèi)的“party”可能是全国第一起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面(miàn)给出(chū)的美女照片都(dōu)是AI制作的真人照片绘图(tú),因为太逼真,被大家当成真(zhēn)事传播了

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能(néng)量

不过(guò)仔细(xì)观(guān)察可以发(fā)现,活动(dòng)发起者(zhě)提(tí)供(gōng)的照片中有个很(hěn)大的漏洞可以发现并非真人,而是AI绘图(tú),那便是图片中女(nǚ)性的手指部(bù)分有的存在(zài)异常。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑料正能量

有行业人(rén)事表示:“现在因为手指部分的(de)绘画(huà)算法比较复杂,AI还不太会画人(rén)的手,但(dàn)最新看到的图(tú)片已经有(yǒu)越来(lái)越完美的AI模型出现,以后可能(néng)就完(wán)全没(méi)有漏洞了。

类似的AI作图诈骗在国(guó)外也已有(yǒu)发生。据英国广(guǎng)播公司(sī)报道,土(tǔ)耳其(qí)地震期(qī)间,有Tiktok用户(hù)使用AI合成了(le)儿(ér)童受灾的(de)假照片(piàn)发布到网络(luò),以此诱(yòu)骗(piàn)善良的(de)人(rén)打赏“捐助”从而实施诈骗(piàn)。

目(mù)前随着技(jì)术发展,AIGC已(yǐ)经能做出真人照片般的绘图效(xiào)果,如果这样的图片被用来诈骗,将(jiāng)非常可怕(pà)。

此外(wài)AIGC还(hái)引发(穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼fā)了很多担忧,一方面,批判(pàn)者认为AI在“学习(xí)”了大量(liàng)前人(rén)的作品(pǐn)之后,其创(chuàng)作(zuò)没有任何情绪和(hé)灵魂,难以(yǐ)和人类(lèi)的(de)艺术创作(zuò)相提并论(lùn)。

另(lìng)一方面,AIGC背(bèi)后的版权、目前都并没有得到有效的解(jiě)决(jué),还(hái)有AIGC会不会代替(tì)人类“至高无上”的创意。

马斯(sī)克也强调,人工(gōng)智能的安全问题需要得到重视,太晚就来不及了。

03

AIGC下一站除了视(shì)频,还有(yǒu)远(yuǎn)方

技术都是有两面性的,潜(qián)在(zài)的危害(hài)并(bìng)不能掩(yǎn)盖其(qí)光(guāng)辉的贡献。现在看来,人(rén)工智能(néng)技术将是(shì)第四次工业革(gé)命的(de)核心驱动力量(liàng),将创造新的(de)增长(zhǎng)奇迹。

过(guò)去一年(nián),人工智能在技术和商(shāng)业(yè)层面都有了巨大进展,AI绘画(huà)就是人(rén)工智能技术发生方向性(xìng)改变的一个代表(biǎo)。其下一站或(huò)许(xǔ)就是视频(pín)。

此前,Meta和谷歌先后发布了几条(tiáo)引爆科技圈的短视频。这些视(shì)频引发(fā)关注并非内(nèi)容做得多优(yōu)秀,反而都非常简(jiǎn)单,比如一匹正在喝水(shuǐ)的马,一只(zhǐ)画画的玩具熊,或者一段(duàn)骑(qí)摩托(tuō)车(chē)的(de)第一视角录像(xiàng),随便一个(gè)有手机的人(rén)都可以(yǐ)随手(shǒu)录(lù)下一段。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期(qī),将洗(xǐ)牌科技行(xíng)业?_黑(hēi)料正能量(liàng)

但这(zhè)些短(duǎn)视频的创作方式非常简单,创作(zuò)者仅仅需要向AI输入一段(duàn)话,甚(shèn)至只是说一下要求,AI就可以根据需要生(shēng)成一段视频。

谷歌发布(bù)的两个AI生(shēng)成(chéng)视频分别来自(zì)于Imagen Video和(hé)Phenaki,前者主要(yào)突出的是(shì)高清(qīng),与Meta的Make-A-Video没有(yǒu)太多的差别(bié)。

在Make-A-Video公(gōng)布了(le)AI生成的视(shì)频后,AI圈就已经玩(wán)了一波梗(gěng),一个能够做出更高清视频的AI还不足以(yǐ)在短(duǎn)时间内戳中(zhōng)兴奋点。

Phenaki更加令(lìng)人(rén)震惊的地(dì)方在(zài)于,它可以制作出超过2分钟的连贯的(de)也有确切内容的视频,这才(cái)是(shì)真(zhēn)正让(ràng)人们感到惊(jīng)喜的(de)地(dì)方。因为无论AI生成的视频(pín)多(duō)么(me)高清,也(yě)只能是(shì)为内容(róng)生产者提供一个灵(líng)感(gǎn),一个(gè)素(sù)材,一个过场动画(huà)。

不(bù)过(guò)能(néng)够制作出有(yǒu)具(jù)体剧(jù)情内容(róng)的视频就(jiù)意味(wèi)着,一(yī)些视频创作(zuò)由AI代(dài)替人工完成已经初步有了(le)可(kě)能。

当下AI的发展速度(dù)已(yǐ)经超过大(dà)部分人的想象。内(nèi)容产(chǎn)业的本质(zhì)是(shì)供(gōng)给创(chuàng)造需(xū)求(qiú),AIGC作(zuò)为全(quán)新的内容生(shēng)产方式,可以为内容产业带来更新的内容(róng)风格、更快(kuài)的生产(chǎn)速度(dù),更低的生产成(chéng)本,这无(wú)疑会(huì)驱动内容产业的(de)大爆发。

除了AI绘图、视(shì)频,AIGC技术还能应(yīng)用于音乐、代码、机器人动(dòng)作(zuò)等多种(zhǒng)内(nèi)容形式的(de)生成。不难(nán)发(fā)现(xiàn)该项(xiàng)技术不(bù)仅在游(yóu)戏(xì)等行(xíng)业(yè)能得到有效应用,对于下一(yī)代互(hù)联网(wǎng)各种(zhǒng)元素(sù)的构建亦有关(guān)键意(yì)义。

从商业化的角度来看,文化娱乐、教育、传媒等诸(zhū)多领(lǐng)域(yù),本身就对基于AI的(de)可(kě)视(shì)化(huà)内容有(yǒu)强烈需求。

因此,AI绘画(huà)及(jí)视频或不(bù)是结(jié)果,而只是(shì)AI进程中(zhōng)的一块重要拼图,有望在技术更新(xīn)的加持下(xià)实现更大的应用价值。

AI从理(lǐ)解(jiě)内容,走向了可以(yǐ)生成内容(róng),甚至(zhì)能够(gòu)创造出独立(lì)价值和独立视角(jiǎo)的内容。AIGC的再次出圈,更(gèng)代表着(zhe)未(wèi)来穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼的先进生产力即将到来。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料正能量

04

紧抓大模型(xíng)与算力,牢固AIGC底座(zuò)

从技术的(de)发展(zhǎn)也(yě)可(kě)以(yǐ)看(kàn)出,在语言(yán)大模型(xíng)、图(tú)像大(dà)模型之后,多模态大(dà)模型已(yǐ)经成为了新的趋势。

大模型被(bèi)誉为当前人(rén)工智能发展的智能底(dǐ)座,是全球竞争最(zuì)激烈的研究(jiū)方向之一,包括谷歌、亚马逊、百度、阿里、腾讯等(děng)众(zhòng)多头部企业都在竞相发力。

不过训(xùn)练大(dà)模型的确价(jià)格不菲,以(yǐ)国盛(shèng)证券发布(bù)的《ChatGPT需(xū)要多少(shǎo)算力》报告估算,GPT-3训练一次的成本(běn)约为(wèi)140万美元。而(ér)对(duì)于(yú)一些(xiē)更大的LLM(大型语言模(mó)型(xíng)),训(xùn)练成本则介于200万美元至1200万美元高价之间(jiān)。

以ChatGPT在2023年1月的独立访客(kè)平均数1300万计算,其(qí)对应芯片需求(qiú)为3万(wàn)多(duō)片英伟达A100 GPU,初(chū)始投入成本约为8亿美元,每日仅电费就在(zài)5万美元左右。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料(liào)正能量(liàng)

此外不论是ChatGPT还是AIGC,都离(lí)不开庞(páng)大算力支持(chí)。在(zài)关(guān)注各(gè)类大(dà)模型的发展同时(shí),更应(yīng)该关注算(suàn)力网络的建设。

算(suàn)力网络正驱动AI产业(yè)发展进入(rù)史诗级加速(sù)进(jìn)程,让(ràng)AIGC及(jí)通用AI这一人工智能发展(zhǎn)的(de)终极目标离得更近(jìn)。

因为算力可以(yǐ)对突(tū)破性(xìng)技术创新提(tí)供大(dà)力(lì)的支持(chí)。这(zhè)方面(miàn),多模态大模型是典型。作为面向未(wèi)来强人工智能(néng)、通(tōng)用人工智能的重要技术(shù)创新,多模(mó)态大模(mó)型已经在(zài)人(rén)工(gōng)智能领域(yù)提出了(le)很多年,业界(jiè)也有不少(shǎo)技术突破,但(dàn)是,多模态大模型(xíng)进一步(bù)往下(xià)走(zǒu),算力需(xū)求呈几何式上升,一般的算力基础设施(shī)很快将(jiāng)难以胜任(rèn)。

从图像、文字、语音(yīn)单独一项的训(xùn)练(liàn),到双模态、三模(mó)态的跃迁(qiān),让人工智(zhì)能可(kě)以灵活应对不同(tóng)模态的转化(huà)、像人与世界交互(hù)一样自然,这方面(miàn),由算力网(wǎng)络来驱动(dòng)将有明显优势。

ChatGPT之后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑(hēi)料正能量

此外,还有很多(duō)需(xū)要爆发式增长(zhǎng)的算力来(lái)支撑的技术创(chuàng)新,将在(zài)人工智(zhì)能算力网络支撑下快速推进。

AIGC已经露出曙光,期待在大(dà)模型和大算力的支持下AIGC能持续(xù)颠覆内容(róng)生产的方式(shì),将(jiāng)创造的边(biān)际成本降低,让万众(zhòng)受益。

未经允许不得转载:绿茶通用站群 穿着高跟鞋的女奥特曼,穿红色高跟鞋的奥特曼

评论

5+2=